kj的学习笔记  
  • 前言
    • 内容组成
    • 个人简介
  • I 专项
  • 1 R Markdown
    • 1.1 安装与创建
    • 1.2 初识RMD
    • 1.3 语法介绍
      • 1.3.1 标题
      • 1.3.2 字体样式
      • 1.3.3 换行
      • 1.3.4 链接
      • 1.3.5 引用
      • 1.3.6 列表
      • 1.3.7 代码
      • 1.3.8 表格
      • 1.3.9 图片
      • 1.3.10 数学公式
    • 1.4 文档元素
      • 1.4.1 分割线
      • 1.4.2 转义符
      • 1.4.3 分页符
      • 1.4.4 设置动态标题
      • 1.4.5 自动更新时间
      • 1.4.6 获取元数据信息
      • 1.4.7 参考文献
      • 1.4.8 交叉引用
      • 1.4.9 多位作者
      • 1.4.10 将模型输出为公式
      • 1.4.11 流程图
      • 1.4.12 注释
      • 1.4.13 缩进
      • 1.4.14 字体颜色
    • 1.5 HTML文档
      • 1.5.1 标签
      • 1.5.2 目录
      • 1.5.3 外观
      • 1.5.4 选项卡
      • 1.5.5 表格
      • 1.5.6 代码块及其输出
      • 1.5.7 添加HTML文件
      • 1.5.8 Pandoc参数
      • 1.5.9 共享选项
      • 1.5.10 下载文件
    • 1.6 PDF文档
      • 1.6.1 中文文档
      • 1.6.2 目录
      • 1.6.3 图与表
      • 1.6.4 语法高亮
  • 2 Manim
    • 2.1 安装与创建
    • 2.2 初识Manim
    • 2.3 输出设置
      • 2.3.1 输出文件夹
      • 2.3.2 片段
      • 2.3.3 命令行标志
    • 2.4 配置
      • 2.4.1 命令行参数
      • 2.4.2 ManimConfig类
      • 2.4.3 配置文件
    • 2.5 文本
      • 2.5.1 Text
      • 2.5.2 MarkupText
      • 2.5.3 Paragraph
      • 2.5.4 Tex
      • 2.5.5 MathTex
      • 2.5.6 Title
      • 2.5.7 BulletedList
    • 2.6 内置颜色
    • 2.7 物体的位置与移动
    • 2.8 动画
    • 2.9 镜头视角
    • 2.10 存储对象
    • 2.11 成品
  • 3 SQL
    • 3.1 R连接MySQL
    • 3.2 MySQL必知必会
      • 3.2.1 提要
      • 3.2.2 选择数据库与表
      • 3.2.3 检索数据
      • 3.2.4 排序检索数据
      • 3.2.5 过滤数据
      • 3.2.6 计算字段
      • 3.2.7 函数
      • 3.2.8 汇总数据
      • 3.2.9 数据分组
      • 3.2.10 子查询
      • 3.2.11 表联结
      • 3.2.12 组合查询
      • 3.2.13 全文本搜索
      • 3.2.14 插入数据
      • 3.2.15 更新数据
      • 3.2.16 表的操作
      • 3.2.17 使用视图
      • 3.2.18 使用存储过程
      • 3.2.19 触发器
      • 3.2.20 事务处理
  • 4 爬虫
    • 4.1 提要
  • II 模型与方法
  • 5 应用回归分析
    • 5.1 引言
      • 5.1.1 变量间的相关关系
      • 5.1.2 回归模型的一般形式
    • 5.2 假定
    • 5.3 线性回归模型
      • 5.3.1 一元线性回归模型
      • 5.3.2 多元线性回归模型
    • 5.4 参数估计
      • 5.4.1 最小二乘估计
      • 5.4.2 极大似然估计
      • 5.4.3 矩估计
      • 5.4.4 几何视角
    • 5.5 最小二乘估计的性质
      • 5.5.1 线性
      • 5.5.2 无偏性
      • 5.5.3 有效性
      • 5.5.4 方差
      • 5.5.5 正态性
      • 5.5.6 残差
    • 5.6 显著性检验
      • 5.6.1 区间估计
      • 5.6.2 t检验
      • 5.6.3 F检验
      • 5.6.4 偏F检验
      • 5.6.5 样本决定系数
    • 5.7 预测
      • 5.7.1 预测因变量新值的均值
      • 5.7.2 预测因变量的新值
    • 5.8 回归系数的解释
    • 5.9 中心化与标准化
      • 5.9.1 中心化
      • 5.9.2 标准化
    • 5.10 相关系数与偏相关系数
      • 5.10.1 样本相关系数
      • 5.10.2 样本偏相关系数
    • 5.11 重要的定义和等式
    • 5.12 回归诊断
      • 5.12.1 残差分析
      • 5.12.2 异常点和强影响点
      • 5.12.3 异方差
      • 5.12.4 自相关
      • 5.12.5 多重共线性
    • 5.13 变量选择与正则化
      • 5.13.1 冗余与遗漏
      • 5.13.2 变量选择的传统方法
      • 5.13.3 变量选择的正则化方法
  • 6 应用多元统计
    • 6.1 矩阵运算
      • 6.1.1 Kronecker积
      • 6.1.2 拉直
      • 6.1.3 减号逆与加号逆
      • 6.1.4 分块矩阵
    • 6.2 多元正态分布
      • 6.2.1 多元分布的基本运算性质
      • 6.2.2 多元正态分布的定义
      • 6.2.3 正态分布的条件分布和独立性
      • 6.2.4 偏相关系数与全相关系数
    • 6.3 主成分分析
      • 6.3.1 总体主成分
      • 6.3.2 样本主成分
      • 6.3.3 关于主成分
    • 6.4 因子分析
      • 6.4.1 正交因子模型
      • 6.4.2 参数估计
      • 6.4.3 因子旋转
      • 6.4.4 因子得分
      • 6.4.5 因子分析和主成分分析的区别与联系
    • 6.5 判别分析
      • 6.5.1 距离判别
      • 6.5.2 贝叶斯判别
    • 6.6 聚类分析
      • 6.6.1 距离与相似性的度量
      • 6.6.2 系统聚类
      • 6.6.3 Kmeans
    • 6.7 典型相关分析
  • 7 模型
    • 7.1 基础知识
      • 7.1.1 偏差-方差权衡
      • 7.1.2 评价指标
    • 7.2 决策树
      • 7.2.1 分类树
      • 7.2.2 回归树
      • 7.2.3 实现
    • 7.3 随机森林
      • 7.3.1 实现
    • 7.4 XGBoost
      • 7.4.1 原理
      • 7.4.2 实现
    • 7.5 因果森林
      • 7.5.1 原理
      • 7.5.2 实现
    • 7.6 ABtest
    • 7.7 贝叶斯方法
      • 7.7.1 贝叶斯判别法
      • 7.7.2 朴素贝叶斯分类器
  • 8 生存分析
    • 8.1 基本概念
      • 8.1.1 删失数据
      • 8.1.2 截断数据
      • 8.1.3 函数
      • 8.1.4 似然函数
    • 8.2 参数估计
      • 8.2.1 KM估计
      • 8.2.2 NA估计
    • 8.3 置信区间与置信带
      • 8.3.1 置信区间
      • 8.3.2 置信带
      • 8.3.3 平均生存时间的置信区间
      • 8.3.4 分位数的置信区间
      • 8.3.5 左截断数据的置信区间
    • 8.4 假设检验
      • 8.4.1 单样本检验
      • 8.4.2 多样本检验
      • 8.4.3 趋势性检验
      • 8.4.4 分层检验
    • 8.5 Cox比例风险模型
      • 8.5.1 偏对数似然函数
      • 8.5.2 Regularization Paths for Cox’s Proportional Hazards Model via Coordinate Descent
  • III 多源数据分析
  • 9 网络型数据
    • 9.1 构造联系
      • 9.1.1 引力模型
      • 9.1.2 社会网络量表
    • 9.2 网络结构特征
    • 9.3 拓展分析
      • 9.3.1 凝聚子群
      • 9.3.2 社区发现
      • 9.3.3 核心-边缘分析
      • 9.3.4 QAP分析
      • 9.3.5 计量模型
      • 9.3.6 综合评价
    • 9.4 其他启示
  • IV 可视化
  • 10 Manim动画
    • 10.1 最小二乘与投影矩阵
  • 11 七普数据可视化
    • 11.1 数据来源及说明
    • 11.2 全国人口状况
      • 11.2.1 人口自然增长率
      • 11.2.2 年龄结构
      • 11.2.3 人口流动
  • V 组会论文
  • 12 变量选择与惩罚函数
    • 12.1 准备
      • 12.1.1 范数
      • 12.1.2 目标函数
    • 12.2 单变量选择
      • 12.2.1 Lasso
      • 12.2.2 Hard & Soft Threshold
      • 12.2.3 SCAD
      • 12.2.4 Adaptive Lasso
    • 12.3 群组变量选择
      • 12.3.1 思维导图
      • 12.3.2 处理高度相关数据的组变量选择方法
      • 12.3.3 仅能选择组变量的方法
      • 12.3.4 双层变量选择方法
    • 12.4 算法
    • 12.5 总结
  • 13 整合分析
    • 13.1 引言
    • 13.2 模型基本形式
    • 13.3 同构数据的整合分析
    • 13.4 异构数据的整合分析
    • 13.5 具有网络结构关系的整合分析
  • VI 算法复现
  • 14 算法复现
    • 14.1 惩罚Cox比例风险模型
    • 14.2 异质截距项的线性模型
      • 14.2.1 自定义算法
      • 14.2.2 数据模拟
    • 14.3 (异质)线性+非线性的Cox比例风险模型
      • 14.3.1 自定义算法
      • 14.3.2 数据模拟
  • VII 生活
  • 15 羽毛球修炼手册
    • 15.1 发球
      • 15.1.1 正手发球
      • 15.1.2 反手发球
  • 参考文献

kj的学习笔记

2.11 成品

  1. 最小二乘与投影矩阵