kj的学习笔记
前言
内容组成
个人简介
I 专项
1
R Markdown
1.1
安装与创建
1.2
初识RMD
1.3
语法介绍
1.3.1
标题
1.3.2
字体样式
1.3.3
换行
1.3.4
链接
1.3.5
引用
1.3.6
列表
1.3.7
代码
1.3.8
表格
1.3.9
图片
1.3.10
数学公式
1.4
文档元素
1.4.1
分割线
1.4.2
转义符
1.4.3
分页符
1.4.4
设置动态标题
1.4.5
自动更新时间
1.4.6
获取元数据信息
1.4.7
参考文献
1.4.8
交叉引用
1.4.9
多位作者
1.4.10
将模型输出为公式
1.4.11
流程图
1.4.12
注释
1.4.13
缩进
1.4.14
字体颜色
1.5
HTML文档
1.5.1
标签
1.5.2
目录
1.5.3
外观
1.5.4
选项卡
1.5.5
表格
1.5.6
代码块及其输出
1.5.7
添加HTML文件
1.5.8
Pandoc参数
1.5.9
共享选项
1.5.10
下载文件
1.6
PDF文档
1.6.1
中文文档
1.6.2
目录
1.6.3
图与表
1.6.4
语法高亮
2
Manim
2.1
安装与创建
2.2
初识Manim
2.3
输出设置
2.3.1
输出文件夹
2.3.2
片段
2.3.3
命令行标志
2.4
配置
2.4.1
命令行参数
2.4.2
ManimConfig类
2.4.3
配置文件
2.5
文本
2.5.1
Text
2.5.2
MarkupText
2.5.3
Paragraph
2.5.4
Tex
2.5.5
MathTex
2.5.6
Title
2.5.7
BulletedList
2.6
内置颜色
2.7
物体的位置与移动
2.8
动画
2.9
镜头视角
2.10
存储对象
2.11
成品
3
SQL
3.1
R连接MySQL
3.2
MySQL必知必会
3.2.1
提要
3.2.2
选择数据库与表
3.2.3
检索数据
3.2.4
排序检索数据
3.2.5
过滤数据
3.2.6
计算字段
3.2.7
函数
3.2.8
汇总数据
3.2.9
数据分组
3.2.10
子查询
3.2.11
表联结
3.2.12
组合查询
3.2.13
全文本搜索
3.2.14
插入数据
3.2.15
更新数据
3.2.16
表的操作
3.2.17
使用视图
3.2.18
使用存储过程
3.2.19
触发器
3.2.20
事务处理
4
爬虫
4.1
提要
II 模型与方法
5
应用回归分析
5.1
引言
5.1.1
变量间的相关关系
5.1.2
回归模型的一般形式
5.2
假定
5.3
线性回归模型
5.3.1
一元线性回归模型
5.3.2
多元线性回归模型
5.4
参数估计
5.4.1
最小二乘估计
5.4.2
极大似然估计
5.4.3
矩估计
5.4.4
几何视角
5.5
最小二乘估计的性质
5.5.1
线性
5.5.2
无偏性
5.5.3
有效性
5.5.4
方差
5.5.5
正态性
5.5.6
残差
5.6
显著性检验
5.6.1
区间估计
5.6.2
t检验
5.6.3
F检验
5.6.4
偏F检验
5.6.5
样本决定系数
5.7
预测
5.7.1
预测因变量新值的均值
5.7.2
预测因变量的新值
5.8
回归系数的解释
5.9
中心化与标准化
5.9.1
中心化
5.9.2
标准化
5.10
相关系数与偏相关系数
5.10.1
样本相关系数
5.10.2
样本偏相关系数
5.11
重要的定义和等式
5.12
回归诊断
5.12.1
残差分析
5.12.2
异常点和强影响点
5.12.3
异方差
5.12.4
自相关
5.12.5
多重共线性
5.13
变量选择与正则化
5.13.1
冗余与遗漏
5.13.2
变量选择的传统方法
5.13.3
变量选择的正则化方法
6
应用多元统计
6.1
矩阵运算
6.1.1
Kronecker积
6.1.2
拉直
6.1.3
减号逆与加号逆
6.1.4
分块矩阵
6.2
多元正态分布
6.2.1
多元分布的基本运算性质
6.2.2
多元正态分布的定义
6.2.3
正态分布的条件分布和独立性
6.2.4
偏相关系数与全相关系数
6.3
主成分分析
6.3.1
总体主成分
6.3.2
样本主成分
6.3.3
关于主成分
6.4
因子分析
6.4.1
正交因子模型
6.4.2
参数估计
6.4.3
因子旋转
6.4.4
因子得分
6.4.5
因子分析和主成分分析的区别与联系
6.5
判别分析
6.5.1
距离判别
6.5.2
贝叶斯判别
6.6
聚类分析
6.6.1
距离与相似性的度量
6.6.2
系统聚类
6.6.3
Kmeans
6.7
典型相关分析
7
模型
7.1
基础知识
7.1.1
偏差-方差权衡
7.1.2
评价指标
7.2
决策树
7.2.1
分类树
7.2.2
回归树
7.2.3
实现
7.3
随机森林
7.3.1
实现
7.4
XGBoost
7.4.1
原理
7.4.2
实现
7.5
因果森林
7.5.1
原理
7.5.2
实现
7.6
ABtest
7.7
贝叶斯方法
7.7.1
贝叶斯判别法
7.7.2
朴素贝叶斯分类器
8
生存分析
8.1
基本概念
8.1.1
删失数据
8.1.2
截断数据
8.1.3
函数
8.1.4
似然函数
8.2
参数估计
8.2.1
KM估计
8.2.2
NA估计
8.3
置信区间与置信带
8.3.1
置信区间
8.3.2
置信带
8.3.3
平均生存时间的置信区间
8.3.4
分位数的置信区间
8.3.5
左截断数据的置信区间
8.4
假设检验
8.4.1
单样本检验
8.4.2
多样本检验
8.4.3
趋势性检验
8.4.4
分层检验
8.5
Cox比例风险模型
8.5.1
偏对数似然函数
8.5.2
Regularization Paths for Cox’s Proportional Hazards Model via Coordinate Descent
III 多源数据分析
9
网络型数据
9.1
构造联系
9.1.1
引力模型
9.1.2
社会网络量表
9.2
网络结构特征
9.3
拓展分析
9.3.1
凝聚子群
9.3.2
社区发现
9.3.3
核心-边缘分析
9.3.4
QAP分析
9.3.5
计量模型
9.3.6
综合评价
9.4
其他启示
IV 可视化
10
Manim动画
10.1
最小二乘与投影矩阵
11
七普数据可视化
11.1
数据来源及说明
11.2
全国人口状况
11.2.1
人口自然增长率
11.2.2
年龄结构
11.2.3
人口流动
V 组会论文
12
变量选择与惩罚函数
12.1
准备
12.1.1
范数
12.1.2
目标函数
12.2
单变量选择
12.2.1
Lasso
12.2.2
Hard & Soft Threshold
12.2.3
SCAD
12.2.4
Adaptive Lasso
12.3
群组变量选择
12.3.1
思维导图
12.3.2
处理高度相关数据的组变量选择方法
12.3.3
仅能选择组变量的方法
12.3.4
双层变量选择方法
12.4
算法
12.5
总结
13
整合分析
13.1
引言
13.2
模型基本形式
13.3
同构数据的整合分析
13.4
异构数据的整合分析
13.5
具有网络结构关系的整合分析
VI 算法复现
14
算法复现
14.1
惩罚Cox比例风险模型
14.2
异质截距项的线性模型
14.2.1
自定义算法
14.2.2
数据模拟
14.3
(异质)线性+非线性的Cox比例风险模型
14.3.1
自定义算法
14.3.2
数据模拟
VII 生活
15
羽毛球修炼手册
15.1
发球
15.1.1
正手发球
15.1.2
反手发球
参考文献
kj的学习笔记
2.10
存储对象
Group()
VGroup()
self.mobjects