5.1 引言

5.1.1 变量间的相关关系

  • 函数关系:变量间存在的确定性数量对应关系

    \[ y=f(x_1, ..., x_p) \]

  • 相关关系:变量间客观存在的非确定性数量对应关系

    \[ y=f(x_1, ..., x_p, \varepsilon) \]


  • 相关分析

    用相关系数描述变量间相关关系的强度。以变量之间是否相 关、相关的方向和密切程度等为研究内容,不区分自变量和因变量,不 关心相关关系的表现形态。

  • 回归分析

    对具有相关关系的变量,根据其相关关系的具体形态,选择 合适的回归模型描述自变量对因变量的影响方式。

相关分析与回归分析的联系

相关分析是回归分析的前提;回归分析是对因果关系(说是这么说,但不能忽视“伪回归”现象)的探讨

相关分析和回归分析的区别

X与Y的地位是否平等;有无因果关系;相关分析揭示线性相关程度,回归分析给出具体的回归方程。

5.1.2 回归模型的一般形式

\[ y=f(x_1, ..., x_p, \varepsilon) \]

其中y为因变量(响应变量、被解释变量),x为自变量(预测变量、解释变量),\(\varepsilon\)为模型误差(随机扰动项)。

\(\varepsilon\)包含的内容:

  • 被忽略的解释变量
  • 变量数值的观测误差
  • 模型设定误差
  • 其他随机因素的影响