5.2 假定

  1. 零均值:\(E(\varepsilon)=0\)
  2. 同方差:\(Var(\varepsilon)=\sigma^2\)
  3. 无自相关:\(Cov(\varepsilon_i,\varepsilon_j)=0\)
  4. 无内生性:\(Cov(X_i,\varepsilon)=0\)
  5. 随机扰动项\(\varepsilon\)服从正态分布
  6. 自变量为非随机变量,且无多重共线性
  7. 模型是正确设定的,具有线性关系

其中第1、2、3条为Gauss-Markov条件

1~5条和后续的内容有关,留到后面再讲。

第6条,为什么自变量为非随机变量?我们的目标是探讨自变量与因变量之间的因果关系。在线性模型中,我们已经在因变量的生成过程中引入随机扰动项来代表随机因素的影响。如果再把生成自变量的过程也引入随机因素,则不好把握自变量与因变量之间的因果关系。在实际应用中,我们往往关注在给定自变量的时候,因变量是如何变化的。通过假设自变量为非随机变量,可以简化模型,使得数学推导和计算更加简洁。如果解释变量是随机的,那么模型的推断将变得非常复杂,因为需要考虑解释变量的概率分布,这将大大增加分析的难度。同时,若自变量为随机变量则可能会有内生性问题。

第7条,如果真实模型不具有线性关系,那么我们的模型设定就是有偏误的(做此假定只是为了让自己用得放心,谁又能知道真实模型是什么样子的呢)。