13.3 同构数据的整合分析
在同构数据中,常见于调查问卷相同、实验设计相同等数据收集方式一致的情形中,自变量在\(M\)个数据集中的显著性是一致的,即若\(X_j\)在数据集\(m\)中显著,则它在所有数据集中都显著。鉴于此,可以将\(\beta_j\)视作一个群组并采取组变量的选择方法进行筛选。
- L2 Group Bridge
\(L_2 \; Group \; Bridge\)为组内\(L_2\)惩罚,组间\(Bridge\)惩罚,其惩罚函数为
\[ P(\beta;\lambda,\gamma)=\lambda\sum_{j=1}^p ||\beta_j||^\gamma=\lambda\sum_{j=1}^p((\sum_{i=1}^M (\beta_j^{(i)})^2)^{1/2})^\gamma \tag{13.3} \]
若以\(Group \; Lasso\)估计作为初始值进行迭代估计,可以证明\(L_2 \; Group \; Bridge\)满足选择一致性。
- L2 Group MCP
\(L_2 \; Group \; MCP\)组内为\(L_2\)惩罚,组间为\(MCP\)惩罚,其惩罚函数为
\[ P(\beta;\lambda,a)=\sum_{j=1}^p P_{MCP}(||\beta_j||;\lambda,a) \tag{13.4} \]
关于\(MCP\)函数的介绍可以参见Mnet。
- Group Lasso
\(Group \; Lasso\)组内和组间都是\(L_1\)惩罚,其惩罚函数形式为
\[ P(\beta;\lambda)=\lambda\sum_{j=1}^p ||\beta_j|| \tag{13.5} \]