17.3 同构数据的整合分析

在同构数据中，常见于调查问卷相同、实验设计相同等数据收集方式一致的情形中，自变量在\(M\)个数据集中的显著性是一致的，即若\(X_j\)在数据集\(m\)中显著，则它在所有数据集中都显著。鉴于此，可以将\(\beta_j\)视作一个群组并采取组变量的选择方法进行筛选。

\(L_2 \; Group \; Bridge\)为组内\(L_2\)惩罚，组间\(Bridge\)惩罚，其惩罚函数为

\[ P(\beta;\lambda,\gamma)=\lambda\sum_{j=1}^p ||\beta_j||^\gamma=\lambda\sum_{j=1}^p((\sum_{i=1}^M (\beta_j^{(i)})^2)^{1/2})^\gamma \tag{17.3} \]

若以\(Group \; Lasso\)估计作为初始值进行迭代估计，可以证明\(L_2 \; Group \; Bridge\)满足选择一致性。

\(L_2 \; Group \; MCP\)组内为\(L_2\)惩罚，组间为\(MCP\)惩罚，其惩罚函数为

\[ P(\beta;\lambda,a)=\sum_{j=1}^p P_{MCP}(||\beta_j||;\lambda,a) \tag{17.4} \]

关于\(MCP\)函数的介绍可以参见Mnet。

\(Group \; Lasso\)组内和组间都是\(L_1\)惩罚，其惩罚函数形式为

\[ P(\beta;\lambda)=\lambda\sum_{j=1}^p ||\beta_j|| \tag{17.5} \]