13.3 同构数据的整合分析

在同构数据中,常见于调查问卷相同、实验设计相同等数据收集方式一致的情形中,自变量在\(M\)个数据集中的显著性是一致的,即\(X_j\)在数据集\(m\)中显著,则它在所有数据集中都显著。鉴于此,可以将\(\beta_j\)视作一个群组并采取组变量的选择方法进行筛选。

  1. L2 Group Bridge

\(L_2 \; Group \; Bridge\)为组内\(L_2\)惩罚,组间\(Bridge\)惩罚,其惩罚函数为

\[ P(\beta;\lambda,\gamma)=\lambda\sum_{j=1}^p ||\beta_j||^\gamma=\lambda\sum_{j=1}^p((\sum_{i=1}^M (\beta_j^{(i)})^2)^{1/2})^\gamma \tag{13.3} \]

若以\(Group \; Lasso\)估计作为初始值进行迭代估计,可以证明\(L_2 \; Group \; Bridge\)满足选择一致性

  1. L2 Group MCP

\(L_2 \; Group \; MCP\)组内为\(L_2\)惩罚,组间为\(MCP\)惩罚,其惩罚函数为

\[ P(\beta;\lambda,a)=\sum_{j=1}^p P_{MCP}(||\beta_j||;\lambda,a) \tag{13.4} \]

关于\(MCP\)函数的介绍可以参见Mnet

  1. Group Lasso

\(Group \; Lasso\)组内和组间都是\(L_1\)惩罚,其惩罚函数形式为

\[ P(\beta;\lambda)=\lambda\sum_{j=1}^p ||\beta_j|| \tag{13.5} \]