13.4 异构数据的整合分析

在异构数据中,不同数据集中同一个自变量的显著性不一定相同,因此涉及到双层变量选择

  1. L1 Group MCP

\(L_1 \; Group \; MCP\)组内\(L_1\)惩罚,组间为\(MCP\)惩罚,其惩罚函数为

\[ P(\beta;\lambda,a)=\sum_{j=1}^p P_{MCP}(||\beta_j||_1;\lambda,a) \tag{13.6} \]

经证明,\(L_1 \; Group \; MCP\)仅满足组间选择一致性。

  1. Group MCP

\(Group \; MCP\)又称\(Composite \; MCP\),组内、组间都是\(MCP\)惩罚,其惩罚函数为

\[ P(\beta;\lambda,a,b)=\sum_{j=1}^p P_{MCP}(\sum_{m=1}^M P_{MCP}(|\beta_j^{(m)}|;\lambda,a);\lambda,b) \tag{13.7} \]

经证明,\(Group \; MCP\)在组内和组间均满足选择一致性。

  1. L1 Group Bridge

\(L_1 \; Group \; Bridge\)组内为\(L_1\)惩罚,组间为\(Bridge\)惩罚,其惩罚函数为

\[ P(\beta;\lambda)=\lambda\sum_{j=1}^p p_j||\beta_j||_i^\gamma \tag{13.8} \]

  1. Sparse Group Lasso & Adaptive Sparse Group Lasso

\(Sparse \; Group \; Lasso\)\(Adaptive \; Sparse \; Group \; Lasso\)都是基于\(Lasso\)的惩罚方法,两者的惩罚函数分别为

\[ P_{SGL}(\beta;\lambda_1,\lambda_2)=\lambda_1\sum_{j=1}^p ||\beta_j||+\lambda_2||\beta||_1 \\ P_{adSGL}(\beta;\lambda_1,\lambda_2)=\lambda_1\sum_{j=1}^p w_j||\beta_j||_2+\lambda_2\xi'|\beta| \tag{13.9} \]

由于#SGL#是\(Lasso\)\(Group \; Lasso\)的线性组合,两者在理论上都不满足\(Oracle\)性质,预期\(SGL\)也不满足\(Oracle\)性质。而\(adSGL\)通过引入组权重\(w\)和单个系数权重\(\xi\),改进选择一致性和估计一致性