13.5 具有网络结构关系的整合分析

在同一个数据集中,不同解释变量之间可能存在相互作用关系(也意味着是系数间的相互作用关系),从而形成了一张网络结构图,此种关系称为“数据集内部结构”。针对网络结构的惩罚函数如下所示

\[ P(\beta;\lambda)=\lambda\sum_{1 \leq j,k \leq p}a_{jk}(\frac{||\beta_j||_2}{\sqrt{M_j}}-\frac{||\beta_k||_2}{\sqrt{M_k}})^2 \tag{13.10} \]

其中\(a_{jk}\)由网络图得到,描述了两个节点之间是否相连以及链接的强度。若\(X_j\)\(X_k\)越相似,则其惩罚越重(\(a_{jk}\)越大),从而拉近\(\beta_j\)\(\beta_k\)之间的距离,它们的估计值越相近。

同一解释变量在不同数据集中的系数存在某种相似性,称之为“跨数据集结构”。对此有\(Contrast\)惩罚,惩罚函数如下所示

\[ P_C(\beta)=\lambda\sum_{j=1}^p \sum_{k \neq l} a_j^{(kl)}(\beta_j^{(k)}-\beta_j^{(l)})^2 \tag{13.11} \]

其中\(a_j^{(kl)}=I(sgn(\beta_j^{(k)})=sgn(\beta_j^{(l)}))\)。简而言之,就是若\(\beta_j^{(k)}\)\(\beta_j^{(l)}\)的符号相同,则\(a_j^{(kl)}\)取1,那么在最小化的目标下会拉近\(\beta_j^{(k)}\)\(\beta_j^{(l)}\)之间的距离,反之为0。