非编码 miRNA 与疾病关联关系预测
越来越多的研究表明,一个复杂疾病通常经由多个 miRNA 协同调控,一个 miRNA 通常参与多个疾病的发生发展过程。因此,预测 miRNA 与疾病的关联关系成为一个当前的研究热点。下面我们将探讨一种 miRNA 和疾病关联关系预测方法(VGAE),该方法基于变粉紫编码器和矩阵分解方法来实现预测。
1. 基于变分自编码器非线性特征表示的 miRNA 与疾病关联关系预测
论文链接: https://pan.baidu.com/s/1IOU1pzBREt217ADr6OMQQg 提取码: 3ku3
本论文是一种变分图自编码器(variational graph auto-encoder, VGAE)是一种结合了GCN 和 VAE 的无监督学习模型。该模型通常应用于图形结构数据,它能学习唔想吐的可解释的潜在表示。由 VGAE 得到的非线性表示可以同时整合图的结构和数据分布。
设 miRNA 的相似性读矩阵为 A A A,将 miRNA 的初始标量特征 X X X 设置为 miRNA 和疾病邻接矩阵 A A A 的一行。在得到输入数据 S S S 和 X X X 后,GCN 将 t − 1 t-1 t−1 步的图信号 X ( t − 1 ) X^{(t-1)} X(t−1) 转换为新的图信号 X ( t ) X^{(t)} X(t),具体如下
X ( t ) = ReLU ( D ~ − 1 / 2 A ~ D ~ − 1 / 2 X ( t − 1 ) Θ ( t − 1 ) ) X^{(t)}=\text{ReLU}\Big(\tilde{D}^{-1/2}\tilde{A}\tilde{D}^{-1/2}X^{(t-1)}\Theta^{(t-1)}\Big) X(t)=ReLU(D~−1/2A~D~−1/2X(t−1)Θ(t−1))
其中, A ~ = A + I \tilde{A}=A+I A~=A+I, D D D 为其对角阵, Θ ( t − 1 ) \Theta^{(t-1)} Θ(t−1) 是第 t − 1 t-1 t−1 层 GCN 的参数。
2. 图变分自编码 VGAE
VGAE 包括一个编码器和一个解码器。在编码器部分,以一个邻接矩阵 A A A 和一个特征矩阵 X X X 作为输入,得到一个潜在变量 z \mathbf z z 作为 GCN 的输出