![]() HGDrug在4個基準任務(藥物-藥物、藥物-靶點、藥物-疾病和藥物副作用相互作用)上實現了高度準確和穩健的預測。實驗分析驗證了HGDrug模型架構和多分支設置的有效性和合理性,并證明了HGDrug能夠有效識別潛在的藥物相關的相互作用,幫助提高其他GNN模型的性能。總之,HGDrug可以這些結論為如何在生物醫學網絡上引入藥物的子結構信息以完成多種藥物相關的相互作用任務提供了重要的見解,通過構建微觀到宏觀的以藥物為中心的異構網絡,為識別藥物相關的相互作用提供了一個通用而強大的工具。 背景 大規模藥物相關的相互作用網絡和深度學習的強大結合,為加速藥物發現過程提供了新的機會。生物醫學網絡包含領域知識,可用于藥物發現和藥物相互作用等各種任務的預測,但目前的生物醫學網絡忽略了對藥物性質起重要作用的化學物質。以往的藥物相互作用預測方法大多依賴于成對連接,而沒有關注復雜生物網絡中的局部強連接,無法將藥物與化學結構進行關聯,使得在藥物性質和涉及更多節點的高階關系中起重要作用的化學結構的數據挖掘,在當前的生物醫學網絡研究中尚未得到解決。 方法 HGDrug對藥物進行分解,構建藥物與子結構的相互作用網絡,通過具有相同子結構的藥物數量和子結構之間的包涵關系來挖掘藥物的特征信息,捕捉藥物之間的潛在關聯。 為了獲取藥物之間的高階信息,首先將這些異構網絡和分子相互作用網絡對齊,以完成特定的預測任務,并基于異構網絡上的網絡基序構建超圖(圖1(a))。作者重點研究了代表藥物之間高階關系的三角形和四邊形圖案(motif),并精心設計了一套圖案來指導超圖的構建。除了藥物子結構網絡,作者還建立了基于分子相互作用網絡的超圖,只關注這些異質網絡中的三角形圖案(圖1(b))。作者還考慮到藥物是否直接相關,并細分為:DRSS(與藥物相關且具有相同亞結構)、DISS(與藥物無關且具有相同亞結構)、DRSM(與藥物相關且具有相同分子相互作用)、DISM(與藥物無關且具有相同分子相互作用),其中每一類又包括三種圖案,所以共有12種圖案。圖1(a)顯示了所有使用的圖案(M1-M12)。 ![]() 如圖1(c)所示,在上述得到的四組圖案驅動超圖的基礎上,使用四個分支提取給定異構網絡的多尺度藥物特征,每個分支捕獲基元驅動超圖中的高階藥物關系模式。為了區分不同超圖中的高階藥物-藥物關系對最終藥物相關相互作用預測性能的影響,在藥物初始特征向量矩陣D0作為每個分支的輸入時,采用濾波后的自門控單元進行預處理。在非線性門通過維度重加權以特征粒度調制藥物的初始特征后,獲得了分支特異性藥物特征。藥物嵌入通過消息傳播后,對每一層得到的嵌入特征進行平均以避免過度平滑。此外,由于從不同分支獲得的藥物特征并不是同等重要,因此采用注意力機制對從每個分支獲得的藥物特征信息進行聚合。對于藥物多任務相互作用預測的下游任務,使用圖卷積從特定下游任務的已知相互作用數據M0中獲取藥物和藥物相關節點信息。 該模型采用貝葉斯個性化排名(BPR)損失進行優化。BPR是一種兩兩損失,它促進觀察到的相互作用的排名高于未觀察到的相互作用。設藥物d為模態的輸入。假設存在與藥物d相關的隨機正樣本i和與藥物d無關的隨機負樣本j,則模型優化的目標是使樣本i在藥物d的預測列表中的排名高于樣本j。 不同分支可以學習不同超圖上不同分布的藥物特征。為了避免聚合操作可能導致的高階信息丟失,采用自監督輔助任務來提高關聯預測任務的性能。受深度圖信息(Deep Graph Infomax, DGI)方法的啟發,模型計算節點表示和全圖表示之間的互信息(mutual information)。在自監督輔助任務中,通過層次化地最大化藥物表征與對應的以藥物為中心的子超圖以及各分支的超圖之間的互信息,可以得到反映不同超圖中藥物節點局部和全局高階連接模式的綜合藥物表征。對于每個分支的超圖,構建鄰接矩陣來捕獲藥物的高階關聯信息,每一行通過相應超圖的行索引表示一個以藥物為中心的子超圖。子超圖表示可以通過一個讀出函數得到。這樣得到的藥物嵌入與藥物相關節點嵌入進行點乘,得到基于超圖的藥物相關的互作關系。 結果 作者將HGDrug與一些具有代表性的方法進行了比較。在藥物-藥物相互作用(DDI),藥物-靶標相互作用(DTI),藥物-疾病相互作用(DDiI),藥物-副作用相互作用(DSI)這四種任務上,比較各個方法的AUROC和AUPR。如表1所示,HGDrug在所有四個任務的AUROC和AUPR上都取得了最佳結果(加粗數字),且顯著高于第二名(下劃線數字)。 作者設計了模型消融實驗。實現了HGDrug的5個簡化變體,以檢驗HGDrug中每個成分在4種不同類型的預測任務中的作用。結果如圖2所示。HGDrug的5個簡化變體記為:(1)HGDrug_0:移除第1 ~ 4個超圖分支。(2)HGDrug_2f:去除第3和第4個分子相互作用超圖分支,保留第1和第2個藥物亞結構超圖分支。(3)HGDrug_2m:去除第1和第2藥物亞結構超圖分支,保留第3和第4分子相互作用超圖分支。(4)HGDrug_ac:通過超圖卷積網絡獲得藥物表示。(5)HGDrug_self:移除自監督輔助任務。 ![]() ![]() 結果表明,HGDrug模型可以有效識別潛在的新型相互作用。這表明,即使缺乏標簽信息,從超圖分支中學習到的表示也遵循某種與藥物類別密切相關的模式。 總結 在這項工作中,作者提出了以藥物為中心的異構網絡方法,并開發了一個稱為HGDrug的通用框架,這是一個用于預測藥物相關相互作用的新型超圖注意力網絡。 HGDrug可以作為預測藥物相關相互作用的有效方法,為藥物相關的相互作用的計算提供新的思路,并為藥物發現提供計算機輔助指導。基于超圖的方法不受網絡數據大小的限制。它利用現有的網絡數據提取藥物之間的強相關性,從而提高藥物相關任務的預測準確性。這種方法允許將計算擴展到更大的網絡數據集,而不會增加計算復雜性。此外,HGDrug擅長處理大多數與藥物相關的交互任務預測,顯著減少了計算資源的消耗,使相關任務的執行更加方便和高效。 參考文獻 [1] Jin et al. A general hypergraph learning algorithm for drug multi-task predictions in micro-to-macro biomedical networks. PLoS Comput Biol. 2023 |
|