今天給大家介紹發(fā)表在AAAI 2024上的一篇論文: Dual-Channel Learning Framework for Drug-Drug Interaction Prediction via Relation-Aware Heterogeneous Graph Transformer 近年來,基于網(wǎng)絡(luò)的藥物-藥物相互作用(DDI)預(yù)測(cè)技術(shù)主要集中于分析DDI相關(guān)網(wǎng)絡(luò)的局部結(jié)構(gòu),但往往忽視了藥物節(jié)點(diǎn)之間間接連接的重要性,這種整體視角的缺失可能導(dǎo)致預(yù)測(cè)精度的下降。此外,處理生物醫(yī)學(xué)知識(shí)圖譜和藥物分子圖中存在的異構(gòu)信息仍然是提升DDI預(yù)測(cè)性能的一個(gè)主要挑戰(zhàn)。為了克服這些限制,本研究提出了一種基于Transformer的關(guān)系感知圖表示學(xué)習(xí)框架TIGER。該框架能夠有效地學(xué)習(xí)異構(gòu)圖中的長(zhǎng)距離依賴和高階結(jié)構(gòu),并捕捉節(jié)點(diǎn)對(duì)之間多樣化的語義關(guān)系。TIGER利用雙通道網(wǎng)絡(luò)整合藥物分子圖和生物醫(yī)學(xué)知識(shí)圖的信息,顯著提高了DDI預(yù)測(cè)的準(zhǔn)確性。實(shí)驗(yàn)結(jié)果表明,TIGER在多個(gè)數(shù)據(jù)集上的表現(xiàn)優(yōu)于現(xiàn)有方法,展示了其在DDI預(yù)測(cè)任務(wù)中的有效性。識(shí)別新型藥物-藥物相互作用(DDI)在藥理學(xué)中具有重要意義,因?yàn)樗幬镏g的相互作用可能會(huì)帶來嚴(yán)重的醫(yī)療風(fēng)險(xiǎn)。近年來,已經(jīng)提出了多種基于網(wǎng)絡(luò)的技術(shù)來預(yù)測(cè)DDI,但這些方法大多關(guān)注網(wǎng)絡(luò)內(nèi)部的局部結(jié)構(gòu),常常忽視藥物節(jié)點(diǎn)之間間接連接的整體視角。此外,有效處理生物醫(yī)學(xué)知識(shí)圖譜和藥物分子圖中的異構(gòu)信息仍然是提升DDI預(yù)測(cè)性能的關(guān)鍵挑戰(zhàn)。為了解決這些問題,本文提出了一種基于Transformer的關(guān)系感知圖表示學(xué)習(xí)框架(TIGER)用于DDI預(yù)測(cè)。TIGER利用Transformer架構(gòu)的優(yōu)勢(shì),有效地捕捉異構(gòu)圖中的長(zhǎng)距離依賴和高階結(jié)構(gòu)。 TIGER模型分為三個(gè)部分:數(shù)據(jù)收集和處理、關(guān)系感知異構(gòu)圖Transformer和DDI預(yù)測(cè)。如下圖1所示即為TIGER模型的基本框架結(jié)構(gòu)。 TIGER模型使用生物醫(yī)學(xué)知識(shí)圖譜(BKG)和藥物分子圖作為輸入。對(duì)于BKG,作者采用了三種提取子圖的方法,分別是基于k-子樹的提取器、基于DeepWalk的提取器和基于概率的提取器。這些方法可以有效地提取出與藥物相互作用相關(guān)的重要信息,保證模型在處理不同類型的網(wǎng)絡(luò)時(shí)具有良好的魯棒性。2.2 關(guān)系感知異構(gòu)圖Transformer 自注意力機(jī)制是Transformer架構(gòu)的核心組件,能夠有效地捕捉序列中的長(zhǎng)距離依賴關(guān)系。然而,傳統(tǒng)的自注意力機(jī)制主要關(guān)注位置信息,忽視了節(jié)點(diǎn)對(duì)之間不同類型關(guān)系的特性。此外,遠(yuǎn)程節(jié)點(diǎn)之間通常缺乏顯式關(guān)系,且一個(gè)節(jié)點(diǎn)對(duì)可以具有多種關(guān)系。為了應(yīng)對(duì)這些挑戰(zhàn),作者在TIGER中引入了關(guān)系感知自注意力機(jī)制:(1)通過最短路徑距離來建立遠(yuǎn)距離節(jié)點(diǎn)之間的關(guān)系;(2)將每種關(guān)系視為一條獨(dú)特的邊,解決多重關(guān)系的問題。首先,通過將節(jié)點(diǎn)度嵌入與節(jié)點(diǎn)嵌入相加,為每個(gè)節(jié)點(diǎn)特征中加入節(jié)點(diǎn)度的位置嵌入,以獲得初始節(jié)點(diǎn)特征。關(guān)系感知自注意力計(jì)算公式如下: 將兩個(gè)藥物的表示拼接并輸入MLP以預(yù)測(cè)鏈接預(yù)測(cè)分?jǐn)?shù):在完成特征提取后,TIGER將兩個(gè)藥物的表示拼接并輸入到多層感知器(MLP)中,以預(yù)測(cè)鏈接預(yù)測(cè)分?jǐn)?shù)。所有DDI對(duì)的交叉熵?fù)p失表示為:為了確保獲得鑒別的藥物雙通道表示,在藥物雙通道表示hi上使用了Jensen-Shannon (JS)互信息(MI)估計(jì)器,并使用二元交叉熵?fù)p失:TIGER模型的最終目標(biāo)函數(shù)為:為了驗(yàn)證TIGER的有效性,作者選取了三種類型的基線方法進(jìn)行對(duì)比實(shí)驗(yàn),包括基于分子圖的方法(如SSI-DDI、Molormer)、基于生物醫(yī)學(xué)知識(shí)圖譜的方法(如KGNN、KG2ECapsule)以及基于多層次的方法(如Bi-GNN、MIRACLE和MDDNN)。同時(shí),作者比較了三種子圖提取方法的性能。實(shí)驗(yàn)結(jié)果顯示:(i) 在處理低密度數(shù)據(jù)集時(shí),基于概率的提取器(PageRank)效果較好;(ii) 對(duì)于密集數(shù)據(jù)集,基于DeepWalk的提取器表現(xiàn)更佳;(iii) 基于k-子樹的提取器在不同類型的網(wǎng)絡(luò)中展現(xiàn)出良好的魯棒性,盡管可能會(huì)導(dǎo)致一定的精度損失。具體結(jié)果見表1。為了進(jìn)一步驗(yàn)證知識(shí)圖譜和分子圖對(duì)模型預(yù)測(cè)的互補(bǔ)信息,作者進(jìn)行了消融實(shí)驗(yàn)。結(jié)果顯示,生物醫(yī)學(xué)知識(shí)圖譜(BKG)對(duì)DDI預(yù)測(cè)任務(wù)的貢獻(xiàn)更大,同時(shí)使用BKG和分子圖能夠使模型獲得最佳性能。如下圖2所示,消融實(shí)驗(yàn)結(jié)果表明,結(jié)合兩種數(shù)據(jù)源的信息可以顯著提升模型的預(yù)測(cè)準(zhǔn)確性。 圖2 消融對(duì)比 本文介紹了一種新型的雙通道關(guān)系感知圖轉(zhuǎn)換模型TIGER,旨在預(yù)測(cè)藥物-藥物相互作用(DDI)。TIGER通過聯(lián)合表示學(xué)習(xí)藥物分子圖和生物醫(yī)學(xué)知識(shí)圖譜,能夠有效捕捉長(zhǎng)距離依賴和高階結(jié)構(gòu),這對(duì)于準(zhǔn)確的DDI預(yù)測(cè)至關(guān)重要。此外,TIGER在處理圖中的多種關(guān)系方面表現(xiàn)出色,為DDI預(yù)測(cè)提供了有價(jià)值的見解,增強(qiáng)了對(duì)藥物相互作用背后復(fù)雜生物系統(tǒng)的理解。通過大量實(shí)驗(yàn)驗(yàn)證,TIGER在多個(gè)真實(shí)數(shù)據(jù)集上的表現(xiàn)優(yōu)于現(xiàn)有方法,展示了其在DDI預(yù)測(cè)任務(wù)中的有效性和潛力。 https://ojs./index.php/AAAI/article/view/27777
|