哈工程團隊提出多組學整合框架,爲多種複雜疾病的早期診斷提供新工具

隨着多組學技術的發展,利用多種組學數據進行復雜疾病的早期診斷,已經成爲一項十分重要且需求旺盛的研究方向。

對於多組學整合來說,它能捕捉到疾病在不同分子層面的互補信息,爲更精確的疾病診斷和疾病分類提供了可能。

然而,現有的多組學研究主要集中在提高預測模型的準確性,往往忽視了去尋找具有生物學意義的標誌物。

這一問題在生物醫學領域尤爲重要,因爲分子之間一般通過相互作用來影響疾病的發生與發展,而不是單獨地發揮作用。

已有研究大多采用人工神經網絡來處理高維度的組學數據,並從中學習低維度的表示形式。

例如,自編碼器、變分自編碼器、生成對抗網絡和圖神經網絡等方法,已被廣泛用於這一領域。

特別是圖神經網絡方法,由於其在捕捉分子間交互信息方面的優勢,讓它顯示出了極大的潛力。

然而,這些方法大多關注於構建樣本間的相似性網絡,未能充分捕捉分子本身所固有的交互信息。

除此之外,由於個體的特異性顯著,每個個體的生物標誌物可能存在顯著差異。因此,疾病診斷和標誌物的識別必須從個體層面重新考慮。

此前,領域內的相關研究主要採用全局或局部視角來解釋疾病的預測機制,例如通過 SHAP(SHapley Additive exPlanations)方法,來量化每個基因在區分疾病亞羣中的鑑別能力。

然而,這些方法往往側重於識別單個生物標誌物,忽略了多分子之間的共功能信息。

基於此,哈爾濱工程大學團隊提出一款名爲 GREMI(GRaph-based Explainable Multi-omics Integration)的框架,旨在解決多組學整合和解釋中的幾個關鍵問題。

(來源:IEEE Journal of Biomedical and Health Informatics)

研究中,他們面臨的核心問題是如何在提高預測性能的同時,保持模型的生物學解釋性。這個難題一度讓課題組陷入困境,因爲採用傳統的方法往往難以兼顧這兩個方面。

經過多次的頭腦風暴和深入討論,基於團隊成員對不同領域知識的融合,他們最終提出了一個創新型解決方案:即結合圖神經網絡和蒙特卡羅樹搜索。

通過此,他們設計出一個特殊的圖注意力機制,這不僅能顯著提升模型的預測能力,還能保持高度的可解釋性。

研究人員表示:GREMI 引入了圖注意力網絡,故能更好地捕捉組學內部的相互作用,從而能夠生成樣本級別的潛在特徵表示。

同時,通過聯合融合策略和真正類別概率的引入,GREMI 在預測過程中能夠以自適應的方式,評估特徵層次和組學層次的分類置信度,從而能夠提高模型的學習能力和預測性能。

此外,GREMI 框架還引入了模塊級別的解釋機制,通過蒙特卡羅樹搜索算法在局部視角下探討子圖,並從全局視角來識別在疾病表徵中具有高度貢獻的功能模塊。

這一模塊級別的策略更加直觀,特別適用於解釋複雜疾病的多分子共同作用機制。

總之,本次研究提出了一個新型多組學整合框架,既能提升疾病預測的準確性,又能有效識別具有生物學意義的功能模塊,從而能爲複雜疾病的早期診斷和機制研究提供新思路和新工具。

日前,相關論文以《GREMI:一個可解釋的多組學集成框架,用於增強疾病預測和模塊識別》(GREMI: an Explainable Multi-omics Integration Framework for Enhanced Disease Prediction and Module Identification)爲題發在 IEEE Journal of Biomedical and Health Informatics[1]。

樑洪和羅昊燃是第一作者(並列),哈爾濱工程大學姚曉輝副教授擔任通訊作者。

圖 | 相關論文(來源:IEEE Journal of Biomedical and Health Informatics)

對於本次論文,審稿人表示 GREMI 框架在處理複雜疾病的預測和解釋方面取得了顯著進展,並對 GREMI 框架的可解釋性機制表示讚賞。

其認爲這種機制不僅能提高模型的預測性能,還能通過識別與疾病相關的功能模塊,爲學界提供了更加直觀的生物學解釋。

這種模塊級別的解釋,非常有助於理解多分子如何通過協同作用來影響疾病結果,並具有廣泛的應用前景:

首先,有望用於面向多種疾病的智能篩查。

GREMI 框架通過分析患者的多組學數據,可以快速識別多種疾病及其亞型的早期風險。這對於癌症、心血管疾病、神經退行性疾病等早期難以察覺的疾病尤其具有價值。

其次,有望用於個性化醫療。

GREMI 框架能夠根據多組學數據更準確地進行疾病診斷和亞型分類,爲個性化治療方案的制定提供科學依據。

再次,有望用於生物標誌物的發現。

通過模塊級別的解釋機制,GREMI 框架可以幫助研究人員識別出與疾病相關的功能模塊,這些模塊可能成爲新藥研發或治療靶點的候選者。

最後,有望用於複雜疾病的機制研究。

GREMI 框架可以幫助揭示不同分子如何通過相互作用共同影響疾病的發生與發展。

而基於本次成果,課題組計劃擴展 GREMI 框架,以納入更多類型的組學數據,比如納入代謝組學和表觀基因組學,以便進一步提高疾病預測的準確性和模型的泛化能力。

此外,他們還計劃將 GREMI 用於更多的疾病類型,以驗證其在不同病理條件下的適用性,並探索其在疾病治療靶點發現上的潛力。

相關代碼以及詳細的使用說明已經全部開源,歡迎對此項工作感興趣的科研工作人員下載、使用,並反饋問題 [2]。

參考資料:

1.https://ieeexplore.ieee.org/document/10629044/authors

2.https://github.com/Yaolab-fantastic/GREMI

運營/排版:何晨龍

01/

02/

03/

04/

05/