我國科學家利用AI發現超16萬種RNA病毒!

日前,中山大學醫學院施莽教授團隊與阿里雲李兆融團隊在《細胞》雜誌發表論文,報告了全球範圍的180個超羣、16萬餘種的RNA病毒發現,大幅擴展全球RNA病毒的多樣性。該研究將人工智能技術應用於病毒鑑定,探索了病毒學研究的新路徑。

傳統的病毒發現方法高度依賴既有知識,面對RNA病毒這種高度分化、種類繁多且容易變異的病毒識別效率低。在該研究中,研究團隊開發了一種人工智能算法,其能對病毒和非病毒基因組序列深度學習,並自主判斷病毒序列。

利用這套算法,研究團隊在來自全球生物環境樣本的10487份RNA測序數據中發現了超過51萬條病毒基因組,代表超過16萬個潛在病毒種及180個RNA病毒超羣。其中23個超羣無法通過序列同源方法識別,被稱爲病毒圈的“暗物質”。

通過進一步分析,研究團隊報告了迄今最長的RNA病毒基因組,長度達到47250個核苷酸;發現了超出以往認知的基因組結構,展現出RNA病毒基因組進化的靈活性;識別到多種病毒功能蛋白,特別是與細菌相關的功能蛋白,進一步表明還有更多類型的RNA噬菌體亟待探索;發現在南極底泥、深海熱泉、活性污泥和鹽鹼灘等極端環境中,RNA病毒的數量和多樣性仍然較高。“

人工智能的算法模型能夠挖掘出我們之前忽略或根本不知道的病毒,這在疾病防控和新病原的快速識別中尤爲重要。特別是在疫情暴發時,人工智能的速度和精度可以幫助科學家更快地鎖定潛在病原體。”施莽說。

科普中國綜合光明日報