AI應用最新場景發佈,同濟大學與微衆銀行合作打破藥物數據共享壁壘
(原標題:AI應用最新場景發佈,同濟大學與微衆銀行合作打破藥物數據共享壁壘)
近日,國內AI場景應用再次取得重要成果。來自同濟大學生物信息系的劉琦教授課題組與微衆銀行楊強教授AI團隊合作,首次通過聯邦學習來進行本地藥物隱私數據的保障以及模擬多個製藥機構(用戶)之間的藥物協同開發,助力製藥機構在保障自身藥物數據隱私安全的前提下進行協同藥物發現。
該成果已發表在生物信息學領域著名期刊《Bioinformatics》上,題爲《FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery》。該項目首次探索了應用聯邦學習進行協同藥物開發的可行性,並提出了一種基於聯邦學習的協同藥物定量構效原型系統FL-QSAR。
聯邦學習是近年提出的一種新的合法連接數據孤島進行數據共享計算的協作範式。全球範圍內,由谷歌和楊強教授團隊分別在to C和to B場景率先提出。相比於傳統數據加密共享方法,聯邦學習基於數據“可用不可見”的理念,通過聚合所有用戶的加密模型參數,在數據不出本地的情況下進行模型協同訓練,能夠更好地面對數據共享領域出現的新的問題和法律法規約束。
聯邦學習在金融等領域已獲得廣泛關注,但是在藥物研發及生物計算領域尚未有所應用,製藥領域對於數據不出本地進行共享普遍有着強烈需求,迫切需要探索聯邦學習在該領域的應用。本次微衆銀行AI團隊和同濟大學的合作項目,是聯邦學習在藥物研發領域首次應用探索。
同濟大學與微衆銀行AI團隊在這項產學研協同中,嘗試解決傳統藥物領域的 “頑疾”——即不同的製藥機構之間可以通過數據共享來提高QSAR建模預測的準確率,然而該領域的知識產權和相關的經濟利益不利於製藥機構之間進行數據的直接共享和合作。通過在藥物小分子領域探索使用聯邦學習範式進行藥物協同開發的可行性,結合微衆銀行的聯邦學習開源平臺FATE, FL-QSAR可以在保護藥物小分子結構隱私的前提條件下,獲得與直接整合多用戶小分子數據進行QSAR建模相同或者類似的模型預測效果。
這是一種有效的藥物協同發現的解決方案,打破了傳統QSAR建模時不同製藥機構之間的數據無法直接共享的壁壘,有助於在隱私保護的前提條件下進行協同藥物發現,並適合於推廣和應用到生物醫學隱私計算的其他相關領域。
聯邦學習技術目前正逐步成爲解決數據孤島和數據隱私保護問題的有效方案,在生物健康及藥物研發領域也將具備廣泛的應用場景。該研究成果同時也得到國家重大研究與發展計劃、國家自然科學基金項目、上海市自然科學基金項目、上海市人工智能標準專項項目等基金的資助。
從全球來看,AI產業化進入深水區,近日谷歌AI團隊DeepMind所研究的AlphaFold 算法在生物學領域也取得了重要突破,在此算法下,可通過蛋白質的氨基酸序列高精度地確定其3D結構。AI與生物醫學的密切結合將推進人類健康事業的發展與探索進入新的階段,多位業界專家紛紛表態,稱“AI將改變生物學”,而聯邦學習等新技術的加入將從隱私保護等倫理道德層面爲探索之路保駕護航。