新型網絡計算機模型助力癌症共現突變發現
一種計算機算法能夠有效地發現共同驅動癌症發生的基因突變,以及其他重要的基因線索,研究人員或許有一天會利用這些線索爲各種癌症開發新的治療方法。
在《生物信息學前沿》雜誌的報告中,由華盛頓州立大學領導的一個團隊使用了一種新穎的網絡計算機模型,在幾種癌症中發現了同時發生的突變以及 DNA 序列元素之間的其他相似之處。該模型便於在海量的癌症基因數據中更容易地搜索模式。
“這不是對一種特定癌症的研究,不是對其進行深入研究並嘗試理解,而是對許多癌症一起進行研究,尋找模式和有朝一日可用於藥物發現的東西,”通訊作者、華盛頓州立大學電氣工程與計算機科學學院副教授阿塞法·格佈雷梅丁說。
癌症往往被當作一種疾病來談論,但它實際上是一系列疾病,不同的驅動突變決定着疾病的進展和預後,共同作者、佛蒙特大學分子遺傳學研究員史蒂文·羅伯茨說。
更好地瞭解不同的突變和驅動基因在各類癌症中的常見程度,可能有助於確定治療可能的靶點的優先次序。但癌症研究人員在尋找線索的過程中受到了阻礙,因爲所需的計算空間太大了。
“我們真的無法查看所有的序列,因爲所需的計算空間太大了,”羅伯茨說。“如果你試圖將所有的基因組數據放在一起並對其全部進行分析,數學問題會呈指數級地增長,會讓系統不堪重負。”
由華盛頓州立大學團隊開發的網絡模型,被稱爲 DiWANN,比現有的網絡模型更爲稀疏、更爲高效,同時不會丟失關鍵的結構組件。
“這種模型以最小的方式來呈現事物且不丟失信息,”格佈雷梅丁說。“我們的模型試圖以更有效的方式理解序列之間的關係,所謂有效,指的是它們能夠快速被計算。通過這種網絡的最小表示,您可以獲得更多信息並使計算具有可擴展性。”
自從五年前開發出他們的 DiWANN 模型以來,研究人員已使用它來研究蜱傳疾病的地理分佈以及大流行期間 COVID-19 的傳播。
在這項工作中,研究人員添加了一個數據縮減步驟,以進一步減少所需的計算量,並添加了第二個計算機模型,以更深入地瞭解共現基因。華盛頓州立大學計算機科學博士生 Shruti Patil 領導了這項工作,並且是該研究的第一作者。
研究人員在他們的工作中發現了證據,例如,胰腺癌中的兩種突變幾乎總是同時出現——這一點在此之前只是被猜測。其中一種突變,腫瘤蛋白 53,抑制腫瘤生長,而另一種被稱爲 KRAS 的突變,則是增殖的驅動因素。
研究人員確定了彼此密切相關的癌症類型,這些類型或許可能對常見的藥物治療具有敏感性。有些癌症是同質的,這意味着它們都具有導致癌症的相似突變,而其他類型的癌症則有各種各樣不同的突變。
“某些特定的癌症類型非常、非常同質,它們的驅動突變幾乎總是相同的,但隨後你會發現其他一些癌症類型則完全不一樣,”羅伯茨說。“根據我們的預測,那些是可能最難治療的。”
因爲它提供的信息有限,WSU 網絡模型使研究人員能夠增加他們可以研究的腫瘤數量。
“這提高了我們實際檢測新的相互作用和這些腫瘤行爲的新方面的能力,”羅伯茨說。“如果我們實際上能夠篩選大量數據集,這是一種更爲快捷的辦法。”
研究人員現在致力於爲公共衛生專家開發一個基於網絡的工具,以便衛生領域的研究人員能夠更輕鬆地使用該模型來研究癌症和其他疾病中的複雜問題。