對(duì)于少數(shù)基因變異,人們找出了它們與疾病的關(guān)聯(lián)。比如BRCA1和BRCA2基因上的一些突變與升高乳腺癌和卵巢癌的風(fēng)險(xiǎn)有關(guān),于是人們可以根據(jù)基因測(cè)序結(jié)果采取預(yù)防和治療的手段。
然而,對(duì)于絕大部分已識(shí)別的基因變異——超過(guò)98%,我們還不清楚變異意味著什么:是會(huì)影響基因功能,導(dǎo)致疾病?還是不會(huì)對(duì)健康造成影響,無(wú)需擔(dān)心?
圖片來(lái)源:123RF
頂尖學(xué)術(shù)期刊《自然》今日在線發(fā)表的一篇研究論文中,來(lái)自哈佛醫(yī)學(xué)院和牛津大學(xué)的科研人員合作展示了他們開(kāi)發(fā)的一款人工智能(AI)模型。對(duì)于人類(lèi)的基因變異是否意味著疾病,這款A(yù)I具有非凡的判斷能力。
它不僅預(yù)測(cè)出了3200多個(gè)疾病相關(guān)基因中的3600萬(wàn)個(gè)致病突變,并且為256000個(gè)至今意義不明的基因突變是“致病”還是“良性”做出歸類(lèi)。研究人員希望,借助這款A(yù)I的預(yù)測(cè),未來(lái)醫(yī)生將可以更準(zhǔn)確地診斷和治療疾病。
這款A(yù)I使用一種復(fù)雜的機(jī)器學(xué)習(xí),先檢測(cè)了數(shù)十萬(wàn)來(lái)自其他物種的基因變異模式,然后根據(jù)自行學(xué)習(xí)歸納的結(jié)果,預(yù)測(cè)人類(lèi)基因變異的含義。
研究人員解釋說(shuō),演化傾向于保留一些對(duì)于生存十分重要的特征,這些特征在不同物種中共享,因此重復(fù)出現(xiàn)在不同物種中的氨基酸序列是一個(gè)重要的生物學(xué)標(biāo)志,表明這種高度保守的序列一旦改變可能與疾病有關(guān)。而這款A(yù)I通過(guò)對(duì)這些序列變異在不同物種中的分布進(jìn)行建模,學(xué)會(huì)預(yù)測(cè)哪些序列可能導(dǎo)致疾病。
▲這款A(yù)I的建模策略:對(duì)于每種蛋白質(zhì),都會(huì)比較它在多個(gè)物種中的序列數(shù)據(jù)(圖片來(lái)源:參考資料[1])
由于綜合了進(jìn)化上很多其他物種的線索,研究人員將這款A(yù)I命名為Evolutionary model of Variant Effect,簡(jiǎn)稱(chēng)EVE。
經(jīng)過(guò)2.5億個(gè)蛋白質(zhì)序列的訓(xùn)練后,EVE開(kāi)始預(yù)測(cè)單個(gè)氨基酸變異會(huì)帶來(lái)什么后果。為了確定EVE的預(yù)測(cè)是否準(zhǔn)確,研究人員用意義明確的一些人類(lèi)基因突變進(jìn)行了檢驗(yàn),發(fā)現(xiàn)EVE給出的評(píng)分結(jié)果與臨床數(shù)據(jù)非常一致。
研究人員將EVE應(yīng)用于3219個(gè)疾病相關(guān)的人類(lèi)基因,這些基因上出現(xiàn)的不同突變有一些是致病性的,還有一些是良性的。在與其他一些依據(jù)不同模型的工具進(jìn)行比較后,研究人員說(shuō),EVE有著明顯更高的預(yù)測(cè)準(zhǔn)確性。
更嚴(yán)格的檢驗(yàn)來(lái)自于實(shí)際臨床實(shí)驗(yàn),這是用于評(píng)估基因突變?nèi)绾斡绊懮砉δ艿慕饦?biāo)準(zhǔn)。研究團(tuán)隊(duì)選擇了5個(gè)基因,包括BRCA1,TP53,PTEN,MSH2和SCN5A,這些基因經(jīng)過(guò)充分的研究,已知其中一些變異與各種形式的癌癥、心律失常等疾病相關(guān)。而EVE通過(guò)計(jì)算得到的預(yù)測(cè)結(jié)果與臨床實(shí)驗(yàn)中的疾病風(fēng)險(xiǎn)結(jié)果有很大的重疊。
▲對(duì)幾種疾病相關(guān)基因的不同變異是否具有致病性,EVE的計(jì)算預(yù)測(cè)結(jié)果(左側(cè))與實(shí)際臨床實(shí)驗(yàn)結(jié)果(右側(cè))接近(圖片來(lái)源:參考資料[1])
研究人員指出,EVE的預(yù)測(cè)有一個(gè)顯著的優(yōu)勢(shì)是,對(duì)于基因變異它并非給出一個(gè)非黑即白的判斷結(jié)果,而是會(huì)顯示一個(gè)連續(xù)的分?jǐn)?shù)。“這種突變意味著我的小拇指會(huì)痛,還是明天就會(huì)死?連續(xù)評(píng)分對(duì)于預(yù)測(cè)致病性高低非常重要。“研究作者Debora Marks教授解釋說(shuō)。
此外,這款A(yù)I在對(duì)每個(gè)基因變異給出預(yù)測(cè)分?jǐn)?shù)時(shí),還會(huì)提供一個(gè)置信度分?jǐn)?shù),告訴使用者——比如臨床醫(yī)生,在多大程度上可以相信EVE的判斷。
展望未來(lái),研究人員希望把AI對(duì)遺傳變異的新認(rèn)識(shí)轉(zhuǎn)化為對(duì)臨床醫(yī)生的幫助。他們強(qiáng)調(diào),EVE本身不是一種診斷測(cè)試工具,但它的計(jì)算能力可以增強(qiáng)現(xiàn)有的臨床工具,幫助遺傳學(xué)家和醫(yī)生做出正確的診斷、預(yù)后和治療決策,根據(jù)某些致病基因突變的存在來(lái)選擇更精確的治療方法。
“我們相信我們的方法可以用作當(dāng)前臨床評(píng)估的附加工具,并提供一種強(qiáng)大的新方法來(lái)減少不確定性和明確決策,尤其是在臨床環(huán)境中,”Marks教授認(rèn)為。
參考資料:
[1] Jonathan Frazer et al., (2021) Disease variant prediction with deep generative models of evolutionary data. Nature Doi: https://doi.org/10.1038/s41586-021-04043-8
[2] All about Eve. Retrieved Oct. 27, 2021 from https://www.newswise.com/articles/all-about-eve?sc=rsla