斯坦福大學(xué)、基因泰克公司(Genentech)和陳-扎克伯格基金會(Chan-Zuckerberg Initiative)的專家們共同努力,旨在利用人工智能開發(fā)世界上第一個虛擬人類細胞。這項開創(chuàng)性的工作將極大地提高我們對人類生物學(xué)的認識,促進硅學(xué)實驗,加快醫(yī)學(xué)研究,并為個性化醫(yī)療鋪平道路。

研究人員正在探索世界上首個虛擬人類細胞,這是一個人工智能驅(qū)動的模型,旨在模擬人類生物分子、細胞和組織的復(fù)雜行為。 這項創(chuàng)新可以為了解生物學(xué)的復(fù)雜性和推動醫(yī)學(xué)研究開辟新的途徑。 圖片來源:Emma Lundberg
斯坦福大學(xué)、基因泰克公司(Genentech)和陳-扎克伯格基金會(Chan-Zuckerberg Initiative)的研究人員認為,人工智能(AI)的進步和大規(guī)模生物數(shù)據(jù)的可用性為建立世界上第一個虛擬人類細胞創(chuàng)造了"前所未有的機會"。 這種由人工智能驅(qū)動的模型可以模擬人類生物分子、細胞甚至整個組織和器官的復(fù)雜行為。
斯坦福大學(xué)工程學(xué)院和醫(yī)學(xué)院的生物工程和病理學(xué)副教授、《細胞》(Cell)雜志上一篇新文章的資深作者艾瑪-倫德伯格(Emma Lundberg)說:"人體細胞建??梢哉f是生物學(xué)的圣杯。這篇文章建議全球共同努力,創(chuàng)建世界上第一個人工智能虛擬細胞。人工智能提供了直接從數(shù)據(jù)中學(xué)習(xí)的能力,并能超越假設(shè)和直覺,發(fā)現(xiàn)復(fù)雜生物系統(tǒng)的突發(fā)特性。"
倫德伯格與斯坦福大學(xué)生物工程教授兼陳-扎克伯格倡議科學(xué)主任斯蒂芬-奎克(Stephen Quake)和工程學(xué)院計算機科學(xué)教授尤雷-萊斯科維奇(Jure Leskovec)共同撰寫了這篇文章。 其他資深作者還包括陳-扎克伯格基金會科學(xué)人工智能主管 Theofanis Karaletsos 和基因泰克公司研究執(zhí)行副總裁 Aviv Regev。
這種合成細胞模型既能讓人們更深入地了解化學(xué)、電學(xué)、機械以及其他力量和過程的復(fù)雜相互作用,這些力量和過程使健康的人體細胞發(fā)揮作用,又能揭示導(dǎo)致細胞功能障礙或死亡的疾病根源。
也許更有趣的是,人工智能虛擬細胞還能讓科學(xué)家在計算機上而不是在活細胞和生物體上進行硅學(xué)實驗,而不是體內(nèi)實驗。 這種能力將擴大人類對人類生物學(xué)的了解,加快尋找新療法、新藥物,甚至是疾病的治療方法。
數(shù)字生物學(xué)時代的愿景
癌癥生物學(xué)家可能會模擬某些突變?nèi)绾问菇】导毎l(fā)生惡變。微生物學(xué)家也許有一天會預(yù)測病毒對受感染細胞甚至宿主生物的影響。 有朝一日,醫(yī)生可能會在病人的"數(shù)字雙胞胎"上測試治療方法,從而加速實現(xiàn)長期承諾的更快、更經(jīng)濟、更安全的個性化醫(yī)療時代。
不過,作者表示,人工智能虛擬細胞要想取得成功,需要實現(xiàn)三個目標(biāo)。 首先,它需要讓研究人員有能力創(chuàng)建跨物種和細胞類型的通用表征。 它還必須準(zhǔn)確預(yù)測細胞功能、行為和動態(tài),并理解細胞機制。 最后但并非最不重要的一點是,人工智能虛擬細胞將允許在計算機上進行實驗,以測試假設(shè)并指導(dǎo)數(shù)據(jù)收集,從而以遠低于目前的速度和成本擴展虛擬細胞的能力。
海量生物數(shù)據(jù)的挑戰(zhàn)
作者稱之為科學(xué)的"三連勝",人工智能開創(chuàng)了一個可預(yù)測、可生成、可查詢的工具時代,但不可否認的是,創(chuàng)建虛擬細胞需要大量的原始生物數(shù)據(jù)。 相比之下,作者指出,美國國家衛(wèi)生研究院(National Institutes of Health)匯編的DNA測序數(shù)據(jù)庫被稱為"短讀檔案"(Short Read Archive),目前已包含超過14PB的數(shù)據(jù),比用于訓(xùn)練ChatGPT的數(shù)據(jù)集大一千倍。
實現(xiàn)人工智能虛擬細胞并非易事。 這將需要全球范圍內(nèi)的協(xié)同合作、開放科學(xué)合作,其規(guī)模前所未有,涉及從遺傳學(xué)、蛋白質(zhì)組學(xué)到醫(yī)學(xué)成像等各個領(lǐng)域,還需要學(xué)術(shù)界、工業(yè)界和非營利組織等全球利益相關(guān)者之間的緊密合作。 與此同時,作者們也謹慎地指出,任何為人工智能虛擬細胞所做的工作都必須假定所產(chǎn)生的模型將不受限制地向整個科學(xué)界開放。
倫德伯格斷言:"這是一個龐大的項目,堪比基因組計劃,需要跨學(xué)科、跨行業(yè)、跨國家的合作,我們知道,功能齊全的模型可能要十年或更長時間才能問世。但是,隨著當(dāng)今人工智能能力的迅速發(fā)展,以及我們龐大且不斷增長的數(shù)據(jù)集,科學(xué)界聯(lián)合起來,開始徹底改變我們理解和模擬生物學(xué)的方式的時機已經(jīng)成熟。"
編譯自/ScitechDaily
DOI: 10.1016/j.cell.2024.11.015