作為全球頂級科技盛會,云棲大會被視為科技界的創(chuàng)新風向標,主論壇的話題尤為受關(guān)注,代表了最具前沿性、探索性和想象空間的科技方向。
2021年度,AI和Science是兩個很有熱度的詞。AlphaFold2以深度學習技術(shù)在預(yù)測蛋白質(zhì)結(jié)構(gòu)上做出突破,這項計算工作展現(xiàn)出AI在科學領(lǐng)域解決問題的巨大潛力。從生物這一單一場景延展開來,在物理、化學、材料、地質(zhì)等多領(lǐng)域,以深度學習為代表的AI與科學計算結(jié)合形成新的計算方法,可以產(chǎn)生怎樣新的科學模型、新的實驗方法、新的產(chǎn)業(yè)業(yè)態(tài)?
思潮之下,“AI+Science”也成為2021云棲大會討論碰撞的焦點。
解決傳統(tǒng)科學計算問題,AI的系統(tǒng)性機會在哪里
張林峰博士此次演講的題目是“‘AI+Science’從科學愿景走向大規(guī)模工程化”。
令人關(guān)注的是,他所帶領(lǐng)的深勢科技團隊引領(lǐng)的跨尺度建模技術(shù)成功應(yīng)用了人工智能和高性能計算等能力,于2020年在世界上最大的超級計算機上將量子精度的分子動力學模擬推向了上億個原子,革命性地提高了微觀科學計算的尺度和精度。這一研究成果在全球范圍內(nèi)都處于領(lǐng)先位置,獲美國計算機協(xié)會ACM公布的2020年戈登貝爾獎,并當選中國科學院、中國工程院主辦,中國科學院院士和中國工程院院士評選的2020年中國十大科技進展。并被認為有望為力學、化學、材料、生物乃至工程領(lǐng)域解決實際問題發(fā)揮更大作用。
張林峰認為,長期以來我們對世界的認知遵循著兩大范式:開普勒范式和牛頓范式。前者從數(shù)據(jù)中提取規(guī)律,后者尋求基本原理。兩者都能用來解決實際問題。當代AI在CV/NLP等領(lǐng)域的應(yīng)用是集前者之大成,而當代仿真模擬和工業(yè)設(shè)計軟件則是后者的精華沉淀。開普勒范式面臨的挑戰(zhàn)是所謂“知其然不知其所以然”的問題,即模型的可解釋性、可遷移性等;而牛頓范式面臨的挑戰(zhàn)是帶來棘手又漫長的計算過程,即所謂“維度災(zāi)難”。“AI+Science”的本質(zhì)實則是兩種范式的結(jié)合。
由此,帶來“AI+Science”的系統(tǒng)性機會。以機器學習為代表的AI具備復雜數(shù)據(jù)處理的能力,可以使得訓練出來的物理模型兼具微觀尺度的精度和宏觀尺度的效率,能夠真正有效解決科學計算中的“維度災(zāi)難”問題。以斬獲戈登貝爾獎的Deep Potential方法為例,張林峰博士展示了AI和分子動力學模型的有效結(jié)合,在保證精度的同時,指數(shù)級地提升了物理模型的效率。以這套方法為代表的全新范式,可以系統(tǒng)性地解決藥物設(shè)計、材料設(shè)計和化工設(shè)計等領(lǐng)域中的微觀設(shè)計層面問題,實現(xiàn)“既快又準”的計算模擬。
事實上,AI+Science的應(yīng)用場景遠不止于微觀層面設(shè)計,在宏觀的飛機、汽車、火箭也將有豐富的應(yīng)用。
“AI+Science”的工程化正當時
做Science(科學)是探索和理解未知的世界,而工程是還原到實踐的過程。
談到“AI+Science”的工程化,張林峰博士強調(diào),“AI+Science”的工程化正當時!從規(guī)模、數(shù)據(jù)、性能三個維度的工程化來理解:對于AI+Science,“規(guī)模工程”將更加面向計算本身;“數(shù)據(jù)工程”,將需要面向物理、尊重物理約束;“性能工程”,將不再是軟件對硬件的適配,而會是硬件對算法的定制。
“這樣的工程化需要的是科學家、工程師以及各行各業(yè)共同的努力。“開源去中心的協(xié)同開發(fā)、在開發(fā)基礎(chǔ)上快速地實現(xiàn)分布式評審,就是一種被驗證且最佳的軟件協(xié)同發(fā)展模式。張林峰指出打造“AI+Science”新一代基礎(chǔ)設(shè)施的新思路——“開源協(xié)同”。
開源模式在過去的半個世紀給計算機領(lǐng)域帶來了高速發(fā)展,在科學計算領(lǐng)域尚屬新事物,但這種基于開放共享精神和同行評價機制的高效合作模式發(fā)展非常迅速。張林峰博士作為核心發(fā)起人并推動的DeepModeling開源社區(qū)之上,新一代的AI+Science體系正在建立:底層算力調(diào)度、各尺度物理引擎、數(shù)據(jù)庫、面向各類計算需求的工作流都在快速迭代?;贒eePMD開源軟件,來自世界各地的數(shù)千個材料、化學、生物等領(lǐng)域的研究組正在拓寬著他們的科研邊界,也產(chǎn)生了很多優(yōu)質(zhì)的科研成果。
AI+Science的未來:解放科學研究與工業(yè)設(shè)計的生產(chǎn)力
張林峰博士最后強調(diào),AI+Science的未來在于解放科學研究與工業(yè)設(shè)計的生產(chǎn)力。
他所帶領(lǐng)的深勢科技正在聚焦微觀尺度,打造微尺度工業(yè)設(shè)計平臺,用開源社區(qū)和Lebesgue科學計算平臺解放科學家的生產(chǎn)力,用藥物設(shè)計和材料設(shè)計兩大平臺解放這兩個行業(yè)的研發(fā)生產(chǎn)力。為微觀尺度的工業(yè)設(shè)計解決難題,這也是深勢科技創(chuàng)立的初衷。
關(guān)于深勢科技
深勢科技有限公司(“深勢科技”)是一家成立于2019年的科技公司,致力于以新一代分子模擬技術(shù)解決微觀尺度工業(yè)設(shè)計難題。 以打造切實服務(wù)于藥企、材料商和科研機構(gòu)的模擬研發(fā)平臺為主要業(yè)務(wù)方向,以解放研發(fā)工作者的生產(chǎn)力為主要業(yè)務(wù)目標。
深勢科技具有強大的科研與產(chǎn)業(yè)落地能力。其新一代分子模擬算法在保持量子力學精度的基礎(chǔ)上,將分子動力學的計算速度提升了至少五個數(shù)量級,且對算力的需求與體系的原子數(shù)量呈線性依賴;結(jié)合高性能計算,能夠?qū)?shù)十億原子規(guī)模的體系進行量子力學精度的計算模擬。團隊核心成員獲得2020年全球計算機高性能計算領(lǐng)域的最高獎項“戈登·貝爾獎”,相關(guān)工作當選2020年中國十大科技進展,以及2020年全球人工智能十大科技進展。
公司核心團隊由中國科學院院士領(lǐng)銜,研發(fā)隊伍由物理建模、數(shù)值算法、機器學習、高性能計算及藥物和材料計算等多個領(lǐng)域的數(shù)十名優(yōu)秀青年科學家和工程師構(gòu)成。