“當前AI(人工智能)正處于快速演化的關(guān)鍵階段?!苯眨本┲嘘P(guān)村學院院長劉鐵巖在2025基礎科學與人工智能論壇上表示,大模型、具身智能與科學智能三者深度融合,構(gòu)成推動AI加速進化的“知識飛輪”。
當“知識飛輪”真正高效轉(zhuǎn)動時,AI在某些維度上的學習與再生能力可能超過人類。然而,劉鐵巖直言,AI發(fā)展仍面臨算力瓶頸、數(shù)據(jù)枯竭、評測滯后等一系列結(jié)構(gòu)性挑戰(zhàn)。
本次論壇是“2025國際基礎科學大會”特別活動之一,劉鐵巖和清華大學電子工程系主任汪玉、美國紐約州立大學石溪分校教授顧險峰、曦智科技創(chuàng)始人兼首席執(zhí)行官沈亦晨等多位專家圍繞AI的根本范式、算力瓶頸等議題展開討論。
面臨多重挑戰(zhàn)
當前,隨著AI邁入復雜推理和多模態(tài)理解的新階段,傳統(tǒng)過度依賴堆疊算法、數(shù)據(jù)的“大力出奇跡”路徑已難以再進一步拓展AI發(fā)展的邊界。
劉鐵巖指出,首先面臨的是數(shù)據(jù)瓶頸。他表示,作為大模型必不可少的“養(yǎng)料”,數(shù)據(jù)短缺制約其發(fā)展,盡管業(yè)界嘗試拓展多模態(tài)輸入、合成數(shù)據(jù)生成、交互數(shù)據(jù)采集等方式,但仍面臨質(zhì)量、成本和驗證機制等挑戰(zhàn)。
“當前AI系統(tǒng)普遍面臨模型智能水平持續(xù)提升,其推理能效卻不斷下降的矛盾?!蓖粲裰赋?,Token(詞元)是人工智能時代核心的生產(chǎn)要素,未來要更關(guān)注單位能耗下可生成的有效Token數(shù)量,只有當生產(chǎn)與應用的成本足夠低廉、智能水平足夠可靠、系統(tǒng)規(guī)模足夠可擴展時,才能迎來真正意義上的產(chǎn)業(yè)革命。
然而,如何衡量、判斷不同大模型的推理能效?劉鐵巖坦言,現(xiàn)有的模型評測體系容易被“對癥”優(yōu)化、“刷榜”提分,急需引入任務導向、動態(tài)更新與專家混合評估機制,推動評測體系回歸本質(zhì)。
是否具備原創(chuàng)能力
“缺乏因果建模的能力是當前AI在自然科學、數(shù)理建模等任務上受到限制的原因。”針對AI發(fā)展的瓶頸與限制,顧險峰指出,目前AI仍以相關(guān)性建模為主,而真正的科學建模不能僅靠大量數(shù)據(jù)推導模式,而是需要簡約假設、邏輯自洽的因果體系。
劉鐵巖則認為,部分大模型已經(jīng)能“聽懂”人類語言。在完成邏輯推理、數(shù)學解題、文本論證等任務時,具備對“因為”“所以”等因果性文本結(jié)構(gòu)的識別和理解能力,但在語義層面,是否真正理解文本背后的因果邏輯尚不明確。
近年來,多模態(tài)大模型的發(fā)展成了新熱點。當認知對象從文本拓展到圖像、視頻,是否需要徹底摒棄token預測,轉(zhuǎn)向“世界模型”等新范式?
對此,汪玉持樂觀態(tài)度。如果人類能夠通過語言準確描述某一對象或規(guī)律,AI就能借助模型實現(xiàn)理解和總結(jié);如果人類無法找到合適的語言描述方式,AI也無能為力。
此外,AI是否具備原創(chuàng)能力也是本次討論熱點。
“在科學研究中,重大理論的提出絕非數(shù)據(jù)堆積所能催生。最關(guān)鍵的一步轉(zhuǎn)化,AI永遠抓不住?!鳖欕U峰直言。
沈亦晨則表示,盡管AI可以在大多數(shù)工程化問題中大顯身手,但在解決10%原創(chuàng)性突破問題方面仍力有不逮。
劉鐵巖從產(chǎn)業(yè)視角指出,未來AI在“從類比中發(fā)現(xiàn)新結(jié)構(gòu)”方面具有巨大潛力,尤其是在AI for Science(人工智能驅(qū)動科學研究)的具體子任務中表現(xiàn)出色。
“真正的突破”
“AI要想走向大規(guī)模應用,必須突破能效瓶頸?!蓖粲駨娬{(diào),這對構(gòu)建下一代AI系統(tǒng)基礎提出更高要求,不僅要處理數(shù)字信息,更需實時感知物理環(huán)境,與傳感器和執(zhí)行器深度融合。
對此,汪玉系統(tǒng)介紹了提升AI系統(tǒng)性能的兩條路徑:一是保持能效水平的同時提升智能水平,二是通過軟硬件協(xié)同優(yōu)化,提高單位能耗下的推理能力。他說:“只有算法與芯片協(xié)同優(yōu)化,才能實現(xiàn)真正意義上的系統(tǒng)能效提升?!?/span>
然而,當前大模型對算力依賴正呈指數(shù)級增長的趨勢。清華大學人工智能研究院常務副院長孫茂松舉例稱,最新一代大模型訓練耗資約100億美元,需要20萬張圖形處理器(GPU)卡支持,預計2035年突破1億張卡。
“百萬卡級別的計算已成為現(xiàn)實挑戰(zhàn)。”沈亦晨回應道,盡管當前業(yè)界在傳統(tǒng)電子芯片架構(gòu)內(nèi)嘗試了多種優(yōu)化策略,但這些仍局限于晶體管架構(gòu)內(nèi)部優(yōu)化,算力上限仍受制于單位面積可集成晶體管數(shù)的物理天花板。
沈亦晨提出,要想充分發(fā)揮光計算的高能效優(yōu)勢,需要在算法層面推動向低精度模型優(yōu)化。“同時,通過光作為連接介質(zhì),可以極大提升芯片間通信帶寬與效率,解決分布式模型訓練中‘多芯片如一芯片’的問題?!?/span>
汪玉補充道,無論是光計算還是電計算,關(guān)鍵是讓底層硬件異構(gòu)對開發(fā)者透明,即“看起來就是一臺機器”,進而保障工程系統(tǒng)的穩(wěn)定性和遷移效率。
“真正的AI下半場,將是由經(jīng)驗驅(qū)動的AI?!眲㈣F巖拋出一種全新的范式設想,由100萬個機器人在物理世界中實現(xiàn)全域智能協(xié)同,“這將超越大模型集中訓練范式,形成全新的進化路徑”。
面向未來,孫茂松提出:“真正的突破,有賴于我們在理論與系統(tǒng)兩端都邁出新的一步?!?/span>