加拿大薩斯喀徹溫省的高中教師兼教練安?約翰遜(Ann Johnson)在 2005 年因腦干中風導致近乎完全癱瘓,此后一直飽受閉鎖綜合征的折磨。這種罕見病癥使患者意識清醒,卻無法言語或行動。18 年來,約翰遜依靠眼動追蹤系統(tǒng)以每分鐘 14 個詞的速度與外界溝通,遠低于正常人每分鐘約 160 個詞的對話速度。然而,如今她終于再次聽到了自己的聲音,這得益于一種腦機接口(BCI)技術,該技術能夠直接從大腦活動中解碼語言。
2022 年,約翰遜成為加州大學伯克利分校和加州大學舊金山分校聯(lián)合開展的一項臨床試驗的第三位參與者。這項試驗旨在通過一種神經(jīng)假體恢復嚴重癱瘓患者的語言能力。研究人員通過植入神經(jīng)假體,從大腦的語言運動皮層記錄信號,繞過受損的神經(jīng)通路,從而產(chǎn)生可聽的語音。
據(jù)IT之家了解,該設備依賴于放置在大腦語言生成區(qū)域上方的植入物,當約翰遜嘗試說話時,植入裝置會檢測到神經(jīng)活動,并將信號傳輸?shù)竭B接的計算機。隨后,人工智能解碼器將這些信號轉(zhuǎn)化為文本、語音或數(shù)字形象上的面部表情。最初,該系統(tǒng)使用了序列到序列的人工智能模型,需要完整的一句話才能輸出結果,導致會有 8 秒的延遲。然而,2025 年 3 月,研究團隊在《自然神經(jīng)科學》雜志上報告稱,他們已轉(zhuǎn)向流式架構,實現(xiàn)了僅 1 秒延遲的近實時翻譯。
為了使體驗更加個性化,研究人員利用約翰遜 2004 年婚禮演講的錄音重現(xiàn)了她的聲音。她還選擇了一個與自己外貌相符的虛擬形象,該形象能夠模仿微笑或皺眉等面部表情。
加州大學伯克利分校電氣工程與計算機科學助理教授戈帕拉?阿努曼奇帕利(Gopala Anumanchipalli)、加州大學舊金山分校神經(jīng)外科醫(yī)生愛德華?張(Edward Chang)以及伯克利分校博士生凱洛?利特爾約翰(Kaylo Littlejohn)表示,他們的目標是使神經(jīng)假肢實現(xiàn)“即插即用”,將其從實驗系統(tǒng)轉(zhuǎn)變?yōu)闃藴逝R床工具。未來改進的方向可能包括無線植入裝置,從而無需直接連接計算機,以及更加逼真的虛擬形象,以實現(xiàn)更自然的互動。研究團隊還設想開發(fā)數(shù)字“克隆人”,不僅能復制用戶的聲音,還能模仿其對話風格和視覺信號。
這項突破有望幫助那些因中風、肌萎縮側索硬化癥(ALS)或受傷而失去語言能力的相對小眾但極為脆弱的群體,讓他們重新獲得更快速、更自然的溝通能力。研究人員強調(diào),該系統(tǒng)只有在參與者有意識地嘗試說話時才會工作,從而確保用戶的自主性和隱私。
對于約翰遜來說,這次試驗徹底改變了她的生活?!拔蚁M颊呖吹轿?,知道他們的生活并未結束,”她在接受加州大學舊金山分校采訪時說。她期待有一天能在康復中心擔任咨詢師,借助神經(jīng)假肢與客戶交流。
隨著延遲時間降至約 1 秒,以及人工智能建模的持續(xù)進步,研究人員相信,實用的實時語音恢復技術有望在幾年內(nèi)實現(xiàn),這將徹底改變技術為失去語言能力的人們賦予聲音的方式。