據(jù)外媒 New Atlas 14 日?qǐng)?bào)道,腦機(jī)接口技術(shù)迎來(lái)一項(xiàng)重大突破:加州大學(xué)戴維斯分校研發(fā)的新型植入系統(tǒng),讓一位癱瘓患者不僅能順暢說(shuō)話,甚至還能借助電腦“哼唱”旋律,幾乎沒有任何延遲。
研究團(tuán)隊(duì)在一位漸凍癥患者身上試驗(yàn)了這項(xiàng)技術(shù)。通過(guò)在大腦中控制發(fā)音的區(qū)域植入四組微電極陣列,系統(tǒng)能實(shí)時(shí)捕捉說(shuō)話時(shí)產(chǎn)生的神經(jīng)信號(hào),再結(jié)合低延遲處理和 AI 解碼模型,將這些信號(hào)同步轉(zhuǎn)化為語(yǔ)音,在揚(yáng)聲器中播放。
需要強(qiáng)調(diào)的是,這項(xiàng)技術(shù)并不是在“讀心”,而是識(shí)別出患者嘗試發(fā)聲時(shí)大腦發(fā)出的運(yùn)動(dòng)指令。系統(tǒng)合成出的聲音與患者本人極為相似 —— 這得益于在其發(fā)病前錄制的語(yǔ)音樣本訓(xùn)練出的聲音克隆算法。
從信號(hào)采集到語(yǔ)音生成,全程只需 10 毫秒,幾乎可以實(shí)現(xiàn)實(shí)時(shí)對(duì)話。
系統(tǒng)還能識(shí)別出患者試圖唱歌的動(dòng)作,判斷其想表達(dá)的音高,并據(jù)此合成旋律。在研究團(tuán)隊(duì)發(fā)布的視頻中,這一功能尚顯初級(jí),但對(duì)于那些逐漸失去表達(dá)能力的人來(lái)說(shuō),無(wú)疑是一種重獲聲音的希望。
該研究論文的資深作者 Sergey Stavisky 表示,這一進(jìn)展為腦機(jī)語(yǔ)音合成帶來(lái)了轉(zhuǎn)折點(diǎn)。他說(shuō):“借助即時(shí)語(yǔ)音輸出,神經(jīng)義體用戶能真正參與對(duì)話 —— 他們可以打斷別人,也更不容易被別人誤打斷。”
該系統(tǒng)能復(fù)現(xiàn)“啊”“喔”“嗯”等語(yǔ)氣詞,判斷句子是疑問(wèn)還是陳述,甚至辨別出強(qiáng)調(diào)詞語(yǔ)的位置。研究團(tuán)隊(duì)還指出,系統(tǒng)能準(zhǔn)確合成此前從未見過(guò)的虛構(gòu)詞語(yǔ)。這使得語(yǔ)音表達(dá)更自然、更具表現(xiàn)力。
IT之家從報(bào)道中獲悉,研究人員也指出,目前試驗(yàn)僅在一位患者身上進(jìn)行,下一步將拓展至其他因不同原因喪失語(yǔ)言能力的人群,以驗(yàn)證技術(shù)的普適性。