IT之家3月21日消息,AI浪潮席卷而來,此前不少人認(rèn)為“提示詞工程師”會成為新興工種,而MindEye的問世表明,這個崗位或許沒有存在的價值了。
此前不少人認(rèn)為,未來AI時代并不在于某個模型是否強大,而是在于人類是否能夠更高效利用這些AI模型,完成特定任務(wù)。
這也誕生了“提示詞工程師”概念,該工程師能夠比普通人更能理解AI,能夠提出更準(zhǔn)確的提示詞,從而讓AI滿足其要求輸出。
而StabilityAI于2023年7月推出MindEye1,近日再次推出了MindEye2,讓“提示詞工程師”的價值大幅降低,該模型并不依賴于特定的提示詞,而是直接基于用戶腦電波生成,也就是說用戶大腦想要什么,未來該模型就能生成什么。
MindEye直接從fMRI大腦活動中重建和檢索圖像,而且可以將二維圖像轉(zhuǎn)化為三維視頻。
功能磁共振成像(fMRI)是一種通過檢測血流變化來測量大腦活動的神經(jīng)成像技術(shù)。這項技術(shù)的作用是繪制大腦功能圖,評估治療神經(jīng)系統(tǒng)疾病的潛在方法。
MindEye基于參與者在核磁共振成像掃描儀上觀看一系列靜態(tài)圖像時的大腦活動記錄數(shù)據(jù)集。研究團(tuán)隊訓(xùn)練該系統(tǒng)分析這些記錄,并從候選庫中檢索原始圖像(檢索)或生成所查看圖像的重建圖像。
研究人員證明,MindEye在圖像檢索任務(wù)中的表現(xiàn)優(yōu)于以往的方法,從候選圖像中識別原始圖像的準(zhǔn)確率超過90%。在重建方面,MindEye使用預(yù)先訓(xùn)練好的生成模型。
MindEye可應(yīng)用于各個領(lǐng)域。在醫(yī)療領(lǐng)域,它從大腦活動中重建視覺感知的能力可用于診斷和評估方法,尤其是在病人難以溝通的情況下。MindEye的實時分析潛力有望改善腦機接口的性能。
研究小組強調(diào)了與數(shù)據(jù)收集有關(guān)的局限性,包括所需的冗長掃描時間,以及由于參與者移動或注意力不集中而可能產(chǎn)生的數(shù)據(jù)噪聲。