據(jù)路透社報(bào)道,非營(yíng)利機(jī)構(gòu) METR 的最新研究發(fā)現(xiàn),和大家普遍認(rèn)為的相反,經(jīng)驗(yàn)豐富的軟件開發(fā)者在使用最先進(jìn)的 AI 工具輔助熟悉的代碼庫(kù)時(shí),反而變得更慢,而不是更快。
該機(jī)構(gòu)對(duì)一批資深開發(fā)者進(jìn)行了深入調(diào)查,他們用流行的 AI 編程助手 Cursor 來完成自己熟悉的開源項(xiàng)目任務(wù)。
研究開始前,這些開發(fā)者預(yù)計(jì) AI 能讓自己的工作速度提升,估計(jì)任務(wù)時(shí)間會(huì)縮短 24%。完成任務(wù)后,他們依然覺得自己節(jié)省了 20% 的時(shí)間。但研究數(shù)據(jù)顯示,AI 實(shí)際讓任務(wù)完成時(shí)間增加了 19%。
研究負(fù)責(zé)人喬爾?貝克和內(nèi)特?拉什表示,這結(jié)果令人非常意外。拉什甚至在研究前預(yù)期速度會(huì)翻倍。
這項(xiàng)發(fā)現(xiàn)挑戰(zhàn)了“AI 能顯著提升高薪工程師效率”的普遍看法,而這正是吸引大量投資進(jìn)軍 AI 軟件開發(fā)領(lǐng)域的重要原因。更有甚者,還將 AI 看作將初級(jí)程序員崗位的“替代品”。
過去研究中,AI 在提升開發(fā)效率上取得了顯著成果:一項(xiàng)顯示程序員速度提高了 56%,另一項(xiàng)表明開發(fā)者在固定時(shí)間內(nèi)能多完成 26% 的任務(wù)。
但 METR 的新研究表明,這些積極結(jié)果并不適用于所有情況。尤其是對(duì)熟悉大型成熟開源代碼庫(kù)的資深開發(fā)者來說,反而出現(xiàn)了效率下降。
研究作者指出,很多相關(guān)研究依賴 AI 開發(fā)的基準(zhǔn)測(cè)試,這些測(cè)試未必能真實(shí)反映現(xiàn)實(shí)工作任務(wù)。IT之家從報(bào)道中獲悉,效率變慢的主要原因,是開發(fā)者需要花時(shí)間檢查和修正 AI 給出的代碼建議。
貝克說:“AI 提出的建議方向基本正確,但細(xì)節(jié)上并非完全符合實(shí)際需求?!?/span>
作者強(qiáng)調(diào),這種變慢不太可能出現(xiàn)在初級(jí)開發(fā)者或?qū)Σ皇煜ごa庫(kù)的工程師身上。
不過大部分參與研究的開發(fā)者和作者本人依然使用 Cursor。他們認(rèn)為,AI 讓開發(fā)過程更輕松愉快,就像修改一篇文章,而不是從空白開始寫作。貝克表示:“開發(fā)者的目標(biāo)不僅是盡快完成任務(wù),他們更愿意選擇這條付出更少努力的路?!?/span>