人工智能已經(jīng)滲透到我們的日常生活中。最初,它在一些機器人和大熱的ChatGPT中為人所知,而現(xiàn)在它在比薩餅和啤酒廣告中都不難發(fā)現(xiàn)。雖然人工智能可能不完全可靠,但似乎有時我們自己對人工智能的處理也不完全值得信賴。


冷泉港實驗室(CSHL)助理教授Peter Koo發(fā)現(xiàn),使用流行的計算工具來解釋人工智能預測的科學家在分析DNA時發(fā)現(xiàn)了太多的"噪音",在這種情況下是一種額外的信息干擾。他找到了一種方法來解決這個問題?,F(xiàn)在,只需幾行新代碼,科學家就可以從被稱為深度神經(jīng)網(wǎng)絡的強大人工智能中獲得更可靠的解釋,這意味著他們可以繼續(xù)追尋更準確的計算后的DNA特征。這些特征可能只是健康和醫(yī)學的下一個突破的信號,但是,如果信號被太多的噪音所淹沒,科學家就不會看到這些信號。
那么,是什么導致了這些意外亂入的噪音?這是一個神秘的、不可見的來源,如數(shù)字"暗物質(zhì)"。物理學家和天文學家認為,宇宙中的大部分都充滿了暗物質(zhì),一種施加引力效應的物質(zhì),但還沒有人看到。同樣地,Koo和他的團隊發(fā)現(xiàn),人工智能被訓練的數(shù)據(jù)缺乏關鍵信息,導致了重大盲點。更糟糕的是,在解釋人工智能對DNA功能的預測時,這些盲點會被考慮進去。
Koo說:"深度神經(jīng)網(wǎng)絡正在納入這種隨機行為,因為它到處學習功能。但DNA只在其中的一個小子空間。而且它引入了很多噪音。因此我們表明,這個問題實際上確實在各種突出的人工智能模型中引入了大量的噪音。"
數(shù)字暗物質(zhì)是科學家們借用計算機視覺人工智能的計算技術的結(jié)果。DNA數(shù)據(jù)與圖像不同,被限制在四個核苷酸字母的組合中:但像素形式的圖像數(shù)據(jù)可以是長而連續(xù)的。換句話說,我們正在給人工智能提供一個它不知道如何正確處理的輸入。
通過應用Koo的計算校正,科學家可以更準確地解釋AI的DNA分析。他說:"我們最終看到的結(jié)果變得更加清晰和干凈,而且其他區(qū)域的虛假噪音也更少。"
Koo認為噪音干擾影響的不僅僅是基于AI的DNA分析儀。他認為這是在涉及類似類型數(shù)據(jù)的計算過程中普遍存在的一種困擾。值得慶幸的是,新發(fā)明的工具可以幫助科學家走出黑暗,走向光明。