機器人記者時代似乎已經到來。今年6月,美聯(lián)社宣布將使用軟件自動生成與大學體育相關的新聞內容,這是過去報道中并未嘗試過的報道方法。他們?yōu)檫@個整合生成新聞內容的軟件起了一個詩意的名字——“寫作者”,它由坐落于北卡羅萊納州的一家名叫自動化觀察的公司所發(fā)明。事實上,美聯(lián)社也是自動化觀察公司的投資方之一,通過“寫作者”軟件為公司撰寫了大量季度收益報告。在專業(yè)軟件出現(xiàn)之前也有類似案例,就在去年,《洛杉磯時報》的一名記者就利用傳統(tǒng)軟件在洛杉磯地震發(fā)生幾分鐘之后便發(fā)出了報道。


目前只是輔助
據(jù)BBC報道,2014年3月18日,美國洛杉磯早晨發(fā)生4.4級地震,機器人記者撰寫了這篇新聞,讓《洛杉磯時報》成為第一個發(fā)布地震報道的報紙。背后的故事是:身為記者和程序員的肯·斯溫科在當時發(fā)明了一種算法,在地震發(fā)生時能自動生成簡短的文章,提供重要的數(shù)據(jù)和信息。當系統(tǒng)接收到美國地質勘探局電腦系統(tǒng)發(fā)出的地震信息后,就自動將數(shù)據(jù)輸入事先準備好的模板里,一篇報道就此形成。而當初這篇報道從成型到網上發(fā)布只用了3分鐘左右。
和地震報道的模式一樣,《洛杉磯時報》還使用另一個算法來生成大量城市犯罪的新聞報道,然后由人類編輯來把關和篩選哪些需要受眾更多地關注。除了自然災害和犯罪,其實很多新聞機構已經在體育報道領域廣泛地使用機器人寫作,不難想象,未來將會涉及更多領域。
此外,機器人寫作者還在華爾街找到工作。在美國,一款名為“羽毛”的軟件正在成為金融投資公司的得力助手。它的工作內容是統(tǒng)計分析數(shù)據(jù),尋找與關鍵詞相關的重大事件和趨勢,生產與破產、利潤與收入這些概念密切相關的有價值信息,它最大的特點是可以基于某種特定的角度撰寫內容,并調整文章所需的語言風格。事實上,“自然語言風格一代”的寫作軟件一直以來是被研究的課題,它的問世將與新聞報道息息相關。越來越多的人意識到:如果不能被充分理解,那么大量的數(shù)據(jù)和可視化的呈現(xiàn)并無太大意義。當機器人寫作能夠更加深入和靈活的時候,也是其商業(yè)模式真正成功的一天。
那么,究竟機器人能不能取代新聞記者、編輯?自動化觀察公司首席執(zhí)行官羅比·艾倫對“取代說”持否定態(tài)度。在他看來,機器人記者的出現(xiàn)從某種程度上來講,是人類記者的一種“解放”,讓記者們擺脫枯燥無味的數(shù)據(jù)收集和發(fā)布,工作變得更有意義和有趣了。
未來定制新聞
面對機器人記者的文章不斷呈現(xiàn),更實際的問題是,這些通過機器生成的內容會有人看嗎?羅比·艾倫認為,這個問題的提法本身就是錯誤的。雖然2014年一年內該公司生成了超過10億篇的報道文章,但大部分的內容對大多數(shù)受眾其實并沒有太大意義。相反,“寫作者”軟件的角色更像是一位個人數(shù)據(jù)科學家。它所做的是篩選大量數(shù)據(jù),對其進行分析和自動匹配,因此,它所生產的報道往往是針對某一類特定受眾的。
舉例來說,雅虎推出了虛擬足球賽這款游戲,在比賽季期間,“自動化觀察”為數(shù)百萬的雅虎用戶生成每日賽事總結報道。甚至有一天,你可能擁有自己私人的機器人記者,除了提供每日適合你的新聞內容以外,它還能實時通過數(shù)據(jù)跟蹤你的健康狀況和個人財務狀況等,并提供相應的報告。
“寫作者”目前做的就是兩件事。第一,它吸納大量有效數(shù)據(jù)并在此基礎上進行深入分析,找到有趣的報道點;第二,將這些觀察轉化為人類可以理解和閱讀的文本內容。你可以把它想象成更高級、更復雜的填詞游戲,它需要你對數(shù)據(jù)和寫作具有相當深厚的理解功力。
目前,“寫作者”只能夠基于結構化并且定量的數(shù)據(jù),通俗來講,就是那些躺在電子表格中和數(shù)據(jù)庫里的數(shù)字。在未來,類似軟件的方向就是進一步向自動化搜索和撰寫長篇報道、改寫新聞稿件,或是通過篩選非結構化的數(shù)據(jù)文件而生成觀點性的評論等。
就在今年7月,自動化觀察公司被私募股權公司Vista收購,它擁有體育數(shù)據(jù)公司STATS和商業(yè)智庫TIBCO。羅比·艾倫對此充滿期待,他表示,機器人記者是一個值得深挖的領域。
可以期待的是,更多的新聞故事將為受眾量身定制。