
Narrative ScienceQuill自然語言處理奇點
利用軟件撰寫新聞,已經(jīng)發(fā)展成為一個新職業(yè):為金融寡頭和情報機構(gòu)起草報告。
這款名為Quill的寫作軟件由創(chuàng)建于2010年的Narrative Science推出,它能將數(shù)值轉(zhuǎn)化為有故事情節(jié)的敘述文。Quill曾被用來撰寫電視及網(wǎng)絡上棒球賽事的比賽報告,《福布斯》也是該公司的客戶。
占領(lǐng)華爾街
Quill早期的成功在于能自行生成合理的標題,有人看到了智能軟件取代人工的可能性。公司CEO Stuart Frankel表示,盡管有些人不看好Quill,但他們的意見是改進和完善產(chǎn)品的動力。大量的報告表示,Quill還會威脅到很多人的工作。
如今,Narrative Science還將Quill租給T. Rowe Price、瑞士信貸、USAA等金融客戶,幫助其撰寫更加深入、冗長的共同基金業(yè)績報告。“原先需要一小幫人花費數(shù)周才能完成的工作,如今只要幾秒鐘”,F(xiàn)rankel說道,“我們?yōu)橐恍┙鹑诳蛻糇珜懙膱蟾嬖?0-15頁之間”。
另外,一筆來自美國中央情報局投資部In-Q-Tel的投資,使得該公司也開始為美國情報機構(gòu)服務。不過Frankel表示,“與情報機構(gòu)打交道跟其他客戶沒什么區(qū)別”。現(xiàn)在Quill每天生成文件初稿的字數(shù)在百萬級別。
可勝過人類,但仍是機器
利用軟件編寫的報告令人印象深刻,當然沒有數(shù)值數(shù)據(jù)的支持是無法完成報告的。軟件的編寫有一些特點:
軟件將對數(shù)據(jù)進行統(tǒng)計分析,試圖找出特殊事件或某種趨勢,同時不斷地與破產(chǎn)、利潤、稅收等相關(guān)概念進行匹配。
公司還可以根據(jù)所寫內(nèi)容,選擇Quill的寫作風格以及語言特點。它可以著重強調(diào)一份營銷文案的積極方面,也可以挖掘出一份監(jiān)管備案文件中詳盡的細節(jié)。
Quill還能選擇創(chuàng)作的角度。當為某個球隊的觀眾撰寫賽事報告時,它會對球隊的負面新聞一帶而過。
Narrative Science的首席科學家Kristian Hammond表示,Quill是由結(jié)構(gòu)化語句、段落以及頁面構(gòu)成的符合寫作規(guī)范的程序。“我們知道如何引出一個想法,如何避免重復,如何縮減篇幅”。當然人們一眼就能看出文件是由機器編寫的。
Quill的工作原理細節(jié)沒有被公布,但有專家表示,Quill之所以能從不同角度撰寫報告,是因為它之前編寫過類似的報告。
數(shù)據(jù)太多,人類忙不過來
近年來,自然語言生成軟件的研究不曾間斷,這類研究的商業(yè)化也越來越多,White介紹說。越來越多的人意識到,如果不能對大量數(shù)據(jù)和圖表進行解釋,它們是沒有任何意義的,這也是自然語言處理實現(xiàn)商業(yè)化的機會。
一家名為Arria的英國公司也致力于自然語言生成技術(shù)的研究,另外還有去年成立的OnlyBoth,計劃在2015年推出其第一款寫作軟件。
目前,所有的這類公司都專注于服務企業(yè)。但隨著汽車、醫(yī)療設備以及家用電器都開始聯(lián)網(wǎng), 多數(shù)家庭并不能對設備的數(shù)據(jù)進行科學的分析,而自然語言處理技術(shù)能成為溝通機器與人類的橋梁。