2018 年9月17 日,由國家工信部和上海市政府主辦的2018 人工智能大會“人工智能與實體經(jīng)濟深度融合發(fā)展論壇”在上海國際會議中心舉行,上海市委常委、常務(wù)副市長周波,工業(yè)和信息化部科技司副司長王衛(wèi)明,中國工程院院士鄔賀銓等出席論壇。字節(jié)跳動副總裁、人工智能實驗室負責人馬維英發(fā)表題為《人工智能賦能全球創(chuàng)作與交流平臺》的演講。
馬維英介紹稱,字節(jié)跳動通過6年發(fā)展,當前產(chǎn)品和服務(wù)已經(jīng)覆蓋150多個國家、75個語種,在40多個國家和地區(qū)位居應(yīng)用商店總榜前列。技術(shù)出海,是字節(jié)跳動全球化發(fā)展的核心戰(zhàn)略,人工智能技術(shù)是字節(jié)跳動全球化取得當前進展的關(guān)鍵。
基于人工智能技術(shù),字節(jié)跳動重新定義了人和信息的連接方式,在行業(yè)內(nèi)率先部署了大規(guī)模的人工智能模型。依托海量數(shù)據(jù),由馬維英領(lǐng)先的字節(jié)跳動人工智能實驗室專注于人工智能領(lǐng)域的前沿技術(shù)研究,并將研究成果應(yīng)用于公司全球產(chǎn)品中,利用人工智能幫助內(nèi)容創(chuàng)作、分發(fā)、互動,提升用戶的信息消費體驗。同時,實驗室也針對人工智能相關(guān)領(lǐng)域內(nèi)長期性和開放性問題進行研究,幫助公司實現(xiàn)對未來發(fā)展的構(gòu)想,促進人類信息與知識交流的效率與深度。
此次論壇還宣布字節(jié)跳動人工智能實驗室項目《基于分布式機器學(xué)習(xí)平臺的通用人工智能應(yīng)用解決方案》入選2018 國家工信部人工智能與實體經(jīng)濟深度融合創(chuàng)新項目。據(jù)了解,該創(chuàng)新項目將是建設(shè)「訓(xùn)練資源服務(wù)平臺」的主力軍。此次字節(jié)跳動成功入選不僅體現(xiàn)了國家對字節(jié)跳動在人工智能領(lǐng)域技術(shù)優(yōu)勢的認可,也是對字節(jié)跳動在人工智能領(lǐng)域這個方向上不斷探索創(chuàng)新的肯定。
以下為馬維英演講全文:
大家好!我是字節(jié)跳動人工智能實驗室負責人馬維英。今天非常高興與大家相聚在上海,共同探討人工智能的發(fā)展及應(yīng)用現(xiàn)狀,以及未來我們?nèi)绾斡肁I賦能新時代。
首先我們來回顧一下,在整個人類歷史洪流中,內(nèi)容的創(chuàng)作,信息的傳播和交流,一直是整個人類社會的基礎(chǔ)設(shè)施。在大約公元100年前的時候,蔡倫發(fā)明了造紙術(shù),人們開始用紙張來創(chuàng)作、傳播。紙張和書籍成了人與信息連接的最主要媒介。從一開始,中國就扮演這樣一個重要的角色,這些關(guān)鍵技術(shù)都是中國發(fā)明的。之后經(jīng)過很長一段時間,直到三四十年前,信息的連接方式才有了新的變革。
互聯(lián)網(wǎng)時代網(wǎng)站、網(wǎng)頁讓紙張消失,成為了我們的數(shù)字圖書館,我們開始使用搜索引擎,一鍵便可以直達自己的所需。
到了移動互聯(lián)網(wǎng)時代,紙張消失得愈加明顯,因為它讓信息無所不在,人類可以隨時隨地用智能手機接觸他所需要的信息。而且手機也變成一個人的網(wǎng)站,人可以用手機寫文章、拍攝視頻然后發(fā)布出來,并通過手機與其他人交流互動。原來在PC互聯(lián)網(wǎng)時代有很多的機構(gòu)媒體,到今天出現(xiàn)了無數(shù)自媒體,再到每個人都在創(chuàng)作,每個人都可以分享他的知識,他的生活的體驗,他的故事。從OGC、PGC再到UGC,在這個萬物互聯(lián)的時代,人與信息的連接可以做到無所不在。字節(jié)跳動這家公司就誕生于這樣的時代。它顛覆了搜索引擎,建立了全新的人與信息的連接方式。
到最近,人工智能時代到來,也許未來我們還將共同迎接“超級智能時代”的機遇和挑戰(zhàn)。今天有很多人問,那人工智能會不會取代人的創(chuàng)作呢?我個人相信人的想象,人的創(chuàng)作力,人的愛跟關(guān)懷是機器不可能取代的。所以我相信未來我們會進入一個人與機器互相幫助、互相學(xué)習(xí)的時代。人讓機器更聰明,但機器同時也可以幫助人釋放更多的想象力、創(chuàng)造力,各行各業(yè)都能夠用AI來重新定義我們的產(chǎn)業(yè)。
字節(jié)跳動這家公司有幾個比較重要的產(chǎn)品,第一個就是大家比較熟悉的今日頭條。它也是在中間連接兩端——一邊是信息的源頭,包含文字、圖片、視頻、直播、問答、AR、VR,它是全信息、全媒體、全內(nèi)容的平臺。另外一端是人,不單是個人,我們有興趣小組,有社群。
PC時代的搜索,沒辦法做到個性化、社交化、移動化、無所不在化。今天我們利用新的技術(shù),重新顛覆。字節(jié)跳動一邊讓AI學(xué)習(xí)大量的形式多樣化的理解內(nèi)容,另一邊我們?yōu)槊總€人建模——根據(jù)每一個人的興趣愛好和他的使用行為。我們將搜索引擎里所有排序、分析等技術(shù),都用于進一步的個性化精準推薦,從而變成信息流。信息流是一種新的、更智能的方式,讓人能夠隨時隨地獲取他所要的信息。這時候手機就相當于一個助理,能夠像助理一樣理解他,為他提供他所需要的信息。
過去一兩年,短視頻成為一種在世界范圍內(nèi)最受歡迎的信息生產(chǎn)與消費形式。字節(jié)跳動旗下短視頻產(chǎn)品的代表抖音也風(fēng)靡全球。
今年一季度,抖音下載量超越Facebook、Youtube、Instagram等,成為全球下載量最高的iPhone應(yīng)用;抖音的全球化布局始于2017年8月,截至目前,抖音海外版TikTok已覆蓋全球150多個國家,抖音及海外版TikTok全球月活已經(jīng)突破5億。
隨著TikTok在海外接連獲得佳績,抖音已經(jīng)成為中國產(chǎn)品在海外獲得成功的一個典型,被視作中國移動產(chǎn)品出海的新模式。作為一款中國產(chǎn)品,抖音在全世界范圍成了受喜愛的內(nèi)容傳播平臺,我想對于我們中國文化走出國門影響全世界,抖音應(yīng)該可以發(fā)揮積極的助力作用。
但建立這樣一個公開、開放的平臺,任務(wù)是非常艱巨的。因為每一位用戶都能夠自己上傳內(nèi)容,于是我們需要做非常多的事情。我們必須為這些內(nèi)容做審核、分類、查看是否侵犯版權(quán)、做推薦,還要做相似性的搜索,語義的搜索。而這些都離不開人工智能的幫助。
臺下如果有熟悉抖音的來賓,應(yīng)該會對抖音的各種特效、濾鏡、創(chuàng)意玩法印象深刻??梢哉f這些正是這款產(chǎn)品制勝的關(guān)鍵原因之一。而它們都是AI技術(shù)在短視頻中的應(yīng)用。
我們通過人臉和其他人體關(guān)鍵點檢測與追蹤,可以實現(xiàn)玩變臉等創(chuàng)意效果,尬舞機、控雨、控花瓣等等都是抖音非常受歡迎的玩法。我們的視頻切割技術(shù)還能實現(xiàn)染發(fā)、背景替換等各種效果。
除了應(yīng)用于短視頻產(chǎn)品,字節(jié)跳動的人工智能技術(shù)還通過我們的多款產(chǎn)品賦能信息創(chuàng)作與交流的各個環(huán)節(jié)。
我們通過自然語言理解和自然語言生成,自研了一個寫稿機器人。xiaomingbot寫作機器人獲得了吳文俊人工智能科學(xué)技術(shù)獎。小明能夠自動寫作,特別是一些垂直領(lǐng)域,像體育、房產(chǎn)、汽車、天氣等相關(guān)的新聞,小明可以每天產(chǎn)生新聞播報。
相比于人類作者,小明的效率和產(chǎn)量高。一個體育比賽結(jié)束之后兩秒鐘,我們的自動轉(zhuǎn)播,自動寫作的報導(dǎo)就上線了。過去一段時間小明已經(jīng)有了幾萬粉絲,他寫的東西獲得了幾十億次閱讀。小明寫作還支持很多的語言,除了中文之外,有英文,和其他的語言。那下一個就讓大家看一下小明的工作基本原理。他其實分析了多種數(shù)據(jù)源頭包含的文本、圖片、視頻。
大家現(xiàn)在看的是2018年世界杯中比利時對日本的那場比賽??梢钥吹?,小明能實時對這個視頻做理解,通過視覺識別球員和他背后的編碼,自動生成描述文本。例如“某某球員在某個時間進球”。
自動寫作體育新聞可以實現(xiàn)體育轉(zhuǎn)播千人千面。每個人你可以看你喜歡的球員,而不是說每個人獲取的報導(dǎo)都一樣。你可以專注你想專注的球隊或球員,而且我可以把這個球員立體的信息,他的勝負率,他本賽季表現(xiàn)如何,容納到你看到的報導(dǎo)里面。
我們?nèi)虻挠脩裘刻靹?chuàng)造出海量內(nèi)容,這意味著什么呢,意味著同時我們的審核任務(wù)和壓力是巨大的。為此我們建立了600多個審核模型,擁有近億條數(shù)據(jù)的龐大數(shù)據(jù)庫。人工智能輔助審核需不僅要對文字、圖片做識別,還要識別語音、視頻。有時候視頻看的沒有問題,但語音有問題,語音我們也需要轉(zhuǎn)成文字,進一步再識別。這些圖像、文字、視頻識別模型經(jīng)過訓(xùn)練,可以大大提高審核的自動化程度。
人工智能加上我們的審核人員就形成閉環(huán),AI是我們?yōu)閷徍巳藛T訓(xùn)練出來的工具。同時,審核團隊在工作中提供了很多標注,監(jiān)督式機器學(xué)習(xí)可以使用這個大數(shù)據(jù)來訓(xùn)練自動視頻理解系統(tǒng)。而訓(xùn)練后的系統(tǒng)再給審核人員用,那他們就能更高效地審核,并且能提供更多的反饋和新的標注數(shù)據(jù)。所以人和機器是共同學(xué)習(xí)的,機器幫人,人又幫機器,形成正向循環(huán),不斷地迭代大數(shù)據(jù)。
目前我們的人工智能大概為公司節(jié)省了十萬級別的人力。如果沒有人工智能輔助審核,那我們的審核團隊人數(shù)就將是現(xiàn)在的很多倍。我們也有計劃把這些數(shù)據(jù)能夠標準化和公開,也可以搞競賽,讓學(xué)術(shù)界更多的研究人員能夠利用這些數(shù)據(jù)來做研究。
這就是我們一直在努力做的事——建設(shè)新一代人工智能驅(qū)動的信息平臺,連接人和信息,從內(nèi)容創(chuàng)作、過濾、審核、分發(fā)、搜索、消費以及互動的每個環(huán)節(jié),促進創(chuàng)作和交流。
從圖上我們可以看到,從信息的創(chuàng)作端的創(chuàng)作者,到信息消費端的讀者,每一個中間人與信息連接的都是一個信息流。字節(jié)跳動建設(shè)這個這個人工智能的基礎(chǔ)設(shè)施+服務(wù)平臺,可以支撐整個公司數(shù)據(jù)的處理、分析、挖掘、理解、組織。同時又能讓人工智能進一步學(xué)習(xí)這里面每一個環(huán)節(jié)的語義表達方式。
未來整個社會要從數(shù)字化進一步走到智能化表達。今天人工智能可以用來學(xué)習(xí)從數(shù)字表達到語義表達的轉(zhuǎn)換,因為數(shù)字化之后還不夠,計算機無法直接理解, 人工智能學(xué)習(xí)語義表達全世界,在那個空間里計算機的能力就可以發(fā)揮。用向量計算加加減減就知道圖像里面是什么,加加減減就知道它的內(nèi)容能產(chǎn)生什么樣的情感,是悲傷、是快樂,是害怕,對內(nèi)容有產(chǎn)生情感的認知。
我們也希望這樣一個新一代的人工智能驅(qū)動的信息平臺建設(shè)完成之后我們能夠進一步去賦能,能夠?qū)ν馊ポ敵鲞@些能力,能夠幫助其他的企業(yè),能夠利用AI去賦能更多行業(yè)和應(yīng)用場景,可以是醫(yī)療、教育、財經(jīng)、媒體,或者說一些新的內(nèi)容,例如說垂直的應(yīng)用。
為了實現(xiàn)我們的這些構(gòu)想,用人工智能賦能新時代,我們字節(jié)跳動人工智能實驗室一直在不斷鉆研探索。我們目前主要的研究領(lǐng)域包括機器學(xué)習(xí)、自然語言理解、計算機視覺、人機交互與機器人等方向,我們實驗室有一群國內(nèi)外一流高校畢業(yè)的科學(xué)家以及擁有多年一線機器學(xué)習(xí)應(yīng)用開發(fā)經(jīng)驗的工程師團隊,一起專注人工智能領(lǐng)域的前沿技術(shù)研究,一同攻關(guān)克難。
和歷次工業(yè)革命一樣,我們?nèi)缃襁~入人工智能時代,是人類社會了不起的進步。而技術(shù)的進步最終是服務(wù)于人類的。我們鉆研技術(shù)不僅是鉆研技術(shù)本身,更重要的是研究如何用它來解決人類社會的難題。
幾年前,我們就開始將人工智能結(jié)合產(chǎn)品功能積極服務(wù)于公益。比如借由我們的精準推送,根據(jù)他的走失時間、地點,把走失者的信息推送給這些可能有信息線索的人。目前整個頭條尋人,已經(jīng)找到了超過7000人,應(yīng)該是中國尋人機構(gòu)找回走失者最多的,平均每天至少找到10位,最多的時候一天找回29位。我們還幫助很多臺灣老兵找到了大陸的親人,幫助51個家庭跨越海峽兩岸團聚。
我們還利用技術(shù)去實現(xiàn)精準扶貧,讓四川省古藺縣、甘肅省夏河縣、貴州省雷山縣的山貨走上頭條,盤活優(yōu)質(zhì)文化物質(zhì)資源,服務(wù)國家鄉(xiāng)村振興戰(zhàn)略。
在教育方面,我們也認為AI有機會幫助教育。因為我們可以用人工智能技術(shù)來連接有教育資源的人跟需要教育資源的人。我們可以用AI技術(shù)把最好的師資、最好的教材傳遞到偏遠地區(qū)。像我們的“益童樂園”貴州起航,“鄉(xiāng)村AI教師”也全面建成,我們希望讓貧困地區(qū)的孩子也接受到良好的教育。
基于我們前面提到的種種嘗試與努力,字節(jié)跳動的愿景也正在逐步實現(xiàn)——建設(shè)全球創(chuàng)作與交流平臺。公司成立至今六年以來,我們的產(chǎn)品和服務(wù)已經(jīng)覆蓋150多個國家、75個語種,在40多個國家和地區(qū)位居應(yīng)用商店總榜前列。而這背后,正是科技和創(chuàng)新在推動我們?nèi)蚧陌l(fā)展。技術(shù)出海,是字節(jié)跳動全球化發(fā)展的核心戰(zhàn)略,人工智能技術(shù)是字節(jié)跳動全球化取得當前進展的關(guān)鍵。作為人工智能時代的中國創(chuàng)業(yè)者,未來字節(jié)跳動將繼續(xù)孜孜以求,幫助全世界的用戶更好地創(chuàng)作、交流、互動,也為中國人工智能的發(fā)展貢獻一份力量!