“終于等到你”

“只要見他一面就行了,希望在有生之年見一面!”27年前,6歲的付貴被拐;27年來,這個家庭尋找孩子的希望一直沒有中斷;被拐27年后,依賴于技術(shù)的進(jìn)步,付貴終于見到了家人。
1990年10月16,像往常一樣,付貴的姑姑付光友在早上7點(diǎn)的時候?qū)⒑⒆铀屯?zhèn)上的幼兒園,途中還不忘給他買了爆米花,下午4點(diǎn)放學(xué),付貴會自行回家。“付貴你去好好讀書,下午早點(diǎn)回來”,這是付光友跟付貴講的最后一句話,她現(xiàn)在都記得自己當(dāng)天給付貴穿的衣服,滌卡衣服和褲子,背了黃顏色的帆布書包。然而這一別卻是整整27年,付貴被拐走了。
2016年11月,寶貝回家為找回的一個孩子在重慶舉辦了歡迎會,付光友的女兒得到這個消息,把它告訴了付光友和付貴的父親付光發(fā),并領(lǐng)著付光發(fā),帶著身份證和付貴的照片在現(xiàn)場做了登記。
2017年1月,家人尋找付貴的信息出現(xiàn)在寶貝回家的網(wǎng)站,在登記的信息里,付貴出生年月為1984年11月16日,丟失日期為1990年10月16日,失蹤地點(diǎn)位于重慶市石柱縣大歇鄉(xiāng)。而早在2009年,付貴便已在寶貝回家網(wǎng)站上登記了自己的信息。在付貴登記的信息中,姓名一欄為“胡奎”,出生日期為1986年4月,失蹤日期為1991年1月1日,失蹤地點(diǎn)位于福建。
今年3月,百度與寶貝回家合作,將人工智能的跨年齡人臉識別技術(shù)應(yīng)用于尋找走失兒童中,首批2萬多條尋親圖片數(shù)據(jù)接入百度跨年齡人臉識別系統(tǒng)進(jìn)行對比評測,通過對孩子與父母上傳的照片做比對,初步篩選出30例疑似案例,付貴就在其中。
“我們第一眼看到百度團(tuán)隊提供過來的付貴資料,就覺得這個應(yīng)該是了,除了照片像之外,還有一個是名字,"付貴"與"胡奎"的發(fā)音很近,”寶貝回家工作人員在進(jìn)一步核實(shí)了信息后,開始聯(lián)系雙方進(jìn)行DNA的入庫比對。
在重慶打拐辦和深圳打拐辦的協(xié)助下,付貴及雙親的DNA正式入庫做比對,4月1日,DNA比對成功。原定于4月9日重慶的見面,因?yàn)楦顿F在8日突發(fā)生病住院讓這家人的見面提前到了8日,病床上的付貴,通過視頻與重慶的家人“見面”了。
工作難度大
負(fù)責(zé)此次與寶貝回家合作的“AI尋人”項(xiàng)目技術(shù)統(tǒng)籌的百度AI平臺部產(chǎn)品經(jīng)理談及這次經(jīng)歷十分激動,“4月1日,付貴和家人DNA匹配成功的最終消息傳來時,我們與寶貝回家的微信溝通群中,所有人都沸騰了!只用一個月,就成功幫助被拐孩子找到失散27年的親人。還有什么比這更讓技術(shù)人員開心的事情?”
據(jù)該名百度AI平臺部產(chǎn)品經(jīng)理描述,2月27日,經(jīng)理閆旭表示希望他來負(fù)責(zé)和寶貝回家合作“AI尋人”的技術(shù)統(tǒng)籌。這次合作的主要內(nèi)容,就是幫助“寶貝回家”設(shè)計和實(shí)現(xiàn)信息的集中管理,讓所有線索匯聚起來,加上百度的跨年齡段人臉比對技術(shù),幫助寶貝回家盡快找到高疑似案例,交給志愿者追蹤和落地線索。
這個工作看似簡單,背后卻需要從算法到篩選、標(biāo)注等各項(xiàng)技術(shù)支持。接受項(xiàng)目后,IDL(深度學(xué)習(xí)實(shí)驗(yàn)室)、AIP( AI平臺部)、AIQA(AI測試部)、眾測(平臺測試部)等多個部門的十幾位技術(shù)人員相繼加入,成立了“AI尋人”虛擬團(tuán)隊。成員犧牲了下班和周末的時間,共同搭框架、跑數(shù)據(jù)、把案子往前推進(jìn),每周工作時間基本超過了70小時。
人臉識別技術(shù)基本原理,是從人臉照片上,提取所有的面部特征(眉毛、眼睛、鼻子、臉型輪廓等),把特征換算成不同維度,并給每個維度配比上不同的權(quán)重。當(dāng)兩張照片進(jìn)行對比時,會針對每個維度挨個對比,得出每個維度的相似度得分,再根據(jù)每個維度的權(quán)重比例計算出總體的匹配度得分,給出兩張臉的相似程度。針對寶貝回家平臺的數(shù)據(jù)類型,IDL深度實(shí)驗(yàn)室的人臉團(tuán)隊用大規(guī)模的跨年齡數(shù)據(jù)和親子照數(shù)據(jù)進(jìn)行深度學(xué)習(xí)的訓(xùn)練,用訓(xùn)練好的模型進(jìn)行跨年齡人臉照片比對。
照片篩選對比的難度非常大。首先是數(shù)據(jù)量不小,截至3月8日,團(tuán)隊對首批2萬多條數(shù)據(jù)進(jìn)行處理,其中還有許多無效照片,如部分人員去世或失蹤、無法追尋等。此外,還有照片不規(guī)范的情況,如照片經(jīng)過美化、照片中人物過多、父母無孩子照片直接上傳父母本人照片、比對年齡區(qū)間較大等,都給比對工作增加了難度。
為了提高識別成功率,反復(fù)嘗試了各種策略。例如,在出生日期上,將出生日期前后浮動兩三年把范圍鎖定,再利用遺失地點(diǎn)等其他條件,把范圍縮小,在小的范圍內(nèi)做比對以提高成功率。
3月中旬,團(tuán)隊把第一批篩選出來的30組匹配分?jǐn)?shù)較高的照片提交給了寶貝回家,有兩組照片是高疑似的,其中一組就是付貴。
最終,4月1日,付貴DNA匹配成功,令所有參與工作的人員都十分振奮。
“現(xiàn)在,我們和"寶貝回家"的合作已經(jīng)進(jìn)入穩(wěn)定開發(fā)期,未來會有更多成功案例。”上述人員表示,百度人臉識別技術(shù)會在識別過程中不斷學(xué)習(xí),利用正確的對比照片,不斷糾正調(diào)整臉部特征維度的權(quán)重比例(如鼻子的權(quán)重數(shù)很高,識別時就重點(diǎn)進(jìn)行鼻子的比對),以提高精確度。
百度力推AI應(yīng)用
近年來,百度人工智能和大數(shù)據(jù)技術(shù)不斷完善,應(yīng)用日趨成熟,不斷探索助力兒童走失案件的偵破工作,為兒童走失案例的偵破提供了科學(xué)手段,目前百度人臉測試集有2億張圖片作為訓(xùn)練樣本數(shù)據(jù)。
近年,百度人臉識別技術(shù)不斷獲得外界的高度認(rèn)可:在人臉識別技術(shù)兩個最為權(quán)威的國際評測FDDB與LFW中,百度都獲得了第一名的佳績,領(lǐng)先于騰訊、FACE++、linkface等國內(nèi)同行,并在LFW中達(dá)到99.77%的準(zhǔn)確率(《百度人臉識別“準(zhǔn)冠全球”獲雙料世界第一》)。另外,美國《財富》雜志發(fā)表題為“Why deep learning is suddenly changing your life“的文章中也深入介紹了包括百度、谷歌、微軟、Facebook在內(nèi)的全球四大AI巨頭在人工智能的布局以及深度學(xué)習(xí)對人們?nèi)粘I顜淼母淖儭?/div>
2016年11月16日,第三屆世界互聯(lián)網(wǎng)大會公布的世界互聯(lián)網(wǎng)領(lǐng)先科技成果中,百度的人工智能核心成果——百度大腦成功入選15大領(lǐng)先科技成果,成為國內(nèi)惟一一個入選的綜合型人工智能技術(shù)。
先進(jìn)的技術(shù)更需要應(yīng)用的檢驗(yàn),也應(yīng)該被更廣泛的應(yīng)用。2017年全國“兩會”期間,全國政協(xié)委員,百度公司董事長兼CEO李彥宏的其中一項(xiàng)提案就是“利用人工智能技術(shù)來解決兒童走失的問題。” 李彥宏建議國務(wù)院辦公廳牽頭,協(xié)調(diào)公安部、民政部等“反對拐賣婦女兒童行動工作部際聯(lián)席會議”的重要組成單位,統(tǒng)籌企業(yè)和社會力量,利用人臉識別等大數(shù)據(jù)和人工智能技術(shù),進(jìn)一步提升兒童走失案件的偵破效率與破案率。
兒童走失問題事關(guān)每一個家庭的安全和幸福,備受社會各界以及政府主管單位的關(guān)注。雖然,目前我國拐賣兒童案件已呈現(xiàn)“低發(fā)高破”態(tài)勢,但仍然有案件因線索不足導(dǎo)致難以偵破。“寶貝回家”創(chuàng)始人張寶艷表示,如果把人工智能運(yùn)用到尋人數(shù)據(jù)的分析對比中來,可以使尋人比對過程更有方向性和針對性,就會在數(shù)萬份資料中精準(zhǔn)地鎖定比對對象,從而縮短比對過程。
更多>相關(guān)資訊
0 條相關(guān)評論