我想用幾個例子來講一講,人類走過了幾千年的實驗科學(xué)、幾百年的理論科學(xué),保險是一個很傳統(tǒng)的行業(yè),基于概念評估的生意,保險公司對車險客戶是這樣聚類的:A類連續(xù)兩年沒有出車禍的,B類,最近一年沒有出車禍的,C類過去一年出了一次車禍的,D類過去一年出了兩此及以上車禍的。我從機場到深圳來,你坐飛機從北京到深圳,保險公司給你付了,我一了解,這個保險是20塊錢,這個保險公司買了你三個大數(shù)據(jù),身份證,還有你的手機號,各位企業(yè)、各位領(lǐng)導(dǎo),各位老百姓,你們想一想。
物聯(lián)網(wǎng)時代,當(dāng)汽車成為輪式機器人,成為大數(shù)據(jù)發(fā)生器以后,就是一個大數(shù)據(jù)發(fā)生體,每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車,都會記錄在岸,利用大數(shù)據(jù)聚類,保險公司可對一個車況好、駕駛習(xí)慣好、常走線路事故率低,不勤開車的特定客戶,給予更大的優(yōu)惠,而對風(fēng)險太高的客戶報高價甚至拒絕,例如出租車司機跑的比老百姓多得多,總之能夠給出包括保險費支付方式在內(nèi)的個性化解決方案,這就顛覆了保險公司的傳統(tǒng)商業(yè)模式。這就是大數(shù)據(jù)聚類成為保險公司的核心競爭力,我擴張一下,就是大數(shù)據(jù)聚類成為很多行業(yè)的核心競爭力。
非大數(shù)據(jù)時代,做一個人臉的識別,我們可以提取它十個特征,第二類先結(jié)構(gòu)化存起來,你想一想,如果十個特征都一樣的話,兩個人是不是同一個人呢?當(dāng)然,這也是不可能的,但是我們再想一想,人類智能來看,它忽略了什么呢?我認(rèn)為它忽略了太多,這種人臉識別僅僅是幾何結(jié)構(gòu)的聚類,落入集合學(xué)框架,忽略了聚類的不確定性,忽略了聚類的多樣性等等。
再舉個例子,大數(shù)據(jù)寫詩,人們熟讀眾多詩詞,記住了針對各種意境的大量字串。例如說李白一生寫詩1010首,把他所有詩句進(jìn)行機械切割。李白給毛主席誕辰100周年寫一首詩,就是這樣。
大數(shù)據(jù)對形式化方法的挑戰(zhàn)是非常嚴(yán)峻的,在數(shù)據(jù)密集型的網(wǎng)絡(luò)時代,任何傳統(tǒng)學(xué)科,或者傳統(tǒng)的行業(yè),它的公理、原理和定理組成的語境,遇到互聯(lián)網(wǎng)+的挑戰(zhàn)之后,這樣一來,傳統(tǒng)的學(xué)科行業(yè),或者是交叉學(xué)科,成為一個大數(shù)據(jù)、小模型、小定律、交叉學(xué)科的時代,模型和程序要圍繞數(shù)據(jù)轉(zhuǎn)。
創(chuàng)新,表示在創(chuàng)造一個新的語境,新的坐標(biāo)系,在這個坐標(biāo)系下研究大數(shù)據(jù),在互聯(lián)網(wǎng)情況下,如何創(chuàng)造你新的坐標(biāo)系,新的語境,否則難以有新的發(fā)現(xiàn)。
實踐中的研究,由下而上要深入,數(shù)據(jù)要勝過程序,價值要勝過知識,關(guān)聯(lián)要勝過因果,更多要關(guān)注有意義的小眾,把這些小眾累積起來才成為大眾。
通過大數(shù)據(jù)聚類即時發(fā)現(xiàn)價值,要充分認(rèn)識大數(shù)據(jù)中的不確定性和價值的隱蔽性。
機器人如何認(rèn)知是我講的第二個問題,這七個字,可以有兩種劃分,一種是機器人如何認(rèn)知,你要把這個弄清楚,我覺得實際上是在弄這個,機器人在想,人如何認(rèn)知,智能機器人是集新材料、新工藝、新能源、機械、電子、移動通信、全球定位導(dǎo)航、移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、自動化、人工智能、認(rèn)知科學(xué)、乃至人文藝術(shù)等多個學(xué)科、多種技術(shù)于一身的人造精靈,是人聯(lián)網(wǎng)、物聯(lián)網(wǎng)不可或缺的端設(shè)備,是人類社會走向智慧生活的重要伴侶。
機器人既是使用大數(shù)據(jù)也產(chǎn)生大數(shù)據(jù),既是大數(shù)據(jù)的產(chǎn)物,也是大數(shù)據(jù)的推動者,機器人是大數(shù)據(jù)的認(rèn)知的典型代表,機器人時代真的來了,我們希望我們以后的黃牛退休、鐵牛耕地,這個鐵牛就是機器人,農(nóng)民進(jìn)城,機器人耕地,醫(yī)療與健康機器人,服務(wù)機器人更是上上下下,當(dāng)然還有太空機器人等。
我先講一下服務(wù)機器人,高考機器人,就是由知識的碎片化,大數(shù)據(jù)來認(rèn)知,就說明我們的教育不能光是填知識,我們現(xiàn)在做一個報告,我們可以用機器人來撰稿,機器人導(dǎo)航,機器人手術(shù)等。