“百度大腦”正在人工智能競賽中全面沖刺
作 者:肖婧 來 源:中國營銷網(wǎng)發(fā)表日期:2015-01-19
2015年,“百度大腦”正在人工智能軍備競賽中的全面沖刺。“過去20年里人們已經(jīng)看到人工智能的正循環(huán):如果你有一個好的產(chǎn)品,你就會得到大量用戶,有了大量用戶你就會有大量數(shù)據(jù),這些大量數(shù)據(jù)用于人工智能算法,你的產(chǎn)品就會更好。但是,傳統(tǒng)的人工智能算法的問題在于:當(dāng)你給他更多數(shù)據(jù),效果并不一定一直變好,而‘百度大腦’的新算法是適度學(xué)習(xí),當(dāng)你給他更多數(shù)據(jù),效果變得越來越好。”吳恩達(dá)表示。2014年1月,百度CEO李彥宏宣布將建立公司歷史上首個前沿科學(xué)研究機(jī)構(gòu)——深度學(xué)習(xí)研究院(Institute of Deep Learning,IDL)。2014年5月,百度在硅谷設(shè)立人工智能中心,并聘請了前Google人工智能部門創(chuàng)始人之一——吳恩達(dá)(Andrew Ng)擔(dān)任負(fù)責(zé)人。吳恩達(dá)是世界三大人工智能專家之一,并且是三人中最年輕的一個。另兩個是杰夫·辛頓(Geoffrey Hinton)和伊恩·勒坤(Yann LeCun)目前分別受聘于谷歌和Facebook。目前百度的IDL團(tuán)隊主要攻關(guān)的是語音和圖像識別,并兼顧BaiduEye等智能硬件的進(jìn)一步研究探索。“在移動互聯(lián)網(wǎng)的時代,用戶需要用更自然方式使用互聯(lián)網(wǎng),大數(shù)據(jù),語音、圖像、自然語言的處理以及用戶用自然方式找到服務(wù)至關(guān)重要,而擁有海量數(shù)據(jù)和人工智能新算法的百度大腦已經(jīng)有能力使人工智能正循環(huán)越滾越快。”吳恩達(dá)說。
搜索回歸“說”與“看”的原生世界 隨著移動互聯(lián)網(wǎng)的發(fā)展,搜索給了用戶新的可能性。李彥宏在2014年百度世界大會上透露,未來五年語音和圖像搜索會超過文字。“目前百度10%的搜索請求來自語音搜索,一天可以最高達(dá)到500次,其中400次以上的語音搜索來自兒童。”李彥宏解釋說,語音是一個更加自然的表達(dá)需求的方式。“文字的歷史大約只有5千多年,但語音的歷史至少有20萬年,它是一個更加自然且低門檻的表達(dá)方式,一個兒童在還不會打字的時候,就已經(jīng)可以用語音來表達(dá)他的搜索需求了。”李彥宏舉了一個語音搜索的案例:“‘7年前姐姐的年齡是妹妹的4倍,7年后姐妹倆的年齡之和是48歲,姐姐今年多少歲?’以上語音搜索內(nèi)容可以推測是一個小學(xué)二年級的學(xué)生輸入的。反觀如果使用文字輸入的話,所需的時間可能比算出答案還要長,很可能干脆不去搜索了。”除了“說”之外,“看”有著更豐富的形式——圖片?,F(xiàn)在的百度同時也支持拍照搜索,或是用一個圖片去找相似的圖片。“一個人在學(xué)會語言之前,是先用眼睛認(rèn)知世界的。圖片搜索推出后,很多用戶都開始用這種更自然的方式來向百度表達(dá)需求。”李彥宏談到,其實(shí)表達(dá)需求最多的一個類型是跟生活方式相關(guān)的,購物需求的圖片搜索占到了35.5%,比如把一個包拍下來看看網(wǎng)上哪有賣。”可以這樣說,搜索技術(shù)的門檻一直在上升,從文字到語音再到圖片,而使用者的門檻一直在降低,即使一個嬰兒也可以用他的眼睛來表達(dá)需求。“未來5年,使用語音和圖片搜索的請求量會超過純文字的需求量。”在過去一年,百度語音方面的探索取得巨大進(jìn)展。目前,百度搜索中有10%為語音搜索,此外如地圖定位和百度語音助手都有百度在語音上的成果,圍繞語音界面重新設(shè)計移動產(chǎn)品,推動物聯(lián)網(wǎng)的革命,讓汽車界面、家用設(shè)備、可穿戴設(shè)備都離不開語音。
李彥宏的新大陸 “開放云”“數(shù)據(jù)工廠”和“百度大腦”被稱為李彥宏的新大陸。百度高級副總裁王勁介紹,百度的大數(shù)據(jù)引擎由這三項核心大數(shù)據(jù)能力組成。此前百度在公布“百度大腦”項目時,宣布該項目已能模擬人腦的200億個神經(jīng)元,達(dá)到兩三歲孩童的智力水平——這意味著百度的進(jìn)度在不聲不響中做到了全球領(lǐng)先。以算法為基礎(chǔ)的“百度大腦”則是人工智能、深度學(xué)習(xí)的代表,目前百度人工智能方面的能力已經(jīng)開始被應(yīng)用在語音、圖像、文本識別,以及自然語言和語義理解方面,“等于(機(jī)器)有了眼睛、耳朵、嘴巴。”王勁說。當(dāng)你被一片不認(rèn)識的美麗花田傾倒,在過去只能是拍下照片就沒有“然后”了,現(xiàn)在通過照片,百度大腦讓你既知道花名,還能得到服務(wù):百度百科告訴你這個花名及它的相關(guān)屬性,同時百度直達(dá)號幫你找到離你最近的有這種花賣的花店。王勁表示,受益者還有商家,“對于花店來說,過去只能是有顧客來到店里,才能把花賣出去,現(xiàn)在整個大自然都是它的櫥窗,商家能夠非常準(zhǔn)確地捕捉商機(jī)。”大家都有這樣的經(jīng)歷,在某個地方突然聽到一首非常好聽的歌, 想知道這是什么歌?是誰唱的歌?“這時你只要拿起手機(jī),百度大腦就會告訴你。如果你是喜歡音樂的人,可以通過百度直達(dá)號到音樂網(wǎng)站下載這首歌;如果你是歌手的粉絲,直達(dá)號會告訴你:比如過兩天他要到你所在的城市開演唱會,同時你可以找到對應(yīng)的票務(wù)公司下單并選定座位。”王勁說。除了更好地滿足娛樂相關(guān)的訴求,百度大腦還能對我們生活中更重要的事情起到幫助,比如老百姓特別關(guān)心的醫(yī)療。“比如目前百度和祥云醫(yī)院有了一個初步的合作——在網(wǎng)上提供皮膚病的預(yù)診。”王勁談到,過去一個新生的小寶寶皮膚出了問題,年輕的父母會非常焦慮,他們不知道這個問題有多大、多嚴(yán)重、多緊急,也不知道他們應(yīng)該做什么樣的應(yīng)急處理。而今只要把患病部位用手機(jī)拍照并上傳到百度,就可以得到一個預(yù)診的診斷。“現(xiàn)在預(yù)診的準(zhǔn)確率已經(jīng)達(dá)到93%了,雖不足以成為一個正式的醫(yī)療的結(jié)果,但可以第一時間幫助這些父母做初步的處理建議,同時也能幫助他們解決之后去找什么樣的專家來治療孩子的問題。百度大腦能夠把一個線下服務(wù)和患者對接起來。”“除了看得見的服務(wù)器和云計算中心,更重要的是背后看不見的被稱為深度學(xué)習(xí)的人工智能算法。”王勁解釋說,把普通的CPU服務(wù)器、ARM服務(wù)器和GPU的服務(wù)器整合在一起,構(gòu)成大規(guī)模的集群,把它用在人工智能的算法的時候,整個計算的能力、存儲的能力達(dá)到了一個新的高度。“用這個集群打造了世界最大規(guī)模的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),它和傳統(tǒng)機(jī)器的區(qū)別在于:傳統(tǒng)機(jī)器的學(xué)習(xí)只是一味擴(kuò)大它的數(shù)據(jù)規(guī)模,且層次只有一層,而深度學(xué)習(xí)的算法更好地模擬人類大腦的思維和學(xué)習(xí)過程,能夠處理更復(fù)雜的事務(wù)。”王勁表示,把百度大腦的人工智能技術(shù)和百度的大數(shù)據(jù)結(jié)合,能夠找到以前所不知道的規(guī)律,從而嘗試做一些對于未來的預(yù)測。“現(xiàn)在已經(jīng)能夠?yàn)橹袊部刂行奶峁┝餍胁〉念A(yù)測。另外,還能夠預(yù)測兩星期內(nèi)國內(nèi)各個城市的旅游熱度,讓旅游者更好地規(guī)劃出游,也能幫助相關(guān)單位做好宏觀調(diào)控。”2014年6月,百度甚至還和全球另4家高科技公司——谷歌、雅虎、微軟、高盛對世界杯的結(jié)果進(jìn)行了預(yù)測競賽,結(jié)果它的準(zhǔn)確率是最高的。
另一個商業(yè)化觸角:智能硬件 基于“百度大腦”的技術(shù)支撐,百度世界大會上發(fā)表了多款智能硬件,其中以BaiduEye和百度“筷搜”最吸引眼球。“百度筷搜”被李彥宏認(rèn)為是“新的感知世界的方式,是用戶和消費(fèi)者表達(dá)需求的方式”。BaiduEye是百度研究院副院長余凱帶領(lǐng)的IDL(深度學(xué)習(xí)實(shí)驗(yàn)室)牽頭研發(fā)的智能穿戴設(shè)備,它的噱頭是“無需屏幕,隔空辨物”——沒有眼鏡屏幕,佩戴者只需要用手指在空中對著某個物品畫個圈,或者拿起這個物品,BaiduEye即可通過這些手勢獲得指令,鎖定該物品并進(jìn)行識別和分析處理。比如:你在街上看到別人身上好看的某款衣服時,手指輕輕一圈,BaiduEye會立即根據(jù)衣服特征,搜索到相關(guān)品牌以及最近的銷售促銷信息等;你在博物館欣賞一個瓷瓶時,BaiduEye會在耳邊講述瓷瓶的歷史知識;你看到一棵不知名的植物時,BaiduEye會告訴你它的名稱、產(chǎn)地、生活習(xí)性等信息;你如果要去某一個地方,BaiduEye將判斷你所處的位置迅速找到最佳路線,并啟動語音導(dǎo)航。“BaiduEye不是眼鏡,而是人眼的自然延伸,讓人具有‘看到即可知道’的能力,因?yàn)闆]有屏幕遮擋,戴著它的人也更加輕松,不會因?yàn)橛醚圻^度而感到困乏。”負(fù)責(zé)研發(fā)BaiduEye產(chǎn)品的IDL工程師解釋說。BaiduEye是一款連接線上與線下、針對O2O場景的產(chǎn)品,目前它的使用場景專注在兩個方面:商場購物和博物館游覽。以合作的銀泰百貨為場景進(jìn)行描述:你來到銀泰,佩戴上BaiduEye就可以隨時搜索貨架上商品的信息以及網(wǎng)絡(luò)上對這個商品的評價,BaiduEye會記錄下你的年齡、性別、你放棄和購買了哪些商品、在哪一些貨架停留的時間最長……在這些信息的基礎(chǔ)上,向你推薦相關(guān)商品和打折信息,甚至根據(jù)你已經(jīng)購買的上衣推薦搭配的褲子——它就在這家商場的另外一家門店出售。“目前主要考慮的是to B的環(huán)境。BaiduEye的圖像識別都是通過百度大腦來完成的,它可以在后臺進(jìn)行大量的數(shù)據(jù)分析,再推送到BaiduEye中。商店一般在收銀的地方都有一個小貨架,讓你在排隊結(jié)賬的時候再買點(diǎn)東西,而使用了BaiduEye的商家則可以根據(jù)你在整個店面里所有的關(guān)注行為,為你提供一個你私人定制離店貨架。”百度投資了一家室內(nèi)定位的公司,通過和手機(jī)結(jié)合,BaiduEye可以為顧客提供語音室內(nèi)導(dǎo)航,同時讓商家知道消費(fèi)者在這個商場里面的走動軌跡。“銀泰可以通過數(shù)據(jù)進(jìn)行商業(yè)決策,比如怎么安排消費(fèi)者在商場的路線,把到商場里面的購買行為全部打通,未來購物體驗(yàn)會非常不一樣。”銀泰商業(yè)CEO陳曉東表示,BaiduEye解決了傳統(tǒng)零售體驗(yàn)中消費(fèi)者和商戶都“看不見”的問題:用戶不知道眼前的商品是不是新品、是否打折、價格、做工、原料;商戶不知道用戶的喜好、信息和消費(fèi)記錄。“有了BaiduEye,這些數(shù)據(jù)都可以雙向沉淀下來。”如果說BaiduEye是一款相當(dāng)前衛(wèi)的產(chǎn)品,那么百度“筷搜”可以說是令千百萬關(guān)注食品安全問題的中國消費(fèi)者翹首以待的一款產(chǎn)品:它底端集成了四顆傳感器,分別可以監(jiān)測油脂、鹽分、PH值和溫度。“如果發(fā)現(xiàn)了地溝油,或者水質(zhì)有問題,筷子頂端的紅燈就會閃亮起來,”“筷搜”產(chǎn)品經(jīng)理解釋說,“其他更多的信息會通過藍(lán)牙和手機(jī)同步”。“筷搜”與普通筷子的重量沒有明顯區(qū)別,充電通過一個“筷籠”:茶杯大小,搭上去就可以充電。“筷籠還有更神奇的作用,可以識別放在上面的食材成分。”“筷搜”工作原理相當(dāng)于建立了食品健康的大數(shù)據(jù)分析庫,基于云計算,將采集到的數(shù)據(jù)進(jìn)行實(shí)時分析,轉(zhuǎn)化為各項食品安全指標(biāo)。目前地溝油檢測的成功率還比較低,“‘筷搜’主要是想讓大家理解大數(shù)據(jù)未來能做到什么。”“筷搜”產(chǎn)品經(jīng)理說。在“百度筷搜”的背后,是百度圍繞“百度大腦”人工智能逐步打造智能硬件生態(tài)的野心。在智能化之后,硬件具備連接的能力,實(shí)現(xiàn)互聯(lián)網(wǎng)服務(wù)的加載,形成“云+端”的典型架構(gòu),具備了大數(shù)據(jù)等附加價值。“因?yàn)榘俣葘?shù)據(jù)和基礎(chǔ)設(shè)施的投資,讓我們有能力利用人工智能進(jìn)行互聯(lián)網(wǎng)的轉(zhuǎn)型,正所謂贏得人工智能就贏得互聯(lián)網(wǎng)。”吳恩達(dá)說。BaiduEye不是眼鏡,而是人眼的自然延伸,讓人具有“看到即可知道”的能力,因?yàn)闆]有屏幕遮擋,戴著它的人也更加輕松,不會因?yàn)橛醚圻^度而感到困乏。