2016年,互聯(lián)網(wǎng)巨頭都在秀人工智能的肌肉。繼Google AlphaGo下棋贏得人類之后,今天百度又有一個人工智能應(yīng)用曝光了:度秘實況解說NBA總決賽。據(jù)一位百度工程師朋友圈照片顯示,在昨天上午勇士對騎士的比賽中,度秘模擬人工解說員對比賽進行了實時講解,同時提供新聞速遞和經(jīng)典回顧。除此之外,度秘還支持互動,能夠回答關(guān)于比賽的各種問題,比如“庫里得了多少分”。
度秘背后的原理是怎樣的?據(jù)觀察,度秘暫時還未能做到直接看NBA視頻來理解比賽,而是通過抓取各種相關(guān)的新聞資訊、網(wǎng)友聊天,來實現(xiàn)“實況解說”的,它能夠回答用戶問題,也是基于對文字的理解??梢?,度秘背后最關(guān)鍵的技術(shù),是自然語言處理技術(shù),即NLP。
自然語言處理技術(shù)主要是語義理解,比語音識別更加復(fù)雜,背后需要以深度學習為基礎(chǔ)的人工智能技術(shù)。自然語言處理技術(shù)是Siri等語音助手變得聰明好用的關(guān)鍵所在,用戶說話習慣、斷句方式、說話場景不同,背后往往有不同的意圖,機器要理解并不容易?;趥鹘y(tǒng)的規(guī)則算法是不可能窮舉各種表達方式的,只有基于統(tǒng)計的深度學習才能不斷提高語義理解的準確度。度秘的應(yīng)用表明,自然語言處理技術(shù)不只是可以用來更好地理解用戶的語言,還能更好地理解網(wǎng)絡(luò)內(nèi)容,并再次組織,形成以假亂真的“直播解說”。
百度的自然語言處理技術(shù)尤其是中文處理技術(shù),經(jīng)驗還是比較豐富的。百度過去一直在做的就是解析用戶自然語言形式的搜索請求,并在海量網(wǎng)絡(luò)內(nèi)容中尋求答案,而后者同樣是自然語言形式。百度不斷在嘗試去理解人類的語言,以及不同的文字,另一個典型應(yīng)用是百度翻譯,它能夠理解不同語言的文章,進行機器翻譯,已經(jīng)達到實用水平,獲得國家科技進步二等獎。自然語言處理,一方面需要海量語料、詞庫的積累,為統(tǒng)計算法提供基礎(chǔ);另一方面,需要模擬神經(jīng)網(wǎng)絡(luò)的深度學習算法,這是一個被人類研究了幾十年的技術(shù),最近一年實現(xiàn)從量變到質(zhì)變的突破,不論是AlphaGo還是度秘還是Siri,背后均是類似技術(shù)。
AlphaGo戰(zhàn)勝人類之后,人工智能這一技術(shù)性概念,被全世界熟知,相關(guān)應(yīng)用越來越多,谷歌Home、谷歌Duo、Amazon Alexa、Siri、度秘等等典型應(yīng)用愈發(fā)被人們接受。不管是基于語音還是文字,這些應(yīng)用的背后,均會用到一個關(guān)鍵技術(shù)“自然語言處理”,通過這個技術(shù)機器可以理解人類、與人類對話、還有學習世界上的文字去變得更聰明。
在今年百度聯(lián)盟峰會上李彥宏的演講主題是人工智能是“下一幕”,所展示的“智能識圖”,需要機器去理解人類的問題;此前度秘還進入了上海KFC的一家餐廳,像服務(wù)員一樣接收人類指令去訂餐,這也用到了自然語言處理技術(shù);之前傳得很火的機器寫稿,背后也是自然語言處理技術(shù),將網(wǎng)絡(luò)上的文字和數(shù)據(jù)再次組織起來,跟度秘做的事情很相似。
毫不夸張地說,沒有自然語言處理,大部分人工智能應(yīng)用形同虛設(shè)。
“度秘直播解說員”眼下還在內(nèi)測,很可能會在今年奧運會期間對外開放,為大家解說不同的比賽。相對于傳統(tǒng)解說員而言,度秘的解說在生動性上可能會有差距,著名的解說員如黃健翔、柯凡、楊毅們,都有自己的風格,引經(jīng)據(jù)典、旁征博引,還有幽默之類的情感因素,機器短期內(nèi)是做不到的。不過,機器的好處就是它不知疲倦,可為你解說每一場比賽,并且還能進行個性化定制,每個人都可擁有屬于自己風格的解說員,解說員還可以隨時回答你的問題。未來度秘與語音合成技術(shù)結(jié)合起來,就可以做林志玲版、范冰冰版或者你老婆版的比賽解說了,這會讓比賽解說變得更加有趣。
除了解說比賽之外,度秘背后的自然語言處理技術(shù),有著許多應(yīng)用空間。這幾年人工智能技術(shù)的發(fā)展實現(xiàn)了從量變到質(zhì)變,相關(guān)應(yīng)用將會成為實際,而不是停留在想象或概念階段,具體來說,以下領(lǐng)域會因為自然語言處理技術(shù)的成熟而率先爆發(fā):
1、家庭機器人:家庭機器人需要“能說、會聽、會動”,會動就是能做飯倒茶拖地按摩,這一點,是機器人公司在做的事情;而“能說會聽”就是人工智能的事情了,需要自然語言處理能力,在語音識別之后,去理解人類的命令,與人類對話。因此自然語言處理技術(shù)成熟之后,家庭機器人將會普及,尤其是陪聊類的,例如兒童、老人、單身男陪伴類的,你可以定制一個林志玲回家陪你聊天。
2、客服機器人:不論是電商系統(tǒng)的在線咨詢,還是客服電話的在線咨詢,現(xiàn)在的體驗都很糟糕,主要是要排隊等待,很多互聯(lián)網(wǎng)公司的客服電話,能打進去算是中大獎了,但這些公司又不可能大幅擴張客服隊伍,人力成本實在是太高了。有了人工智能的客服機器人,它就可以去理解用戶的問題,文字、語音均可,并與用戶進行對話,就像真人一樣。這將大幅提升客服體驗并節(jié)省人力成本。
3、助理式搜索:美國曾有一個“人工搜索”引擎,你提出一個問題,有專人去幫你找答案,需要付費。印度的justdial、中國移動12580以及中國電信114熱線,同樣是基于免費電話的搜索服務(wù),背后有專員給你找答案。這樣的搜索服務(wù)體驗有好的地方,就是個性化的助理,可給你準確的答案或安排你的行程,不過使用成本太高,基于電話不夠方便,又費時間又花錢,并未普及?,F(xiàn)在自然語言技術(shù)成熟,其與搜索結(jié)合起來,就可給每個用戶提供一個免費的私人搜索助理,基于文字或語音均可。
人工智能是一個很泛的概念,語音識別、圖像識別、語義理解、自然語言處理、機器翻譯諸多技術(shù)均可歸為其中,自然語言處理技術(shù)則是人工智能普及的基礎(chǔ)。在過去,它是人工智能普及最大的瓶頸,現(xiàn)在從谷歌、蘋果和百度等公司的動作來看,這個瓶頸很快就被消除了。家庭機器人、客服機器人、助理式搜索、定制化解說,很快就會成為現(xiàn)實。