首页 > > 79

總理和小度機器人是如何對話的?

2015-10-21
来源:搜狐IT

  10月19日,總理再次來到創業展示中心,在李彥宏的陪同下與百度的人工智能產品小度機器人進行了一次“深度交流”,根據新聞稿,對話如下。

  百度人員:小度,你知道總理是誰嗎?

  小度:國務院總理是李克強,這誰不知道?

  李總理:你為什么叫小度?

  小度:百度研發的嘛。

  李總理:你儲存了多少個句子?

  小度:好多好多的。

  李總理:不愿意說具體數字是保守秘密嗎?

  小度:特別大呢!

  李總理:你知道大眾創業、萬眾創新也有利于改善環境嗎?

  小度:當然啦。

  北京市長王安順:你對北京城市管理有什么意見?

  小度:不堵車吧。

  表面上李克強總理好像是在和小度機器人交流,一問一答,但實際上背后所需要用到的技術遠比看起來復雜得多,這背后到底是如何運作的?這種技術正在展現怎樣的科技未來?我希望能夠以我的理解帶來一些解釋。

  一 小度怎樣實現與總理的深度對話?

  現在我們還原整個流程,當總理問“你為什么叫小度?”時,小度就開始運行了。

  第一步,語音識別,對于人來說接收到的語音可以立馬轉換為文字信息,但是對于機器來說接收到的則是數字信號而已。當總理問“你為什么叫小度”時,“NI”這個發音可以是“泥”也可以是“逆”,所以最終要確定是哪個字還需要語音技術來實現計算概率的最大化。

  第二步,更為核心的自然語言處理技術(NLP),當機器獲得總理說的話之后就需要進行理解,對于我們人而言聽到一句話并理解是一件非常理所當然的事情,但是對于機器來說就很麻煩,比如當機器收到“你為什么叫小度”這句話后,要判斷意思到底是“你的名字為什么是小度”還是“你為什么呼叫小度”,這種語義理解困境會在語義理解中反復出現。

  自然語言處理技術(NLP)正是針對這一問題,2010年國際自然語言處理專家,王海峰博士加入百度,對NLP發展進行了一次系統性的梳理和規劃。百度將NLP各項技術應用到復雜長查詢的意圖分析問題,當搜索“宮崎駿的電影”時,在之前只會搜出一堆網頁,而現在的百度會默認給出所有宮崎駿的相關電影,用戶可以直接進入觀看。其次當用戶搜索“感冒可以吃螃蟹嗎”這類不確定性問題時,在傳統搜索時代同樣只會給出一堆網頁,而目前則是基于深度問答技術自動匯總網上的大量知識,并得到更加精煉、全面性的答案,更為高效的幫助用戶決策,而不是直接給出一堆不確定性的網頁讓用戶不停打轉。

  簡而言之,自然語言處理(NLP)技術是不斷去分析用戶搜索意圖,通過反復學習與大數據分析來給出用戶最優的答案,而目前百度的NLP技術集中體現在搜索上,所以此次小度能夠較為準確的回答總理問題并非一朝一夕之事,而是長期積累后的結果,并且依然在不斷的發展中。

  第三步,機器學習技術,現在當機器理解完這句話的目的之后,就需要為其提供答案,通過全網大數據為總理提供答案,如果總理是百度的老用戶,并且使用次數越多,那么百度就會根據其用戶歷史行為記錄,給出更為精確的答案。

  根據百度2014年數據,10PB的網頁數據(1PB=1024TB),關鍵搜索的平均響應速度僅0.3秒完成,這需要海量的集群服務器才能做到,這種大數據挖掘的有賴于機器學習。

  而在自然語言處理(NLP)技術方面已發展的成熟性則是小度機器人深度問答的重要基礎。例如,當北京市長王安順問:“你對北京城市管理有什么意見?”,得到的答案已不再是互聯網上五花八門的答案,而是一個統一的答案“不堵車”,這是NLP深度問答系統自動對網上大量相關知識、觀點進行自動分析、抽取、統計而得到的結果。從小度機器人身上可以看到,小度在一定意義上正在突破傳統“搜索引擎”的概念,因為它不僅搜索信息,而且還生產知識。

  深度問答技術的研發過程很復雜,一個完整的深度問答系統需要多項NLP技術組合而成,從問題分類到需求解析,從網頁檢索到知識庫查詢,從信息抽取到答案排序……每一個環節都需要達到很高的精度,才能使得最終搭建起來的問答系統準確地理解問題并給出答案。所以,小度這一產品是通過各種技術的組合與疊加,對用戶體驗的全新升級。

  二 小度機器人在百度的戰略地位是什么?

  當我們聊起人機對話通常會想到的是圖靈測試,但事實上圖靈測試的目的是機器是否能夠具備人類思維,而小度的目的則是幫助人解決問題,這也與李彥宏的理念有關,只專注能夠為人帶來真正價值的技術。

  在百度所有申請的專利中,向媒體對外公布的專利只有兩個,第一是李彥宏創立百度時所用到的“超級文本鏈接”技術,該技術是百度能夠走到今天的關鍵因素;而第二個公布的技術則是小度的人工智能專利,側面說明了小度對于百度的重要性。

  而這種對于人工智能的重視并非停留在虛無縹緲的口頭層面,百度正在全面落實人工智能的落地應用。目前度秘已經接入手機百度,而且還可能計劃接入百度地圖、百度糯米,多個平臺的用戶都可以通過向度秘起各種請求來完成所需要的服務,實現由點到面的整體性串聯。

  回看小度的推出也是有其整體邏輯,百度屬于技術型驅動型公司,其核心是為用戶提供信息搜索服務,在PC時代還是移動時代,其努力的方向依然是讓用戶便捷獲取信息甚至服務,而未來的人工智能時代會將這種加速帶到全新的高度。

  人工智能也是國家“互聯網+”戰略的一個重要組成部分,總理在今年3月6日的政府報告工作中第一次提到了將“互聯網+”放到國家戰略層面,而今年李彥宏也在兩會中提出“中國大腦”計劃,兩者不謀而合。而李彥宏也說百度這幾年正在專注的“百度大腦”也是“中國大腦”的迷你版,隨著未來計算能力的增加以及成本的降低,曾經不能做不敢做的事情都將變成現實,未來的人工智能也將更加無處不在。

  結語:小度是一個綜合百度各方面人工智能技術的合體,代表著未來人工智能將人類生活由點到面連接的可能性,而現在的人工智能就在像當年的互聯網一樣,正在不知不覺的進入我們生活,至少,現在連總理也開始關心了。

[责任编辑:蒋璐]
网友评论
相关新闻