3月22日,“盡在聽說之間”百度語音搜索媒體開放日在北京舉行。百度副總裁王海峰在《百度語音搜索:會(huì)傾聽,愛思考》演講中表示,百度語音搜索不僅僅是語音識(shí)別和搜索的簡單相加,它更懂得理解和思考,最終將幫助人們更便捷自然地獲取信息找到所求,并帶動(dòng)整個(gè)生態(tài)的發(fā)展。

一直以來存在這樣的誤區(qū),很多人認(rèn)為語音搜索僅僅是語音和搜索的簡單串接。王海峰表示,百度語音搜索是語音技術(shù)、自然語言處理、智能搜索三方面的完美融合,以更自然的交互方式,對(duì)用戶所說更準(zhǔn)確的識(shí)別,對(duì)用戶需求更精準(zhǔn)的理解,進(jìn)而為用戶提供更滿意的結(jié)果。
王海峰介紹道,百度語音搜索目前已通過人工智能做到了“聽”和“說”,而且還嘗試完成人類復(fù)雜的行為——溝通。集成語音識(shí)別、語義理解、深度問答、知識(shí)推理、多輪對(duì)話、智能摘要、情感分析、語言生成、語音合成等能力于一身后,百度語音搜索已經(jīng)能夠滿足用戶的多種復(fù)雜需求。
“例如,‘請(qǐng)問三亞最近的天氣都什么樣子了’,這是非常口語化的說法,”王海峰現(xiàn)場舉例道,“百度語音搜索可以做到對(duì)用戶的口語表達(dá)進(jìn)行分析理解,并提供信息和服務(wù)。”除了口語化理解,百度語音搜索在Query語義理解上同樣表現(xiàn)搶眼,比如“謝霆峰的兒子是誰”,“謝霆峰是誰的兒子”,兩個(gè)提問的字是完全一樣的,早期搜索引擎不管語序和語法,導(dǎo)致搜索到同樣的結(jié)果,而現(xiàn)在經(jīng)過分析理解之后,可以找出不同,并給出不同的答案。
百度語音搜索的理解思考能力還不僅僅局限于此,王海峰現(xiàn)場以多輪交互為例進(jìn)行了介紹。例如,當(dāng)用戶用語音搜索詢問“從北京到上海的動(dòng)車多少錢”后,如果還想再看看機(jī)票,只需要直接追問一句“機(jī)票呢”,百度語音搜索的人工智能就能夠很好結(jié)合這句話和上下文,準(zhǔn)確理解“動(dòng)車”和“機(jī)票”之間的可替代關(guān)系,并通過大數(shù)據(jù)驗(yàn)證替代后是一個(gè)合理的需求,進(jìn)而精準(zhǔn)理解用戶的意圖,給出機(jī)票價(jià)格信息。
值得一提的是,在少量詞語沒聽清楚的情況下,百度語音搜索甚至能夠在大數(shù)據(jù)的支持下,準(zhǔn)確“猜”出用戶需求并給予滿足。比如,它能夠?qū)ⅰ盎丶业脑竿黝}歌曲”修正為“回家的欲望主題歌曲”,能將“帕皮醬”糾錯(cuò)為“papi醬”。甚至在面對(duì)漢字同音字,當(dāng)?shù)谝淮握Z音輸入顯示為“孫儷的電視劇”,如果這時(shí)你對(duì)手機(jī)說“茉莉的莉”,它就會(huì)改成“孫莉的電視劇”。

除此之外,百度語音搜索在知識(shí)推理、深度問答、以及消歧等方面的表現(xiàn)都令現(xiàn)場媒體稱贊。區(qū)別于使用文本搜索,當(dāng)語音搜索有準(zhǔn)確答案時(shí),它能夠根據(jù)問法去組織回答的語言,并通過聲音反饋來回答問題。
在百度強(qiáng)大的人工智能技術(shù)支持下,王海峰對(duì)語音搜索的前景充滿信心,“現(xiàn)代搜索引擎要做的是連接人與信息及服務(wù),它不僅會(huì)傾聽,更懂得理解與思考,未來將更好地造福人類。”