數碼嘢 (數碼野) [數碼o野]: [數碼新聞]搜索的未來：從僵硬學習到人機自然對話

2013年3月17日星期日

[數碼新聞]搜索的未來：從僵硬學習到人機自然對話

Google 研發主管約翰‧博伊德在用戶體驗實驗室中工作

　　導語：國外媒體今日撰文指出，“對話搜索”能夠理解問題背景，並具有其他諸多“獨門絕技”，正日益受到業界關注，可能會成為 Google 與微軟爭奪的下一個戰場。也許一兩年以後，用戶在與搜索引擎對話時，感覺就像與人說話一樣自然。

　　以下為文章主要內容：

　　讓搜索更自然

　　只要一談到所謂的“對話搜索”(conversational search)， Google 搜索業務主管阿米特‧辛格爾(Amit Singhal)總喜歡舉這樣的一個例子：掏出手機，然後說，“賈斯汀‧比伯(Justin Bieber)多大了？”緊接著又問，“他有多高呢？”

　　辛格爾最近在採訪中透露，對於代詞以及指代消解(Anaphora resolution)的使用， Google 已經有了基本的思路。所以，辛格爾問完上述兩個問題以後，Android機器人就會明白，第二個問題中的“他”，就是指第一個問題中的專有名詞──賈斯汀‧比伯。

　　辛格爾表示：“過去，搜索總是一錘子買賣。但現在，‘他’指的就是‘賈斯汀‧比伯’。除了 Google ，還沒人能做到這一點。今天，你看到的是兩句對話。在今後的一兩年內，如果我們在搜索中出現更為寬泛的對話，我並不會感到吃驚。也就是說，用戶在與搜索引擎對話過程中，感覺就像與人說話一樣。”

　　多年來，在線搜索一直在向用戶灌輸一種固有觀念，學習老套生硬的語言：輸入需要搜索的信息，將各個關鍵詞分隔開，每次搜索都從頭開始，用引號來表示一個短語。給人感覺這就像是在學習一門外語，即有些人所稱的“Searchese”。 Google 和其他公司近來都在努力實現一個目標，那就是讓搜索變得更為自然，讓對話更多地出現在搜索當中。

　　理解問題背景

　　所謂“對話搜索”具有以下幾個特點，讓搜索能夠理解問題的背景，做出合理的猜測；能夠接受語音輸入；能夠解析同音異義詞，適應流動環境；能夠在不同的設備上識別出同一位用戶。

　　這些概念源於20世紀90年代，最早是在諸如AT&T實驗室“沃森”(Watson)和麻省理工學院“木星”(Jupiter)等研究項目中提出的。“木星”項目是一種流動服務，能夠明白用戶有關天氣的各種問題。

　　表面看起來，對話搜索似乎屬於界面之類的問題──只要找到能讓人訪問相同信息的更便捷途徑即可，但實際上，技術人員仍需要深入理解人工智能技術，以及計算機以外的領域。另外，與 Google “知識圖譜”(Knowledge Graph)等其他最新搜索形式相比，對話搜索會更容易使用。

　　微軟必應搜索業務主管斯蒂芬‧韋茨(Stefan Weitz)也表示，必應正在多個領域發力，試圖讓搜索變得更為自然。例如，在語義搜索項目Satori以及Local Scout等個性化應用中，微軟一直在努力消除搜索問題的歧義。

　　韋茨說，“當大家在討論對話搜索時，其實是在討論如何能理解你之前所說過的事情，或你趕赴的目的地。我們面臨的真正挑戰是，如何利用網頁，來解構作為超高清晰度實體代理的數字世界。”

　　韋茨舉例說，必應現在可以回答一些高難度問題，如“湯姆‧克魯斯(Tom Cruise)和獨角獸的電影”，“世界上最高的山”等，雖然它還需要一段時間思考，但最終會給出《黑魔王》(Legend)和“珠穆朗瑪峰”這樣的答案。

　　十年磨一劍

　　Google Suggest或許是 Google 發佈的第一款對話搜索服務，該項目最早始於2004年，當用戶在搜索引擎中輸入關鍵字時， Google 就會自動給出一些常用的建議詞，Google Suggest是即時搜索Google Instant的前身，後者在2010年推出，能夠為用戶搜索的問題提供可能的答案。

　　 Google 研發主管約翰‧博伊德(John Boyd)目前正帶領著一個團隊，邀請用戶體驗 Google 的新產品，並根據用戶反饋的結果，評估他們未來需要的服務。

　　博伊德表示，他當前工作的一個特別之處是，那些受邀來 Google 園區配合他們研究和調查的志願者，往往沒有發現 Google 究竟是在測試什麼東西。當這些人參與Google Instant測試時，他們甚至以為此次測試的新東西是位於左側的老版導航欄，而不是就出現在眼前的搜索結果。

　　由於沒有前後對比，即使是在用戶每天使用的網站上，他們也很難認出那些是新東西。不過，這也並不一定就是壞事。博伊德希望對 Google 搜索的功能循序漸進的改進，讓人們逐漸從學習行為，轉移到自然的對話中去。

　　避免畫蛇添足

　　博伊德在5年前加盟了 Google ，之前曾在雅虎擔任搜索部門主管。他說，“ Google 真的很神奇，但由於我們之前一直秉承順其自然的原則，結果卻讓人們形成了一些壞習慣。”例如，有人認為完全以大寫輸入關鍵詞時，搜索結果可能會更貼近用戶需要，但事實並非如此。

　　據博伊德介紹，這就是心理學家斯金納(B.F. Skinner)提出的“盲目性學習”(superstitious learning)的典型例証。一些用戶往往輸入雙引號，試圖讓 Google 搜索引擎明白他們真正想要找的東西。但這其實是畫蛇添足，引號在搜索中是多餘的，在一些情況下，甚至會將重要結果排除在外。

　　搜索引擎需要能夠更好地瞭解我們的思維，而不是每一次搜索都要從零開始。

　　去年， Google 曾對150人進行了調查，通過一款定製化流動應用，在一天的不同時段對他們進行提問，問他們想要知道什麼事情。一位女性參與者想要知道的信息包括，“我怎樣才能在8天里賺200美元？”、“起訴一個人需要多長時間？”、“什麼是弦理論？”、“怎樣做才能消除牙齒的疼痛感？”、“如何才能找到保釋代理人？”與此同時，一位男性參與者則表示，他的汽車出現了故障、小狗身上有跳蚤，煙霧警報器需要重新安裝，想給孫女買一輛車。

　　這些問題都事關生活的瑣碎事情，但無論大小，都能幫助 Google 更好地理解搜索機制，進而更好地幫助用戶。例如，上面那位女士問的問題都圍繞“監獄”這個主題，這樣 Google 搜索起來更為方便；而那位男士的問題主題則相當繁雜，但或許 Google 能幫他理順各種關係並付諸實施。

　　 Google 兩大利器

　　在搜索領域， Google 目前正專注於兩個方面：語音搜索，以及面向Android平台打造的智能個人助理Google Now。語音搜索在用戶駕車或雙手忙碌時尤其有用。博伊德認為，語音是一種自然的對話形式。

　　與此同時，Android版Google Now應用能幫助用戶記錄他們的生活習慣，基於用戶搜索歷史，向他們顯示一些信息，如比賽比分、天氣和路況等。該應用最近又增加了新的功能，當用戶在指定時間進入某家電影院或飛機場，他們之前購買的的電影票以及登機牌就會顯示出來。

　　Google Now產品主管巴利斯‧古爾特金(Baris Gultekin)最近在接受採訪時表示，“我們的用戶在需要幫助時，面臨的情況各不相同。我們的目標是能夠預測出用戶所有的需求，並在他們需要時給出這些結果。這是一項艱巨的任務。我們現在基本上專注於向用戶獲得他們需要的信息，一旦用戶需要這些問題的答案，還沒等他們問，我們就會呈現出來。”

　　對於一部分用戶而言，這些都是重大而令人興奮的技術進步，但若想實現與電腦之間真正隨意的對話，恐怕還有很長的路要走。Google Now理解的信息還非常有限，對世界的感知仍需要進一步加深。

　　業內人士指出，儘管語音識別相比以前已有了很大進步，但他們仍會不斷陷入“Searchese”的困局當中。在這種情況下，他們不得不清楚地發出每一個字母的音，同時大聲說出標點符號。所以說，我們距離世界上最自然的搜索方式還十分遙遠。(清辰)

.[數碼新聞]搜索的未來：從僵硬學習到人機自然對話
http://digital1010.blogspot.com/2013/03/blog-post_6069.html

網頁

2013年3月17日 星期日

[數碼新聞]搜索的未來：從僵硬學習到人機自然對話

2013年3月17日星期日