2013年3月17日 星期日

[數碼新聞]搜索的未來:從僵硬學習到人機自然對話






Google 研發主管約翰‧博伊德在用戶體驗實驗室中工作

  導語:國外媒體今日撰文指出,“對話搜索”能夠理解問題背景,並具有其他諸多“獨門絕技”,正日益受到業界關注,可能會成為 Google 與微軟爭奪的下一個戰場。也許一兩年以後,用戶在與搜索引擎對話時,感覺就像與人說話一樣自然。

  以下為文章主要內容:
  讓搜索更自然

  只要一談到所謂的“對話搜索”(conversational search), Google 搜索業務主管阿米特‧辛格爾(Amit Singhal)總喜歡舉這樣的一個例子:掏出手機,然後說,“賈斯汀‧比伯(Justin Bieber)多大了?”緊接著又問,“他有多高呢?”

  辛格爾最近在採訪中透露,對於代詞以及指代消解(Anaphora resolution)的使用, Google 已經有了基本的思路。所以,辛格爾問完上述兩個問題以後,Android機器人就會明白,第二個問題中的“他”,就是指第一個問題中的專有名詞──賈斯汀‧比伯。

  辛格爾表示:“過去,搜索總是一錘子買賣。但現在,‘他’指的就是‘賈斯汀‧比伯’。除了 Google ,還沒人能做到這一點。今天,你看到的是兩句對話。在今後的一兩年內,如果我們在搜索中出現更為寬泛的對話,我並不會感到吃驚。也就是說,用戶在與搜索引擎對話過程中,感覺就像與人說話一樣。”

  多年來,在線搜索一直在向用戶灌輸一種固有觀念,學習老套生硬的語言:輸入需要搜索的信息,將各個關鍵詞分隔開,每次搜索都從頭開始,用引號來表示一個短語。給人感覺這就像是在學習一門外語,即有些人所稱的“Searchese”。 Google 和其他公司近來都在努力實現一個目標,那就是讓搜索變得更為自然,讓對話更多地出現在搜索當中。

  理解問題背景

  所謂“對話搜索”具有以下幾個特點,讓搜索能夠理解問題的背景,做出合理的猜測;能夠接受語音輸入;能夠解析同音異義詞,適應流動環境;能夠在不同的設備上識別出同一位用戶。

  這些概念源於20世紀90年代,最早是在諸如AT&T實驗室“沃森”(Watson)和麻省理工學院“木星”(Jupiter)等研究項目中提出的。“木星”項目是一種流動服務,能夠明白用戶有關天氣的各種問題。

  表面看起來,對話搜索似乎屬於界面之類的問題──只要找到能讓人訪問相同信息的更便捷途徑即可,但實際上,技術人員仍需要深入理解人工智能技術,以及計算機以外的領域。另外,與 Google “知識圖譜”(Knowledge Graph)等其他最新搜索形式相比,對話搜索會更容易使用。

  微軟必應搜索業務主管斯蒂芬‧韋茨(Stefan Weitz)也表示,必應正在多個領域發力,試圖讓搜索變得更為自然。例如,在語義搜索項目Satori以及Local Scout等個性化應用中,微軟一直在努力消除搜索問題的歧義。

  韋茨說,“當大家在討論對話搜索時,其實是在討論如何能理解你之前所說過的事情,或你趕赴的目的地。我們面臨的真正挑戰是,如何利用網頁,來解構作為超高清晰度實體代理的數字世界。”

  韋茨舉例說,必應現在可以回答一些高難度問題,如“湯姆‧克魯斯(Tom Cruise)和獨角獸的電影”,“世界上最高的山”等,雖然它還需要一段時間思考,但最終會給出《黑魔王》(Legend)和“珠穆朗瑪峰”這樣的答案。

  十年磨一劍

  Google Suggest或許是 Google 發佈的第一款對話搜索服務,該項目最早始於2004年,當用戶在搜索引擎中輸入關鍵字時, Google 就會自動給出一些常用的建議詞,Google Suggest是即時搜索Google Instant的前身,後者在2010年推出,能夠為用戶搜索的問題提供可能的答案。

   Google 研發主管約翰‧博伊德(John Boyd)目前正帶領著一個團隊,邀請用戶體驗 Google 的新產品,並根據用戶反饋的結果,評估他們未來需要的服務。

  博伊德表示,他當前工作的一個特別之處是,那些受邀來 Google 園區配合他們研究和調查的志願者,往往沒有發現 Google 究竟是在測試什麼東西。當這些人參與Google Instant測試時,他們甚至以為此次測試的新東西是位於左側的老版導航欄,而不是就出現在眼前的搜索結果。

  由於沒有前後對比,即使是在用戶每天使用的網站上,他們也很難認出那些是新東西。不過,這也並不一定就是壞事。博伊德希望對 Google 搜索的功能循序漸進的改進,讓人們逐漸從學習行為,轉移到自然的對話中去。

  避免畫蛇添足

  博伊德在5年前加盟了 Google ,之前曾在雅虎擔任搜索部門主管。他說,“ Google 真的很神奇,但由於我們之前一直秉承順其自然的原則,結果卻讓人們形成了一些壞習慣。”例如,有人認為完全以大寫輸入關鍵詞時,搜索結果可能會更貼近用戶需要,但事實並非如此。

  據博伊德介紹,這就是心理學家斯金納(B.F. Skinner)提出的“盲目性學習”(superstitious learning)的典型例証。一些用戶往往輸入雙引號,試圖讓 Google 搜索引擎明白他們真正想要找的東西。但這其實是畫蛇添足,引號在搜索中是多餘的,在一些情況下,甚至會將重要結果排除在外。

  搜索引擎需要能夠更好地瞭解我們的思維,而不是每一次搜索都要從零開始。

  去年, Google 曾對150人進行了調查,通過一款定製化流動應用,在一天的不同時段對他們進行提問,問他們想要知道什麼事情。一位女性參與者想要知道的信息包括,“我怎樣才能在8天里賺200美元?”、“起訴一個人需要多長時間?”、“什麼是弦理論?”、“怎樣做才能消除牙齒的疼痛感?”、“如何才能找到保釋代理人?”與此同時,一位男性參與者則表示,他的汽車出現了故障、小狗身上有跳蚤,煙霧警報器需要重新安裝,想給孫女買一輛車。

  這些問題都事關生活的瑣碎事情,但無論大小,都能幫助 Google 更好地理解搜索機制,進而更好地幫助用戶。例如,上面那位女士問的問題都圍繞“監獄”這個主題,這樣 Google 搜索起來更為方便;而那位男士的問題主題則相當繁雜,但或許 Google 能幫他理順各種關係並付諸實施。

   Google 兩大利器

  在搜索領域, Google 目前正專注於兩個方面:語音搜索,以及面向Android平台打造的智能個人助理Google Now。語音搜索在用戶駕車或雙手忙碌時尤其有用。博伊德認為,語音是一種自然的對話形式。

  與此同時,Android版Google Now應用能幫助用戶記錄他們的生活習慣,基於用戶搜索歷史,向他們顯示一些信息,如比賽比分、天氣和路況等。該應用最近又增加了新的功能,當用戶在指定時間進入某家電影院或飛機場,他們之前購買的的電影票以及登機牌就會顯示出來。

  Google Now產品主管巴利斯‧古爾特金(Baris Gultekin)最近在接受採訪時表示,“我們的用戶在需要幫助時,面臨的情況各不相同。我們的目標是能夠預測出用戶所有的需求,並在他們需要時給出這些結果。這是一項艱巨的任務。我們現在基本上專注於向用戶獲得他們需要的信息,一旦用戶需要這些問題的答案,還沒等他們問,我們就會呈現出來。”

  對於一部分用戶而言,這些都是重大而令人興奮的技術進步,但若想實現與電腦之間真正隨意的對話,恐怕還有很長的路要走。Google Now理解的信息還非常有限,對世界的感知仍需要進一步加深。

  業內人士指出,儘管語音識別相比以前已有了很大進步,但他們仍會不斷陷入“Searchese”的困局當中。在這種情況下,他們不得不清楚地發出每一個字母的音,同時大聲說出標點符號。所以說,我們距離世界上最自然的搜索方式還十分遙遠。(清辰)



.[數碼新聞]搜索的未來:從僵硬學習到人機自然對話
http://digital1010.blogspot.com/2013/03/blog-post_6069.html