2013年1月24日 星期四

[數碼新聞]能監聽語音通話的 智能語音助理MindMeld






MindMeld能監聽兩人或多人的語音通話,實時理解通話內容。

  蘋果的語音助理服務Siri能提供用戶詢問的信息,而一家名為Expect Labs的公司試圖更進一步,跳過用戶提問這一步驟。

  Expect Labs只有10名員工,該公司正在開發一個“永遠開啟的Siri”。這一技術能監聽兩人或多人之間的語音通話,實時理解通話內容,並向用戶提供該技術所認為的有用信息。

  未來幾周中,Expect Labs計劃推出首個產品MindMeld,這是一款可撥打視頻和語音電話的iPad應用。此外,Expect Engine還計劃今年向其他公司提供“預測計算”引擎的授權,這將給平板電腦、手機和車載設備上的語音應用帶來新功能。例如在大公司,企業可以開發一款軟件,在電話會議過程中從文檔和日程表服務器中抓取以往的會議記錄。而呼叫中心公司可以利用該技術,在接線員與顧客交談時獲取顧客的購買記錄。

  Expect Labs的CEO Timothy Tuttle是一名計算機科學家,他於2011年創立了Expect Labs。他表示:“這是一種與上下文相關的、持續的、具有預測功能的搜索技術,在實時對話的過程中進行。”Expect Labs已獲得穀歌風投和Greylock Partners的投資。Tuttle表示,MindMeld將是市面上第一款具備這種功能的產品。

  Expect Labs在本月的拉斯維加斯消費電子展(CES)上展示了MindMeld。用戶可以通過Facebook進行注冊和登錄,並與最多8人進行免費的視頻和語音通話。在通話中,如果參與者點擊應用的一個按鈕,那麼MindMeld將利用Nuance的語音識別技術,分析此前15至30秒對話。隨後,MindMeld將確定對話中的關鍵詞,例如對話是為了尋找一家壽司店,或討論今天的一條大新聞,隨後通過穀歌新聞、Facebook、Yelp、YouTube,以及其他多個信息來源,查找具有相關性的信息,並在屏幕上向用戶提供圖片和鏈接地址。通過手勢操作,用戶可以選擇將結果分享給通話的對方。

  Tuttle將MindMeld視作大規模商用前的一次測試,因此他沒有計劃在該應用中引入廣告,用戶只需支付少許費用即可下載該應用。在應用中,用戶需要點擊某一按鈕才能啟動監聽功能,從而避免應用向用戶提供太多無用的搜索結果。不過,Expect Labs計劃提供授權的平台能持續監聽任意時長的通話,並進入預測模式,從而搜索與談話內容相關的信息。該平台可以獲得任何公開的信息。

  Expect Labs的技術與穀歌的最新產品Google Now有些類似。目前,穀歌已在Android系統中集成了Google Now,在用戶提問之前就向用戶提供相關的信息。Google Now根據用戶所在位置、電子郵件和網頁搜索歷史來做出預測。穀歌正准備推出穀歌眼鏡,因此這種在後台運行、無需動手操作的互動技術將成為必需品。

  對於Expect Labs的技術,卡耐基梅隆大學人機互動技術研究員Anind Dey表示:“他們瞄准了一個很好的細分市場,這一技術的優勢在於不需要專門的用戶操作。”MindMeld受限於語音識別技術,語音識別的准確性將成為關鍵。不過Tuttle表示,MindMeld對不准確的語音識別有一定的容忍度。

  一些人可能會覺得,在通話過程中被監聽令人感覺不快。Tuttle對此表示,Expect Labs不會儲存任何對話的音頻數據。即使用戶在應用中啟用相關設置,Expect Labs也只會記錄通話中的關鍵詞。

  Dey正在開發可佩戴式藍牙麥克風,能分析人們的會話。他認為,這樣的技術未來可以處理人們的日常對話,而不僅僅是通過應用撥打的電話。Tuttle也希望,Expect Labs的技術能逐漸發展,成為“通用的對話助理”。他表示,已有主流手機公司和汽車公司聯系Expect Labs,希望利用該公司的技術開發軟件平台。

  Tuttle表示:“他們知道這是未來人們使用設備的方式。他們也知道,在搜索框中輸入關鍵詞搜索信息的時代即將過去。”

  本文編譯自MIT Technology Review
  (李瑋)



.[數碼新聞]能監聽語音通話的 智能語音助理MindMeld
http://digital1010.blogspot.com/2013/01/mindmeld_24.html
.[數碼新聞]能監聽語音通話的 智能語音助理MindMeld
http://digital1010.blogspot.com/2013/01/mindmeld_24.html