2013年1月17日 星期四

[數碼新聞]世界最聰明計算機已經學會髒話




  不知道大家還記不記得IBM的Watson,雖然它的運算能力跟Top500那些老大哥比不得,但早在2年前,Watson就在一檔智力競賽節目Jeopardy上戰勝了另外兩名人類選手,贏得了“世界上最聰明的計算機”的稱號。今天,我們要告訴大家一個很不幸的消息,Watson學會講髒話了。



IBM Watson

  以現在的超級計算機為標准衡量,Watson的運算能力並不強,它之所以如此“聰明”,是因為IBM為它研發了一套集高級自然語言處理、信息檢索、知識表示、自動推理、機器學習等開放式問答技術的應用。也就是說,Watson是可以自我學習的,它的信息來源包括百科全書、字典、詞典、新聞和文學作品等。所有的參考材料需要存儲在足足有4TB的磁盤上,這套系統可以說這是IBM研發團隊的驕傲。但是最近IBM發現,這台世界上最聰明的計算機好像有些聰明過頭了。

  Watson需要通過不斷學習來擴充它的資料庫,也就意味著要不斷學習人類的語言。那麼教材的來源是什麼呢?答案就是詞典。不幸的是,Watson好像從這個沒有節操的世界里學到了一些不該學的詞匯。如absurd、profane和physiological impossible(解釋請自行查閱詞典)等令人害臊的詞語。Watson無所不包的詞匯量開始令它用一些不可思議的詞匯來描述問題的解答(請讀者自行想象),在測試中,它甚至會用“bullshit”(胡說,廢話)來回答測試人員的提問。據《財富》雜志的Michal Lev-Ram表示,Watson並不能區分禮貌用語和髒話之間的區別,這使它養成了不好的習慣。

  最終,Watson計劃負責人Brown不得不清空Watson內存中來源於詞典的數據。事實再次証明了人類語言的複雜性,在這個無節操的世界里,計算機AI還是小心謹慎為妙。



.[數碼新聞]世界最聰明計算機已經學會髒話
http://digital1010.blogspot.com/2013/01/blog-post_6283.html
.[數碼新聞]世界最聰明計算機已經學會髒話
http://digital1010.blogspot.com/2013/01/blog-post_6283.html