當前位置:名人名言大全網 - 笑話故事 - 沃森超級計算機的賽前軼事

沃森超級計算機的賽前軼事

2009年12月,弗裏德曼和其他制作人員第壹次見到“沃森”,當時這臺超級電腦與兩名人類選手展開對決。“沃森”采用IBM POWER7服務器,能夠將所處理的任務實現最優化。IBM表示參加挑戰的“沃森”必須快速處理所有任務。此外,這臺超級電腦還采用了壹系列專利技術,能夠讓任務和數據處理與信息實時分析同時進行。

法魯西指出《危險》的本質就是要讓技術朝著正確的方向發展。他說:“這檔節目涉及的領域很廣,會提出各種各樣的問題,是我們希望參加的挑戰之壹。這項挑戰是對選手信心的壹種考驗,妳必須在確信答案正確後才回答,此外,妳還不得不快速給出答案。”

IBM表示“沃森”采用的技術能夠在醫療衛生等很多領域發揮作用,能夠幫助提高醫生診斷病情的準確性,改進在線自助咨詢臺,為遊客和居民提供相關城市的特定信息,或者通過手機為消費者提供支持。為了備戰《危險》,“沃森”曾與前《危險》冠軍展開50多次對決。此外,它還參加了《危險》節目組為所有潛在選手準備的測驗並順利通過。

《危險》監制哈裏·弗裏德曼稱,在IBM第壹次與《危險》節目組接觸時,制作人員均產生濃厚興趣,但同時也擔心觀眾對“沃森”參加比賽產生分歧,將其視為壹個噱頭或者花招。他說:“現在態度不同了。這是電腦獲取的知識與最優秀的《危險》選手獲取的知識之間的壹種較量。這是壹場重要的比賽,我們都希望參與其中。” 沃森由90臺IBM服務器、360個計算機芯片驅動組成,是壹個有10臺普通冰箱那麽大的計算機系統。它擁有15TB內存、2880個處理器、每秒可進行80萬億次運算(這是目前的情況)。這些服務器采用Linux操作系統。IBM為沃森配置的處理器是Power 7系列處理器,這是當前RISC(精簡指令集計算機)架構中最強的處理器。它采用45nm工藝打造,擁有八個核心、32個線程,主頻最高可達4.1GHz,其二級緩存更是達到了32MB。存儲了大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》(World Book Encyclopedia)等數百萬份資料。每當讀完問題的提示後,沃森就在不到三秒鐘的時間裏對自己的數據庫挖地三尺,在長達2億頁的漫漫資料裏展開搜索。

沃森是基於IBMDeepQA(深度開放域問答系統工程)技術開發的。作為沃森超級電腦基礎的DeepQA技術可以讀取數百萬頁文本數據,利用深度自然語言處理技術產生候選答案,根據諸多不同尺度評估那些問題。IBM研發團隊為沃森開發的100多套算法可以在3秒內解析問題,檢索數百萬條信息然後再篩選還原 成 答案輸出成人類語言。每壹種算法都有其專門的功能。其中壹種算法被稱為嵌套分解算法,它可以將線索分解成兩個不同的搜索功能。

沃森超級計算機與谷歌搜索引擎相比究竟誰更智能?對於這壹問題,美國《商業周刊》前科技編輯史蒂芬·貝克爾近日通過分析和比較後認為,沃森超級計算機比谷歌更智能。貝克爾認為,答案很簡單,谷歌現在還不能回答問題。谷歌以兩種方式信賴於我們人類的大腦:首先,在描述用戶的查詢請求時,谷歌會讓用戶像計算機壹樣去思考,挑選出三或四個最符合計算機意圖的消息,形成壹個查詢結果列表。其次,谷歌會將用戶引導到與所查詢的答案類似的答案上去,讓用戶花更多的腦力去發現所需要查詢的確切答案。而沃森超級計算機則是自己處理所有問題。它必須要解碼復雜的英語,窮盡所有可能的答案,並選擇其中壹個,最終判定它是否足夠符合要求。 對計算機沃森來說,挑選出合適的語境是壹項艱巨任務,尤其是在充滿暗示和惡作劇的遊戲裏,而且它還必須確定答案的可靠性以及它是不是需要冒險去猜。沃森需要識別人類的語言,並從中分析微妙的含義,諷刺口吻、謎語、構詞斷句、詩篇線索等等這些邏輯和線索,並通過壹系列的數據比對和模擬人類的聯想能力得出精準的答案,再反向用人類的語言回答出來。此外,沃森還能模仿人類針對問題進行策略考慮,例如問題的挑選、是否略過不擅長的題目,還會模仿人類的口吻搞笑整個過程僅有計算機和軟件算法完成,沒有工程師參與(這種快速問答,其實也參與不了),也與互聯網斷開因此計算機不能作弊,必須自己想。

領導設計沃森 的IBM 研究團隊的科學家David Ferrucci 博士表示:經過四年的努力,我們的科學團隊相信沃森已經能夠快速理解《危險邊緣》問題的內容,分析它需要獲得的信息,得到精確的答案,並給出可信的回答。沃森會估計《危險邊緣》節目組剩下的獎金數額、自己比其他對手落後或領先多少、自己在特定類別的題目上的表現,及時調整自己的信息級別。如果沃森落後對手太多,它的信心級別會較低,例如40%,這時它仍會繼續努力;不過在領先對手時它也會想:我已經領先那麽多了,為什麽還要冒險呢?因此,即使它的信心值是75%,它也有可能會選擇不回答。

在開發沃森的四年間,研發團隊主要以兩種方式評估這套系統。首先,他們以成批的方式(如每次3000個問題)進行大規模測試以評估系統性能,實施錯誤分析,提高系統性能。基於這種多問題的表現可以從統計學角度作出重要的性能評估;其次,該團隊評估沃森的第二個方式是,與《危險邊緣》以前的參賽選手進行陪練比賽。在2009年冬天,他們與曾經出現在《危險邊緣》的選手進行了79場比賽,在剛剛過去的秋天,沃森與獲得過《危險邊緣》比賽冠軍的選手進行了55場對決。這些陪練比賽讓研發團隊對沃森的性能有了深入認識。 《危險邊緣》是哥倫比亞廣播公司益智問答遊戲節目,已經經歷了數十年歷史。該節目的比賽以壹種獨特的問答形式進行,問題設置的涵蓋面非常廣泛,涉及到歷史、文學、藝術、流行文化、科技、體育、地理、文字遊戲等等各個領域。根據以答案形式提供的各種線索,參賽者必須以問題的形式做出簡短正確的回。與壹般問答節目相反,《危險邊緣》以答案形式提問、提問形式作答。參賽者需具備歷史、文學、政治、科學和通俗文化等知識,還得會解析隱晦含義、反諷與謎語等,而電腦並不擅長進行這類復雜思考。

沃森的設計初衷則是要理解更為復雜的詞句、語言和人類知識。IBM科學家、沃森團隊的負責人大衛·費魯奇(David Ferrucci)表示,利用《危險邊緣》去開發計算機系統將推動技術向正確的方向發展。他表示: 節目會問各種問題。這同時涉及到信心,當妳認為妳的答案不正確時不要回答。妳還需要很快地做出判斷。IBM表示,贏得《危險邊緣》比賽並不是主要目的。通過沃森的技術,醫生可以更快地診斷病例,法律工作者也可以更快地研究案例。《危險邊緣》執行制片人哈裏·弗裏德曼(Harry Friedman)表示:這些很重要,我們希望成為其中的壹部分。 北京時間2011年2月17日,人機大戰最終成績出爐:電腦沃森狂勝人類。由IBM和美國德克薩斯大學聯合研制的超級電腦“沃森”(Watson)在美國最受歡迎的智力競猜電視節目《危險邊緣》中擊敗該節目歷史上兩位最成功的選手肯-詹寧斯和布拉德-魯特,成為《危險邊緣》節目新的王者。

在第三天的比賽中,IBM的超級電腦沃森獲得了41413美元的分數,而兩位人類選手肯·詹寧斯(Ken Jennings)和布拉德·拉特(Brad Rutter)分別僅獲得了19200美元和11200美元。

將三個比賽日的成績相加即可得出最後的總成績,沃森也是大幅領先於人類,最終成績上,沃森達到了77147美元,肯·詹寧斯排名第二,但只獲得了24000美元,而布拉德·拉特獲得了21600美元,排名第三。

在第三比賽日的比賽中,沃森壹路領先,以至於在進入最終的Final Jeopardy環節前,人類選手超過沃森的幾率已經幾乎不存在了。

在Final Jeopardy中,排名第二的肯·詹寧斯已經放棄追趕沃森,而選擇保住第二的位子,因此他僅賭了1000美元,排名第三的布拉德·拉特則放手壹搏,壓上了他所能賭的最大賭註——5600美元,而沃森再壹次暴露了他是非人類的本質,賭了17973美元,這和人類正常賭的整數大相徑庭。 美國哥倫比亞大學醫療中心和馬裏蘭大學醫學院已與IBM公司簽訂合同,兩所大學的醫療人員將利用沃森更快、更準確地診病、治病。它的海量信息庫中存有許多發表在期刊上的專業論文,可以讓醫生利用最新科研成果治療病人。

想要讓沃森真正成為醫生的得力助手,還需要對它進行改進。醫生需要的不只是壹個答案。而且有時病人提供的信息不準確或相互矛盾,這就需要醫生利用豐富的經驗進行判斷。IBM研發小組接下來的挑戰是,讓沃森多提供壹些假設情況,研發小組至少還需要兩年才能完成這壹任務。 ?14年前,IBM研發的計算機“深藍”(Deep Blue)戰勝了國際象棋冠軍卡斯帕羅夫;現在,這家公司以創始人Thomas J. Watson名字命名的計算機,繼續著對人類智能極限的挑戰。

IBM長於制造各種復雜的機器,除了服務器還有這種智能計算機(小型機的集群),它看起來可不僅僅就像那句有點諷刺意味的流行語說的那樣—IBM,不是個生產哲學的公司嗎?

在1960年代人工智能的技術研發停滯不前數年後,科學家便發現如果以模擬人腦來定義人工智能那將走入壹條死胡同。現在,“通過機器的學習、大規模數據庫、復雜的傳感器和巧妙的算法,來完成分散的任務”是人工智能的最新定義,這早已經取代了曾經甚囂塵上的“重建大腦”。

按照這個定義,沃森在人工智能上被認為又邁出了壹步。“深藍只是在做非常大規模的計算,它是人類數學能力的體現,”IBM中國研究院資深經理潘越告訴《第壹財經周刊》,他同時參與沃森項目,負責提供數據支持。“當涉及到機器學習、大規模並行計算、語義處理等領域,沃森了不起的地方在於把這些技術整合在壹個體系架構下來理解人類的自然語言。”

如果這些解釋有點晦澀難懂的話,那麽可以參看壹下《危險邊緣》的遊戲規則,妳便知道沃森的價值何在。

《危險邊緣》是哥倫比亞廣播公司壹檔長盛不衰的電視問答節目,自1964年開始播出,最精彩的地方在於遊戲裏的問題包羅萬象,幾乎涵蓋了人類文明的所有領域。它的規則是答對問題可以獲得獎金,答錯就會倒扣。

對人類來說,規則很簡單,但對沃森來說,則意味著眾多挑戰。首先沃森必須要聽懂主持人的自然語言,這是深藍不具備的;其次是沃森需要分析這些語言,比如哪些是反諷,哪些是雙關,哪些是連詞,隨後根據關鍵字判斷題目的意思,沃森進行相關搜索,並評估各種答案的可能性;最後選擇三個可能性最高的答案,當其中壹個可能性超過50%後,程序啟動,沃森按下搶答器。

這些得以實現靠的是90臺IBM服務器、360個計算機芯片驅動以及IBM研發的DeepQA系統。IBM為沃森配置的處理器是Power 750系列處理器,這是當前RISC(精簡指令集計算機)架構中最強的處理器—這些得以支持沃森最終得出可靠答案的時間不超過3秒鐘。

沃森主打的是小型機的並行運算。IBM在大型機上的地位很難撼動—在小沃森(創始人老沃森的兒子)執掌IBM時期,IBM投入約60億美元,這筆超過當年NASA的研發經費,最終把日本的NEC與法國的克雷排擠出去,奠定了IBM在大型機市場的壟斷地位。

“在IBM的內部員工培訓上流傳著壹句笑話,那便是在大型機領域,有97%的市場份額來自IBM,剩下的3%來自淘汰的IBM二手大型機。”IBM服務器銷售部門前負責人告訴《第壹財經周刊》。

IBM試圖把大型機上的優勢帶入到小型機領域。沃森主打的正是IBM的銷售新星90臺小型機的並行運算,“IBM小型機的運算速度是突出的,”上述IBM員工評價說,“因為它把大型機的CPU研發優勢直接移植到小型機上來了。”

IBM是為數不多的可以有能力獨立開發小型機CPU的廠家,IBM還將這些技術出售給了除英特爾以外的芯片制造商。

現在,在小型機市場上,IBM與HP的市場比例大致為2:1,另外壹家小型機公司SUN則現在主要針對低端市場。

此外,IBM的全球研發團隊的某種模式也加大了沃森贏得比賽的可能。

這些團隊分工極為細致,比如以色列海法團隊負責深度開放域問答系統工程的搜索過程,日本東京負責沃森在問答中將詞意和詞語連接,IBM中國研究院和上海分院則負責以不同的資源給沃森提供數據支持,還有專門研究算法的團隊以及研究策略下註的博弈團隊等。

“我們就好像是每個不同的虛擬部隊,每個人只做自己最擅長與熟悉的那部分。”潘越稱。

事實上這便是IBM的特色,它壹直遵循工業時代的成功模式,比如這種制造企業更為擅長的流水線模式,並且通過給員工分級打分的獎懲制度,讓它的各個團隊都更有效率。

這些研發天才開發的DeepQA系統保證了沃森可以具備嶄新的人機交互模式,比如可以理解並分析自然語言,事實上,對自然語言的理解也壹直是IBM研究機構在人工智能上的強項。

這很像科幻電影裏的橋段—為了隱秘的機器人開發計劃,在全球招募天賦異秉的人士。所不同的是,IBM的意義顯然更為實際。

此前,基於深藍研發的AIX操作系統讓IBM在商業運用與政府部門中取得了大量的訂單,IBM也希望可以將沃森的DeepQA系統運用於醫療服務、咨詢等領域之中。

“沃森的優勢是給出準確與可靠的答案,因此可以為醫生提供更適合病人的解決方案。“潘越稱,“在醫療領域的應用將是沃森商用最主要的領域。”

沃森項目如果想在醫療行業推行的話,還需要面臨法律層面的問題,IBM壹位研究員稱,“如果沃森診斷出錯,而醫生又聽從了錯誤的診斷,那麽沃森就會面臨被患者告上法庭的危險,這對IBM而言是壹個正在考慮的應用問題。”

對於IBM來說,沃森未來不僅要繼續挑戰人類智能的極限,還要幫助這家公司去同亞馬遜、谷歌、微軟們競爭,爭奪未來科技制高點的主導權。