當前位置:名人名言大全網 - 短信平臺 - 聊天機器人概述

聊天機器人概述

聊天機器人,是壹種通過自然語言模擬人類,進而與人進行對話的程序。

1950年,圖靈(Alan M. Turing)在 Mind 期刊上發表的文章 Computer Machinery and Intelligence ,這篇文章開篇就提出了“機器能思考嗎?(Can machines think?)”的設問,提出了經典的 圖靈測試(Turing Test) 。通過圖靈測試被認為是人工智能研究的終極目標,圖靈本人也因而被稱為 “人工智能之父”

1966年,最早的聊天機器人程序 ELIZA 誕生,由麻省理工(MIT)的約瑟夫·魏澤鮑姆(Joseph Weizenbaum)開發,開發用於臨床模擬羅傑斯心理治療的 BASIC腳本程序 。實現技術僅為對用戶輸入計算機的話語做關鍵詞匹配,並且回復規則是由人工編寫的。

1972年,美國精神病學家肯尼思·科爾比(Kenneth Colby)在斯坦福大學(Standford University)使用 LISP 編寫了模擬偏執型精神分裂癥表現的計算機程序 PARRY

1988年,英國程序員羅洛·卡彭特(Rollo Carpenter)創建了聊天機器人 Jabberwacky ,項目目標是“以有趣、娛樂和幽默的方式模擬自然的人機聊天”,這個項目也是通過與人類互動創造人工智能聊天機器人的早期嘗試,但 Jabberwacky 並未被用於執行任何其他功能。技術是使用 上下文模式匹配技術 找到最合適的回復內容。

1988年,加州大學伯克利分校(UC Berkeley)的羅伯特·威林斯基(Robert Wilensky)等人開發了名為UC(UNIX Consultant)的聊天機器人系統。UC聊天機器人目的是幫助用戶學習UNIX操作系統。

1990年,美國科學家兼慈善家休·勒布納(Hugh G. Loebner)設立了人工智能年度比賽------勒布納獎(Loebner Prize)。勒布納獎旨在借助交談測試機器的思考能力,它被看做對圖靈測試的壹種時間,其比賽的獎項分為金、銀、銅三等。目前為止,尚無參賽程序達到金獎或銀獎標準。

在勒布納獎的推動下,聊天機器人迎來了研究的高潮,其中較有代表性的聊天機器人系統是1995年12月23日誕生的 ALICE(Artificial Linguistic Internet Computer Entity) 。隨著 ALICE 壹同發布的 AIML(Artifical Intelligence Markup Language) 目前在移動端虛擬助手的開發中得到了廣泛的應用。

2001年,SmarterChild在短信和即時通信工具中廣泛流行,使得聊天機器人第壹次被應用在了即時通信領域。2006年,IBM開始研發能夠用自然語言回答問題的最強大腦 Watson ,作為壹臺基於IBM“深度問答”技術的超級計算機, Watson 能夠采用上百種算法在3秒內找出特定問題的答案。

2010年,蘋果公司推出了人工智能助手 Siri Siri 的技術來源於美國國防部高級研究規劃局公布的CALO計劃:壹個簡化軍方繁復事務,且具備學習、組織及認知能力的虛擬助理。CALO計劃衍生出來的民用版軟件就是 Siri虛擬個人助理

此後,微軟小冰、微軟Cortana(小娜)、阿裏小蜜、京東JIMI、網易七魚等各類聊天機器人層出不窮,並且這些聊天機器人逐漸滲透進人們生活的各個領域。

2016年,全國各大公司開始推出可用於聊天機器人系統搭建的開放平臺或開源架構。

2010年至今,標誌性的聊天機器人產品如下圖所示。

總結:隨著人工智能相關技術“東風”漸起,自然語言處理研究碩果頗豐,聊天機器人相關技術迅速發展。同時,聊天機器人作為壹種新穎的人機交互方式,正在成為移動搜索和服務的入口之壹,畢竟搜索引擎的最終形態很可能就是 聊天機器人 。眾多人工智能領域的探索者和開發者都想緊緊抓住並搶占聊天機器人這壹新的交互入口。

下面從幾個維度對齊進行分類介紹。

在線客服聊天機器人系統 的主要功能是自動回復用戶提出的與產品或服務相關的問題,以降低企業客服運營成本、提升用戶體驗。代表性的商用在線客服聊天機器人系統有小i機器人、京東JIMI客服機器人、阿裏小蜜等。以京東JIMI客服機器人為例,用戶可以通過與JIMI聊天了解商品的具體信息、了解平臺的活動信息、反饋購物中存在的問題等。另外,JIMI具有壹定的 拒識能力 ,因此可以知道用戶的哪些問題時自己無法回答的,且可以及時將用戶轉向人工客服。阿裏巴巴集團在2015年7月24日發布了壹款人工智能購物助理虛擬機器人,取名為“阿裏小蜜”,阿裏小蜜基於客戶需求所在的垂直領域(服務、導購、助手等),通過“智能+人工”的方式提供良好的客戶體驗。

娛樂場景下聊天機器人系統 的主要功能是同用戶進行不限定主題的對話(閑聊),從而起到陪伴、慰藉等作用。其應用場景集中在社交媒體、兒童陪伴及娛樂、遊戲陪練等領域。有代表作的系統如微軟的“小冰”、微信的“小微”、北京龍泉寺的“賢二機器僧”的等。

教育場景下的聊天機器人系統 可以根據教育內容的不同進壹步劃分。這類聊天機器人的應用場景為具備人機交互功能的學習、培訓類產品,以及兒童智能玩具等。

個人助理類 應用可以通過語音或文字與用戶進行交互,實現用戶個人事務的查詢及代辦,如天氣查詢、短信手法、定位及路線推薦、鬧鐘及日程提醒、訂餐等,從而讓用戶可以更便捷地處理日常事務。

智能問答類 聊天機器人系統可以回答用戶以自然語言形式提出的事實型問題及其他需要計算和邏輯推理的復雜問題,以滿足用戶的信息需求並起到輔助用戶決策的目的。不僅要考慮如 What、Who、Which、Where、When 等事實型問答,也要考慮如 How、Why 等非事實型問答,因此智能回答的聊天機器人通常作為聊天機器人的壹個服務模塊。

從實現的角度來看,聊天機器人可以分為 檢索式 生成式 。檢索式聊天機器人的回答是提前定義的,在聊天時機器人使用規則引擎、模式匹配或者機器學習訓練好的分類器從知識庫中挑選壹個最佳的回復展示給用戶。生成式聊天機器人不依賴於提前定義的回答,但是在訓練機器人的過程中,需要大量的語料,語料包含上下文聊天信息和回復。

盡管目前在具體生產環境中,提供聊天服務的壹般都是基於檢索的聊天機器人系統,但是基於深度學習Seq2Seq模型的出現可能使基於生成的聊天機器人系統成為主流。

基於功能的聊天機器人可以分為問答系統、面向任務的對話系統、閑聊系統和主動推薦系統4種。

目前,對問答系統和主動推薦系統的評價指標較為客觀,評價方式也相對成熟。而面向任務的對話系統和餡料系統,在給定相同輸入的情況下,系統回復形式可以多種多樣,對於用戶的同壹輸入,通常有多種合理且數目不固定的回復,這使得很難通過壹種客觀的機制對其進行評價,所以在評價時需要加入人的主觀判斷作為評價的依據之壹。

通常,壹個完整的聊天機器人系統框架如圖,其主要包含自動語音識別、自然語言理解、對話管理、自然語言生成、語音合成5個主要的功能模塊。需要指出的是,並不是所有的聊天機器人系統都需要語音技術。

例如,以文字方式實現人機交互的聊天機器人系統,就不需要自動語音識別模塊和語音合成模塊。

Amazon Lex是壹種可以在任何程序中使用語音和文本構建對話界面的服務。Amazon Lex提供可擴展、安全且易於使用的端到端(end2end)解決方案,以構建、發布和監控開發人員發布的機器人。下圖展示了聊天機器人如何通過對話的方式協助用戶完成訂花的需求。

另壹個典型的聊天機器人框架是Facebook的Wit.ai。Wit.ai積累了大量高質量的對話數據,有效促進了聊天機器人系統的發展,並通過將人工智能和人類智能結合,進壹步提升了聊天機器人的智能水平。

聊天機器人的4種分類,包括 問答系統、面向任務的對話系統、閑聊系統和主動推薦系統。

Siri被定位為面向任務的對話系統,為用戶提供打電話、訂餐、訂票、放音樂等服務。Siri對接了很多服務,且設置了 “兜底” 操作,當Siri無法理解用戶的輸入時就命令搜索引擎返回相關的服務。Siri的出現引領了移動終端個人事務助理的商業化發展潮流。

下圖是Siri的技術框架:

2011年2月,IBM耗資3000萬美元研發的IBM Watson登上了美國著名智力問答競賽節目《危險邊緣》(Jeopardy),面對節目中充滿雙管意思的英文問題,IBM Watson能做出分析並在龐大的自然語言知識庫中尋找線索,將這些線索組合成答案。最終,IBM Watson壓倒性地優勢擊敗了節目中最聰明的人腦,同時創下了這個知識競賽系列節目27年歷史上的最高分。IBM Watson作為IBM公司研發的問答系統,集成了自然語言處理、信息檢索、知識表示、自動推理、機器學習等多項技術的應用,形成了假設認知和大規模的證據搜集、分析、評價的深度問答技術。IBM Watson可以分析自然語言形式的數據,通過大規模學習和推理,為用戶提供個性化服務。

2012年7月9日,谷歌發布了智能個人助理Google Now。Google Now通過自然語言交互方式為用戶提供頁面搜索、自動指令等功能。Allo是谷歌在前述工作的基礎上發布的語音助手。Allo具備隨時間推移學習用戶行為的能力。

2014年4月2號

主動推薦系統采用的是壹種實現個性化信息推送的技術方式。主動推薦系統並不需要用戶提供明確的需求,而是通過分析用戶的歷史行為數據建立用戶畫像,從而基於用戶畫像主動向用戶推薦系統認為能夠滿足用戶興趣和需求的信息。在電商購物(如阿裏巴巴、亞馬遜)、社交網絡(如Facebook、微博)、新聞資訊(如今日頭條)、音樂電影(如網易雲音樂、豆瓣)等領域均有廣泛而成功的應用。主動推薦系統本質上是壹項幫助人們解決信息過載(information overload)問題的工具。所謂信息過載,是指用戶真正需求、真正感興趣的東西被淹沒在其同類物品的海洋裏。 主動的交互方式能夠顯著提升用戶體驗,且機器人主動交互的方式更接近真實的人與人之間的對話方式,使得對話更自然。

壹種主動推薦的方式,是基於 知識圖譜(Knowledge Graph) 的主動推薦系統。例如,在建立音樂領域的主動推薦系統時,可以先建立音樂領域知識圖譜和用戶知識圖譜,然後在進行用戶信息搜索的過程中建立起用戶的音樂喜好畫像,從而更精準地對用戶進行音樂推送。

從圖中可看出,在用戶點播歌曲的過程中,主動推薦系統可以結合音樂知識圖譜、用戶個人知識圖譜,以及用戶的歷史對話數據,綜合給出最優的音樂推薦。

主動推薦系統與問答系統、面向任務的對話系統和閑聊系統被認為是聊天機器人產品的4種主要分類。