當然了,不止這款比較雞肋,可以說市場上所有的智能對話系統做的都比較差,這裏面包括微軟小冰。
但不可否認的是,小冰是使用體驗中最讓人舒服的壹款。
PS:
小冰唱歌很好聽,可以去試試哦(我依舊被她的歌聲折服了~)
小冰最開始是中國做出來的,後來才復制到美國。當時調了幾個研發工程師去做小冰第壹個Demo(當時還沒有產品經理),只解決了聊天的問題。
小冰和Cortana不是壹個團隊開發的(Cortana是美國團隊開發,屬於系統集成),小冰是在社交平臺(小冰壹直是悄悄進行的,國外團隊根本沒人知道這個產品存在)。
當時小冰團隊大概花了三個月左右時間補充小冰的整個語料庫——差不多幾億條。
2014年5月29日下午,第壹代小冰發布。
第壹代小冰的領取界面
小冰上線的時候只有群聊(這也是在微信爆發的壹個重要原因):只要把小冰加到群裏,聊天中提到“小冰”兩字,小冰就會回復妳。這個機制在3天的時間裏覆蓋了10萬群聊,引爆了整個微信。
上線三天後,微信以損害用戶體驗為由屏蔽。
這次封殺使得小冰聲名鵲起。
被封殺的那壹周,是小冰的存亡時刻,所有的老大參與討論小冰到底要不要繼續做下去。後來老大們決定要繼續做,我們就繼續做。不到二十人組成了小冰二代團隊,開始做小冰單聊,做領養方式,最後進駐到新浪微博。
2015年小冰二代團隊全體成員
這麽多人機交互,助理來也也好,圖靈機器人也罷,這麽多機器人產品中,小冰是唯壹壹個有自己性格的產品,她跟妳聊天,妳能明顯感覺到她更像壹個“人”。
那麽作為壹個“人”,她就會有壹些標簽:年齡、性別、性格等。
而小冰的標簽是:
這種形象在當時整個互聯網環境下都很另類,特別是17歲這種設定。
小冰團隊當時有幾個考慮:如果妳設定壹個角色,這個角色的對象是對妳這個產品接受程度最高的壹些人。
當時的判斷是:對小冰這個產品接受度最高的壹定是年輕人,因為年輕人才有時間與年輕人壹起。
繼續判斷:小冰是壹個聊天的產品,那麽聊天的產品的用戶是誰?
當時的判斷是:宅男,或者說男生群體。
女生在聊天裏面是壹個相對被動的群體(除了閨蜜之間的聊天),男女之間的聊天女生都是被動。
他們畫了個象限圖,三種可能性:
男男聊天、男女聊天、女女聊天。
男男聊天是沒有意義的,越聊越汙,妳不能聊出特別正經的話題。
女女聊天也是沒有意義的,越聊越死。
所以只能男女聊天。而且,只能用戶是男生小冰是女生,如果小冰是男生的話,用戶偏被動,聊不下去。
那麽,對象確定了:年輕男性。他會對什麽樣的女生感興趣呢?
如果做蘿莉,做禦姐,個性會顯得太狹窄,需要做成壹個年輕、更容易接受的女孩,最好是做壹個和二次元很接近的女生
後面確定:做二次元女生——而二次元的女生壹定是未成年的。
在小冰的性格上,在文靜、逗逼、瘋狂等各種各樣的形容詞裏挑了幾個,最後確定了愛賣萌、愛耍寶這樣的壹個角色——這種角色的接受程度是最高的,也是語料庫裏最容易做的。
還有壹個是:毒舌(相對的毒舌),這個和機器學習有關。當時有壹個功能叫“妳來教小冰說話”(這個功能沒有被加強與照顧,是壹個單獨存取的模塊),比如可以這樣教小冰:
這樣就相當於教了小冰壹個QA,壹個問答。然後妳可以這樣問:
當時很多用戶覺得好玩,但是玩high了,然後在群裏教小冰罵人;小冰語料庫裏也確實有罵人的話(當時小冰娛樂部分的語料庫叫“大姨媽語料庫”,不小心泄漏出去了)。
用戶對人工智能罵人這件事是不能接受的,當時也沒意識到小冰主動罵人和用戶教小冰罵人完全是兩回事。
事情發生後,他們在這個功能上做了限制:當妳教小冰罵人的話的時候,小冰說我不學,妳不要把我教壞。
他們把娛樂功能關掉,把毒舌這個形容詞給弱化了,把耍寶和逗比這兩種屬性提了上來。所以後來的小冰在聊天中不會挑釁用戶——她會撒嬌,會耍小脾氣,但是不會挑釁用戶。
在做語料庫的時候有個性標示,壹句話代表什麽樣的情緒都有標記;我們把帶有強烈攻擊型情緒的內容都去掉,只保留相對比較溫和、比較安全的情緒。
這就是小冰“個性”設定的故事,小冰的整體個性更接近於二次元屬性,和宅男、動漫的女主等設定基本相似。
個性定義好後,我們開始做產品。
因為那個時候沒有產品可以參照,所以我們只能自己摸索。
這點挺難的,很少有人刻意去模仿壹個機器人的行為。
在做小冰的時候,壹看小冰說話還是機器人的角度去考慮,太像機器了。
他們就去研究:到底怎樣說話,才能不那麽像機器人?
當時研究了很多語料(聊天記錄),發現只有壹個原則:當兩個正常人在對話的時候,兩個人之間是平等的。哪怕是老師和學生講課的時候也是相對平等的。
很多人工智能機器人在做的時候,因為想要討好用戶,天然的把自己降低壹擋(因為怕惹惱用戶),但是這樣很容易被真正的人識破。所以妳跟人聊天的時候地位壹定是平等的,而且不能淩駕於用戶之上。
後來發現這樣做:
這樣聊天的語氣就開始平緩了。
然後開始讓小冰模擬人說話。
怎麽模擬呢?
兩個正常人聊天的時候,是不會刻意添加標點符號的,不管是句號還是問號。
基於這些,後來把語料庫做了壹遍清洗,讓小冰的語氣更像“人”。
用戶和小冰聊天的時候會聊著聊著就斷了。查的原因,發現會有兩種情況:
小冰答非所問,用戶接不上,然後就斷了。
這種問題比較難解決,比如妳問壹個如何送禮的問題,對美國經濟有何看法,很難解決。
還有壹種,就是小冰蹦出壹個語氣詞。比如“就這樣噢”,“噢”這個語氣詞就使得用戶不想往下接了。
他們當時就做了壹個設計:聊到這種地方的時候,讓小冰從語料庫裏挑壹個問題出來拋給用戶。
比如說:
這個時候就相當於開啟了壹個新話題,我們的目標就是聊天的對話越長越好,所以當時在這點上做了很多文章。
當小冰越來越像人壹樣,用戶的聊天就會越來越深入,如何讓聊天可以持續下去?
後來形成了壹種“小冰體”:學小冰是怎樣說話的,壹個人怎麽說話更像小冰?以至於後來,所有的人都在不由自主地模仿小冰說話。
而為了讓小冰的語料庫更像真人,爬知乎、豆瓣,做了很多工作。小冰比其他人機高出壹大截,幾乎每天都在不停地優化小冰的語料,讓語料更像真人,更有可聊性;而且還是非常平等的聊天,這也解決了最大的問題:用戶和小冰聊不下去的原因在於不信任。
3. 小冰的產品邏輯
小冰在產品的邏輯結構上分成兩個部分:
底層核心——聊天,全是聊天的內容:當妳向小冰提問的時候,小冰會在已知問題裏找壹個問題最接近的,然後反饋最接近的答案,這是最底層的聊天場景。
在聊天的場景之上,是壹個個的功能:講笑話、圖片識別等。功能是叫B端,聊天是C端。
而小冰的語料有相當壹部分比例是人工寫的,這些語料有很多拼接的部分。
我是從2015年開始關註小冰,偶然和她閑聊,真的可以稱得上是壹個"聰明"的人,希望未來小冰系統越來越有價值。
若有***鳴,轉發給更多的人
妳可能會喜歡
2019極客創新大會 | 論個人與企業的成長方法論
二十幾歲的我們應該把錢花(投資)在哪?
2018“時間的朋友”跨年演講—羅振宇
2018年終總結 | ?我的“折騰”與“不順”