智能音箱已經成為全球增長最快的消費級硬件。自2017年6月蘋果home pod發布以來,從下半年開始,每個月都有壹兩家科技公司發布智能音箱新品或二代、三代產品。到目前為止,國內科技巨頭BAT和小米,老牌電器制造商聯想和蘇寧,語音技術公司科大訊飛和Spirits,硬件技術初創公司Mobvoi和若奇都已通過自研或合作進入市場。
智能音箱的爆發離不開語音技術的支持,掌握語音技術的廠商有兩類。壹是互聯網巨頭,如Amzon、谷歌、BAT、蘋果和微軟,二是專門從事語音交互技術的制造商,如科大訊飛和Spirits。語音技術廠商通過自主研發軟硬件產品或技術輸出,賦能傳統智能音箱廠商、內容和互聯網服務商,獲取用戶和數據,建立平臺生態。
1.阿姆松·亞歷山大
基本信息:Amzon Alexa是亞馬遜的智能虛擬助手和開放平臺。2010開始研發,2014 11與Echo同步發布。Alexa具有語音技術的能力,通過運行名為“技能”的獨立程序(類似於在手機中的操作系統上運行壹個app)來實現不同的功能應用,支持音樂播放、語音購物、智能家居控制、智能通訊等壹系列功能。由於其先發優勢和大量的落地產品,alexa在產品搭載量和智能水平上已經遠遠超越其他科技廠商(CNET在CES2017中的統計)。
開放性:Alexa 2065438+2005年6月,亞馬遜向第三方開發者開放了Alexa,並發布了Alexa Skills Kit(ASK)和Alexa Voice Service (AVS)兩套開發工具包,讓開發者更容易開發Alexa的“技能”;它還有壹個由alexa創立的風險投資基金,用於支持語音交互領域的初創企業,以及大學生發展競賽Alexa prize。從2014發布時的29個以上技能,到今天的近4w技能,由於積極的開放政策和不斷優化的開發工具,Alexa擁有了遠超其他技術廠商的海量技能。
適用範圍:截至目前,Amzon Alexa已在全球38個國家上線(國內尚未上線),覆蓋英、德、法、意、西、日6種語言(暫不支持中文)。除了自身的echo系列音箱產品,Alexa還賦能sonos、聯想、哈曼卡頓等音箱產品,amzon fire TV等智能電視,amzon fire、華為mate9、HTC等平板電腦和智能手機,華碩、惠普、聯想等筆記本和PC,智能冰箱、智能燈、智能開關等智能家居產品,智能耳機、智能手表等可穿戴設備,以及福特、寶馬。
2.谷歌助手
基本信息:Google assistant是Google的虛擬助手,於2016年5月在Google開發者大會上正式發布。它支持語音交互,安裝在谷歌的智能手機和智能音箱中。
開放性:2016年2月,Google在Google上推出了開發者平臺Actions,2017年4月,發布了面向第三方開發者開發Google assistant應用的SDK(軟件開發工具包),進壹步擴大了對智能汽車和其他智能家居設備的支持。谷歌助手支持語音輸入和視覺響應,可以通過設備的攝像頭識別物體和收集視覺信息。
適用範圍:目前谷歌助手已經支持英語、日語、法語、德語、西班牙語等八種語言。預計到2018年底支持30多種語言,覆蓋95%的安卓手機(暫時不支持中文)。除了自家的Google home系列音箱和Pixel系列智能手機,Google assistant還賦能索尼、諾基亞等智能手機,松下、LG、Sonos等智能電視、智能機頂盒和智能音箱產品,聯想、英傑華等電腦,沃爾沃等智能汽車產品。
3.微軟Cortana
基本信息:Cortana是微軟的虛擬智能助手,於2015年6月正式發布,逐步應用於搭載windows操作系統和Android/ios系統的移動設備。Cortana有語音交互功能,使用bing的搜索引擎信息回答問題。它可以調用應用程序,查詢天氣,推薦餐廳和景點,控制智能家居。
開放性:在2017的build開發者大會上,微軟退出了cortana技能開發平臺,允許第三方開發者為Cortana開發技能。
適用範圍:截至目前,cortana支持中文(簡單/復雜)、英文、德文、法文、日文等近10種語言。Cortana已經集成到很多微軟產品中,比如Edge瀏覽器、windows10、車載系統、Skype(微軟的即時通訊服務),並使微軟能夠與哈曼卡頓的智能音箱invoke合作。
4.蘋果siri
基本信息:Siri(語音解釋和識別界面)是蘋果的虛擬助手。Siri成立於2007年。起初,Siri只是iOS平臺上的壹個應用。2010年4月蘋果收購Siri並重新開發後,Siri成為蘋果設備的內置軟件,2011重新發布,只允許在iOS和macOS中運行。Siri支持語音交互,可以完成數據搜索、天氣查詢、設置鬧鐘等多項服務。
開放性:在2016年6月的蘋果開發者大會上開放了Siri接口,在IOS開發平臺中加入了Sirikit,支持開發者調用Siri顯示應用內容。Siri目前沒有獨立的技能開發平臺。
適用範圍:截至目前,Siri支持中文(簡繁)、英文、法文、德文、意大利文等20多種語言,賦能蘋果全系列產品,如iPhone、iPad、iPod、Apple watch、mac等。
1.科大訊飛
基本信息:科大訊飛,成立於1999,是中國最大的智能語音技術制造商。在智能語音技術領域有長期的研究和積累,在中文語音合成、識別、評價等多項技術上有國際領先的成果。與中國官方關系密切,堪稱“中國聲音產業國家隊”。科大訊飛在中國語音技術市場的占有率超過70%,語音合成產品的市場占有率也達到70%以上。
開放性:科大訊飛開放平臺是全球首個提供移動互聯網智能語音交互能力的科大訊飛開放平臺。基於科大訊飛開放平臺的科大訊飛輸入法、林西語音助手、AI+教育、AI客服、AI醫療(語音電子病歷、醫學影像輔助診斷系統、智能助手等。)、小翻譯機、飛魚智能車載系統、家庭場景中的科大訊飛Morph麥克風系統等產品廣泛用於人工智能。
應用範圍:科大訊飛支持34種語言,包括中國各地的方言。目前已賦能長虹、海信、康佳等國產大牌智能電視,GlassX、ZWatch等可穿戴設備,奧迪、寶馬、奔馳、通用、福特、SAIC、廣汽、長安、吉利、長城、奇瑞等國內外智能汽車,智能音箱(JD.COM丁咚音箱)、聊天機器人(小魚在家)。窗簾、空調等智能家居產品為滴滴打車、高德地圖、QQ閱讀等6萬多個app提供智能語音交互服務,涵蓋聊天交流、工具、視頻、新聞、導航等生活方方面面。
2.百度dueros小度
基本信息:DuerOS是百度的對話式人工智能系統,於2017年7月在百度AI開發者大會上正式發布。DuerOS擁有影音娛樂、信息查詢、生活服務、出行路況等10類200多項能力。用戶可以實現不同場景下的命令控制、信息查詢、知識應用、尋址導航、日常聊天、智能提醒以及各種O2O生活服務。同時支持第三方開發者的能力接入。
開放性:DuerOS開放平臺包括智能設備開放平臺和技能開放平臺,分別適用於不同類型的硬件廠商和開發者。為了方便“入門”,百度發布了面向個人、產品廠商、特殊廠商的DuerOS套件,整合了包括音智科技、先聲互聯、Intel、Rockchip在內的第三方解決方案,並推出了技能商店APP“小度家”。
應用範圍:DuerOS支持普通話、英語、粵語、四川話等多種語言。,並已賦能智能音箱、電視、ice等小家電及智能家居產品、智能手機、手表等便攜設備、車機、智能後視鏡等智能車載產品,累計容量5000萬臺,日活超654.38+00萬,du eros 654.38+06萬。
3.蕭艾開放平臺蕭艾同學
基本情況:蕭艾開放平臺(原水滴平臺)於2065438+2007年5月對外開放語音能力和SDK。基於小米的硬件生態和海量數據,提供全球領先的語音識別、NLP等人工智能技術,為開發者提供壹站式人工智能服務。
適用範圍:蕭艾開放平臺能力已融入小米軟硬件產品,如小米電視、小米ai音箱、小米金夫'米小北',賦能小米生態鏈8500萬物聯網連接設備,虛擬助手蕭艾同學的日活躍用戶也達到10萬。
4.AliGenie語音開發者平臺天貓精靈
基本信息:AliGenie開放平臺於2007年6月17日和6月12日在雲起大會上發布。由阿裏巴巴人工智能實驗室發起,面向企業/機構/創業者/開發者,以API或SDK的形式分享阿裏巴巴在人工智能領域積累的技術。目前擁有涵蓋視聽娛樂、新聞資訊、購物外賣的線上平臺。
應用範圍:AliGenie開發者平臺主要包括精靈技能市場、硬件開放平臺、行業解決方案三部分,全面賦能智能家居、制造、零售、酒店、航空等服務場景。
5.騰訊雲肖偉
基本信息:騰訊雲的智能服務系統和智能服務開放平臺,幫助智能硬件廠商實現語音人機交互和音視頻服務能力。從2012開始,微信AI團隊將語音輸入、語音識別、語義分析技術等功能應用於微信。騰訊雲肖偉以微信的語音技術為底層能力,因此命名為“肖偉”,於2017年6月在騰訊“雲+未來”峰會上正式發布。
適用範圍:騰訊雲肖偉包括硬件開放平臺、技能開放平臺、服務機器人(智能客服)平臺,結合騰訊社交關系鏈,覆蓋家庭、汽車、運動、酒店、兒童陪讀教育等多個場景。
6.Spirit DUI開放平臺
基本信息:Spirits於2007年在英國劍橋成立。它的創始人都來自劍橋。2008年回到中國,定居蘇州。是國內為數不多的擁有人機對話技術的公司,也是全球為數不多的擁有自主產權、集成中英文語音技術的公司。2065438+2007年9月,Spirits正式發布DUI(對話用戶界面)開放平臺,以任務型對話為核心,具備聊天和回答問題功能,打造人性化交互。DUI作為全鏈路智能對話的開放平臺,開放基於Spirits智能語音語言技術的對話功能,提供GUI定制、版本管理、私有雲部署等開發服務。
DUI有四大系統:清囊(服務和R&D支持)、天極(大數據)、魏紫(豐富的第三方資源)、玲瓏(終端解決方案和環境)。DUI平臺接入了豐富的第三方內容,內置了國內最專業的語音語言技能商店。具有深度數據可視化、個性化定制、零門檻操作。開發者可以通過DUI實現全鏈路的高度定制,幾乎每個模塊都可以定制。
應用範圍:平臺已覆蓋汽車、家居、機器人、故事機、手機助手等多個應用場景。提供智能汽車、智能家居、智能機器人等解決方案,賦能天貓精靈X1、小米AI音箱蕭艾同學、聯想智能音箱、小米Die 70步智能後視鏡等前沿智能產品。
1.移動電話
Mobvoi是谷歌投資的中國人工智能公司,由矽谷華裔科學家李誌飛於2012年回國創辦。擁有自主研發的語音識別、語義分析、垂直搜索、基於視覺的ADAS、機器人SLAM等核心技術。代表性的軟硬件產品有智能手表Ticwatch、車載智能後視鏡Ticmirror、智能音箱Tichome、Mobvoi語音助手APP以及魔眼中的高級駕駛輔助系統Ticeye。
2.獵戶座星空
獵戶星空擁有壹整套遠場語音技術,自主研發的全鏈路遠場語音交互系統“獵戶語音OS”賦能喜馬拉雅“瀟雅”音箱,美的、海爾、博聯、海爾友家、歐瑞博等智能家居產品。小米AI音箱和小米電視也采用了獵戶星空的TTS(語音合成)技術和ASR(語音識別)技術。獵戶星空自帶音箱鮑曉AI音箱,連接微信支付、銀聯支付,集成區塊鏈技術。
2017年,獵戶星空還獲得了微軟百萬名人識別大賽限制類(僅使用大賽提供的數據)第壹名,這是公認的人臉識別世界杯。2065438+2008年3月21日,獵戶星空正式發布人工智能領域機器人產品矩陣,落地接待、銷售、兒童陪伴等多個場景。同時發布獵戶的機器人平臺Orion OS,集成了自研多芯片系統、攝像頭+視覺算法、麥克風陣列、獵戶TTS、室內導航平臺、七軸機械手,形成完整的機器人技術鏈。Orion OS已經與微軟、搜狗、高通、英偉達和錘子科技建立了戰略合作夥伴關系。
3 .若琪Rokid
Rokid公司成立於2014年7月,隸屬於杭州班苓科技有限公司,總部位於中國杭州,在北京和舊金山設有R&D中心,致力於機器人領域的研究,專註於遠程定向拾音/語音語義識別、人臉/手勢識別、聲音和投影系統等核心技術。Rokid,現有PEBBLE月石智能音箱、AR眼鏡Rokid Glass、智能機器人ALIEN等產品。Rokid智能家居機器人在2016和2017連續兩年獲得CES國際消費電子展創新獎。
4.聚集熵智能深度大腦
深腦於2012成立於上海,致力於人工智能產品的研發。核心團隊是來自國內外著名高校的技術研究人才,為超過100家廠商提供深度人機對話能力,與三星、華為、聯想、中興達成深度合作。2014年,DeepBrain發布了國內首款智能音箱——小智超級音箱,比Echo的推出早了半年。其語義技能平臺已入駐數千開發者,開發了超過1000個基於智能家居的語義技能。
5.搜狗之聲
搜狗由搜狐公司於2004年8月3日創立,域名為Sogou.com,目的是增強搜狐的搜索能力。2013年9月,騰訊向搜狗註資,將其搜索服務和輸入法業務註入搜狗。2017,11,搜狗在紐交所上市,騰訊目前持有搜狗45.37%的股份。搜狐在搜狗的持股比例為39.21%。搜狗語音技術的研究始於2012,於2013年6月在搜狗語音雲開放平臺正式上線。它連接了搜狗的所有產品,包括輸入法和地圖,並推出了搜狗語音助手。和Siri壹樣,搜狗語音助手在手機上提供的交互體驗無法讓用戶產生足夠的依賴,產品利用率不高。2016年8月,搜狗發布語音交互引擎“尹稚”。2017年2月,與四維圖新、格非合作推出格非智能車聯網G8ⅱ軟硬件解決方案,為2018年3月發布的小米電視4A提供ASR語音識別能力,為會議平板廠商Vision發布。
銷量和市場份額對智能音箱產品來說意義非凡。因為智能語音技術剛剛落地,極度依賴用戶數據的饋給,用的越多就能越聰明。
據筆者估算,截至2018 Q1,智能音箱全球市場份額如下。Amzon憑借先發優勢和豐富的產品,占據了71%的市場,而Google憑借完整的低中高產品矩陣和用戶群,搶占了12%的市場。天貓和小米分別憑借電商體系、智能家居生態和低價爆款策略占據了6%和4%的市場份額。JD.COM較早涉足智能音箱。蘋果的homepod在今年2月9日正式發布,定價偏高,仍占1%,其他品牌均占3%。
作為智能音箱品類的開創者,Amzon不斷優化音箱產品的新能力,持續創新。從場景和形態出發,小而低價的echo dot、帶屏幕音箱的echo show、帶鬧鐘音箱的echo spot相繼推出。不僅有促銷爆款,還有高端品類防禦。擁有高、中、低檔完善的產品矩陣,各款車型累計銷量超過3000萬輛。是目前唯壹壹家銷量突破千萬的智能音箱廠商,引領全球智能音箱市場。
由JD.COM和科大訊飛聯合創辦的玲瓏科技推出了叮咚音箱。作為國內較早的智能音箱廠商,JD.COM從2015年5月開始銷售壹系列新品。整體產品線類似於Amzon,不斷探索更多的形式和場景,不斷提供更多的定制化功能,用兒童教育音箱切割早教市場。隨著小米、阿裏和百度的強勢進入,JD.COM也推出了高端屏幕揚聲器丁咚PALY和低價位的丁咚mini2,以搶占國內市場。
2016年5月,在Amzon幾乎壟斷智能音箱市場的時候,谷歌進入市場,推出了Google home,憑借其優雅的設計、基於谷歌搜索引擎的智能問答以及價格差異,壹度占據了20%以上的市場。並且在2017,10推出了低價的Google home mini和高價的Google home max,持續支持更多新技能和場景:接入更多智能家居設備,支持500w菜譜搶占廚房,支持語音購物。
小米作為國內領先的智能家居生態建設者,產品涵蓋耳機、移動電源、手環、插座、血壓計、空氣凈化器、凈水器、運動相機、平衡車、電池、床頭燈、電飯煲等智能家居設備。小米於2016年底開始研發虛擬助手蕭艾同學,並於2017年9月正式發布智能音箱蕭艾同學。除了小米之家強大的生態背景之外,蕭艾同學也因為其機智的人事受到了極大的關註。2018小米推出Q萌版蕭艾同學mini加入國內低價沖動戰。
阿裏非常重視新技術的研發。17年7月,天貓精靈x1發布。同時,負責阿裏消費級AI產品研發的阿裏巴巴人工智能實驗室揭牌成立。17年6月,雲起大會正式宣布成立達摩院,招募各關鍵技術領域的專家,進行基礎科學、AI芯片、顛覆性技術創新等方面的研究。3月18,天貓精靈M1 cookies和火眼支架上線,6月天貓精靈方糖上線,繼續探索更多音箱形狀和花式輸出AI技術,包括圖像識別、人臉識別、物體檢測和情感反饋。同時提高產品性價比,堅守音箱低價沖動的戰場。依托阿裏強大的電商網絡,天貓精靈已經成為國內銷量最大的智能音箱品牌。
2017年2月,百度全資收購渡鴉科技,10月165438+發布渡鴉智能音箱,外形新穎,色彩豐富,可拆卸點陣觸摸板。定價1699對抗高端音箱Sonos、Bose、哈曼卡頓。18年初,聯合老牌音響廠商DOSS推出了DOSS智能音箱。3月和6月,國內首款智能視頻音箱以在家599元、in 89元的低價上市,在JD.COM和天貓銷售。憑借著超高的性價比,在國產音箱價格戰中還是有壹席之地的。
除了有看得見銷量的主流智能音箱,國內外還有很多智能音箱產品。比如微軟和哈曼卡頓聯合推出的invoke搭載微軟Cortana,Line和高通聯合推出的Clova,以及國內中小創業團隊的壹系列智能音箱,Mobvoi的Tichome,喜馬拉雅的瀟雅音箱等等。隨著智能音箱市場的逐漸成熟,各種音箱要麽找到自己的位置,要麽變得沈寂。
智能音箱除了提供核心內容資源的消費功能,還深挖家庭場景,開放平臺,吸引第三方開發者,提供越來越多的技能。領先的智能音箱行業Amzon Echo已經擁有超過3w的技能。從技能增長梯度來看,2016開始爆發,隨著Echo銷量的增加,還在上升。擁有超過3w技能的Amzon比其追隨者更像壹個語音操作系統。
就像智能手機操作系統的app,在海量的語音操作系統技能中,真正得到關註的只有少數,大量技能成為僵屍技能,無人問津。所以其他智能音箱品牌,只要覆蓋高頻和核心功能,提供更多的資源、家居控制和創意功能,就不用怕Amzon恐怖的技能號。
智能音箱產品功能大同小異,主要分為內容技能、工具技能、互動娛樂三大方向;功能面向核心場景、核心人群的核心功能傾向逐漸顯現。
用戶關註度高的功能主要有音樂、電影、生活助手、智能家居、遊戲娛樂,其次是教育內容、好玩搞笑、新聞、新聞、財經功能;
工具技能用戶口碑低,但不可替代;互動娛樂技能可替代性強,口碑和體驗好的功能更受歡迎;內容技能的評價是偶數,重點是優質資源的可獲得性。
從易趣、沃爾瑪、JD.COM和天貓等電子商務平臺的用戶評論數據中提取。
用戶體驗總結:
1)智能音箱產品整體普及率很高,用戶接受度較高。評價矩陣是5星好評的70 ~ 80%;
2)用戶對音箱產品的喚醒、識別、分析等基本語音性能的感知差異不大(可能是因為個人擁有的音箱品牌數量不足1,對比不明顯);對音質、內容資源的豐富性和“智能(智力和樂趣)”敏感。
3)老人和孩子對音箱的滿意度和喜愛度是重要的消費決策因素。
4)海外用戶對音質要求更高,對音箱的使用場景區分更清晰。他們傾向於針對不同的住宅場景配備多個音箱產品,對於是否自帶電池沒有太多要求。國內用戶對音質要求和識別水平不足,期望自帶電池方便移動。
5)用戶期望喚醒詞可以定制,內容資源更加豐富,資源和內容相互連接。
1)音箱銷量:2017年智能音箱全球出貨量3,200 W臺,其中Amzon和Google瓜分市場比例約為9:1。Amzon音箱銷量已經超過2000w,發行量和活躍設備數量在全球遙遙領先。到2018年4月底,國內廠商銷量由天貓和小米領銜,訂單在200w,而百度、騰訊等創業公司都在10w W以下..擁有生態閉環和技術平臺的大廠商,有“高性價比分銷”的趨勢,低價占領快速用戶市場。據科納仕公司分析公司保守預測,2065年438+08年全球音箱銷量將增長至5630臺,美國作為主戰場的銷量將達到3840臺,中國作為第二大市場的銷量將達到440萬臺。
2)功能覆蓋:智能音箱產品功能同質化明顯,主要分為內容技能、工具技能、互動娛樂三大方向;擁有生態閉環和技術平臺的大型廠商,正在把以語音技術為核心的AI技術平臺打造成為Android/ios風格的操作系統,吸引更多智能硬件廠商和獨立開發者入駐;鑒於技術水平沒有明顯差距,技能開發者的可轉移性,技術和技能都不會是取勝的關鍵因素。
3)用戶反饋:智能音箱產品整體市場接受度較高,評價矩陣70~80%5星好評;用戶對語音交互基本性能的感知差異不大,如喚醒成功率、識別、分析等,但對音質、內容資源豐富度、智能、說話人興趣等維度比較敏感。與此同時,用戶的期望值還在不斷提升,對音箱產品提出了越來越個性化的要求。