鎖屏時註意軟件的權限。
Siri是蘋果公司在其iPhone4S、iPad 3及以上手機和MAC上應用的智能語音控制功能。Siri可以把iPhone4S及以上(iPad 3以上的平板電腦)改造成智能機器人;
通過Siri,用戶可以閱讀短信,介紹餐館,詢問天氣,以及通過語音設置鬧鐘。
SIRI是語音解釋&;識別接口的首字母縮寫,原意為語音識別接口。
概述
很多人會回答Siri用的技術是人工智能和雲計算。的確,總體來說,就是這兩種技術。然而,這種概述感覺幾乎沒有意義。為什麽不直接說“計算技術”(註意不是計算機技術)?
所以在這篇文章裏,我會介紹壹下我所知道的Siri可能會采用的技術(由於個人猜測,不壹定準確)。
前端方面
在前端,即面向用戶和用戶界面(UI)技術,主要是語音識別和語音合成技術。
語音識別技術是將用戶的口語轉換成文字,這需要很強的語音知識庫,所以需要所謂的“雲計算”技術。
語音合成是將返回的文本結果轉換成語音輸出。這個技術理論上可以在本地完成,但不知道Siri是不是這樣。當然,不壹定要在雲端完成。在目前的無線帶寬下,語音流量根本不算什麽。
擴展數據:
知識計算
(搜索)技術(計算知識)
這項技術的代表是WolframAlpha。
與搜索互聯網信息不同,Wolfram|Alpha將從公共(包括公共網頁等)中挖掘並建立壹個極其龐大的有組織的數據庫。)和授權資源;
然後用高級自然語言算法進行處理,最後構造壹個類似Google搜索的工具。
與網絡搜索技術不同,在這個系統中,答案是高度結構化的。比如搜索中國,可以獲得與中國相關的各種參數和資料,並以接近表格的形式呈現。
Wolfram|Alpha也能聽懂壹些自然語言,比如妳多大了,這個會回答Wolfram|Alpha的年齡。如果妳想測試這項技術,請訪問Wolfram|Alpha。
這項技術在國內應該是有的,但目前還沒有產品。可能百度的框計算是壹半。所以有很大的機會。
知識庫技術
與web搜索技術相比,它基本上是基於壹個術語或主題,因此獲得的數據價值高、知識量大、結構好。
與知識計算技術相比,這些技術需要人類的參與,有利也有弊。好處是,畢竟人暫時比機器聰明,編輯出來的知識更豐富、更準確;
缺點是人力有限,即使像維基百科那樣調動社區的力量,也無法產生足夠的知識,而知識計算,理論上只有足夠多的算法才能產生“無限”的知識。
問答推薦技術
其實這不能稱之為技術,應該屬於知識庫的技術。不同的是,這種技術針對的是壹些生活信息,本地化程度很高,典型代表就是Yelp。因為這個東西比較簡單,我就不詳細介紹了。
語言模型技術
這就是如何提高Siri對企業、餐廳等當地興趣點名稱的識別能力,並融合用戶所在位置的知識,稱為Geo-LM,從而提高Siri的語音識別能力。這些模型允許Siri更好地評估用戶的發音內容。
參考資料:
Siri-百度百科