Siri技術來源於美國國防部高級研究規劃局公布的CALO計劃:讓軍方簡化壹些復雜事務,具有學習、組織和認知能力的數字助理,以及由此衍生的民用版Siri虛擬個人助理。
Siri能做的事情聽起來很不尋常。用戶可以通過語音控制和文字輸入搜索餐廳、電影院等生活信息,同時可以直接觀看相關評論,甚至可以直接預訂和預定門票。此外,其基於位置的服務能力也相當強,可以根據用戶默認的家庭住址或位置對搜索結果進行判斷和過濾。
但是,它最大的特點是人機交互。它不僅有非常生動的對話界面,還對用戶的疑問給出了並非無關緊要的答案。有時這是壹個驚喜。舉個例子,如果用戶說出並輸入“醉了”和“?家”這兩個詞(即使沒有語法,也是相當人性化的...),Siri會判斷為醉了,想。
但唯壹遺憾的是,該軟件目前只支持英文,相關信息也僅限於美國,但整個軟件的理念可以說是相當有趣和免費的。
相關支持:Siri語音系統目前支持英語、法語和德語,但由於還在測試階段,對中文的支持可能不太理想,未來會增加更多的語言支持。
Siri技術和語音控制的區別
說到語音控制識別技術,就不得不提安卓系統的語音動作,這也是壹項非常棒的語音控制技術,已經被很多安卓用戶所熟知和使用。但和Siri完全不是壹個級別的產品。
Voice Actions提供了非常紮實可靠的語音識別引擎,識別度高的驚人。但是和以往所有的語音指令系統壹樣,它要求妳有嚴格的語法結構和格式,否則系統是不會識別的。
但是,Siri和語音動作有著本質的不同。可以拋棄復雜的語法結構,甚至思維模式都可以混亂。Siri會結合上下文結構來理解。它還會用人工智能系統從人類語言歷史的角度來分析,在大多數情況下理解妳的意思。
更人性化的功能是,壹旦妳與Siri開始對話,它甚至可以理解許多模糊或擴展的語義。語音動作做不到這種事,因為它只是壹個語音指揮軟件,不是人工智能。
語音識別不是革命性的。很多年前,IBM的語音識別軟件在PC上就有不錯的識別率。
基於語音識別,簡單的智能分析和系統函數調用並不是革命性的。谷歌的語音行動和Vlingo等獨立公司都做得很好。
不過從目前的流媒體視頻來看,Siri並不是這些已知技術的簡單結合。
Siri更智能。
在Vlingo,妳說“短信麥克,信息妳好。”。通過匹配關鍵詞可以完成很多事情。文本是命令,消息是關鍵字。把這兩個詞對上,就知道送誰,送什麽了。
Siri理解上下文。妳問北京的天氣,然後說:“上海怎麽樣?”他知道妳指的是天氣。
更驚人的例子出現在Siri被蘋果收購前的演示中。妳說“我喜歡辦公室附近浪漫的意大利餐廳”。
Siri回答說,“我在找壹家意大利餐館,評論說在聖何塞妳的炒鍋附近很浪漫……”
這個回答說明Siri明白浪漫是個形容詞。知道我辦公室附近有個地方。此外,找到了先前存儲的用戶的工作地點。另外,他知道如何判斷壹家餐廳是否浪漫!(搜索評論)
對Android的Voice Action或者Vlingo說同樣的話,妳就會知道Siri擁有超越現有app的智能。
Siri與系統的結合更加緊密
Siri合並前的版本集成了大量網絡服務的API。比如OpenTable,Tickets,Taxi Magic等等。
Siri被蘋果收購後,已經融入系統。
在iOS5的Siri視頻中,出現新的短消息後,由Siri發起交互。意味著他已經進駐系統後臺,可以接管重要的系統功能。除了短信,還有天氣、時鐘、地圖等。