傳google正在申請智能語音電視的相關(guān)專利。
智能電視的語音服務(wù)為消費者帶來全新體驗
在《阿里巴巴和四十大盜》里,阿里巴巴喊一聲“芝麻開門”能令大石應(yīng)聲而動。如今,你如此喊一聲,也許能令手機、Pad、電視等電子產(chǎn)品隨聲而動。3月22日,被稱為中文Siri的應(yīng)用訊飛語點發(fā)布,吸引了眾多目光。語音功能炙熱,緣起iPhone 4S的Siri?,F(xiàn)在,手機、電視、Pad以及GPS地圖、手機瀏覽器、微博等,都能讓你“言語調(diào)戲”。沒有語音功能,你都不好意思說自己是智能終端。不過,這些號稱中文Siri目前還不夠聰明,則是用戶們最大的煩惱。
中文Siri上演“芝麻開門” 一句命令智能產(chǎn)品隨聲而動
手機:人人都是語音控
“你是哪里的人?”“我四處為家,卻隨叫隨到。”“那你能幫我做什么呢?”“我懂一些歷史、會一點算術(shù)、能說幾句英語,還會背唐詩……”不要以為這是在火車、飛機上的搭訕,這可是用戶與手機的對話。日前,用戶唐先生就用手機演示了這么一段人機對話。
當(dāng)然,如果你還想通過語音讓手機查找地圖和線路,查詢火車航班或者天氣,再或者尋找餐飲,都可以打開手機語音功能,對它發(fā)出指令,就像“芝麻開門”的命令一樣,手機就能聽話地為你服務(wù)。
記者了解到,目前科大訊飛公司推出的訊飛語點軟件,已經(jīng)有安卓Beta版,iOS版也在開發(fā)之中。深圳卓普通訊設(shè)備公司運營負責(zé)人表示,“語音功能和3D功能一樣是未來技術(shù)的趨勢和亮點,前者只需要軟件方面的匹配,后者才需要硬件匹配。”
電視:沒語音不敢稱智能
你還能與電視對話。一聲“你好,電視。”即可打開三星LED ES8000的語音控制功能;就連網(wǎng)絡(luò)搜索這種復(fù)雜的功能都可以通過語音指令來讓電視實現(xiàn),調(diào)節(jié)音量、切換頻道等基本操作更不在話下。3月21日,三星最新Smart TV讓大家再次體驗智能語音的神奇。
不僅是三星,創(chuàng)維、康佳、樂華、長虹等一眾國產(chǎn)彩電廠商也紛紛于近日推出帶有語音功能的智能電視。而以IT之身切入電視領(lǐng)域的聯(lián)想,也將在4月開售其智能電視ideatv K91,其亮點之一就是邊看電視邊發(fā)微博——通過語音,而不是敲字,同樣是采用科大訊飛的技術(shù)。創(chuàng)維集團總裁楊東文表示,種種跡象表明蘋果TV將具備語音功能,中外廠商都會在這一領(lǐng)域搶跑。他認為,語音技術(shù)是智能電視未來的標(biāo)配,按今年行業(yè)智能電視出貨量達800萬臺預(yù)期,跟隨其內(nèi)置銷售的語音技術(shù)軟件就有800萬的市場規(guī)模。
平板電腦:聲控非難事
手機、電視都已經(jīng)可以聲控了,平板電腦會落伍嗎?當(dāng)然不!3月16日上市的蘋果新iPad就具備語音輸入功能——說話就是輸入方式。寫郵件,發(fā)送短信,網(wǎng)絡(luò)搜索,或者創(chuàng)建記事本,所有這些全都可以通過語音完成。不用打字,只需點擊鍵盤上的麥克風(fēng)標(biāo)識,然后說出想要輸入的內(nèi)容,新iPad就會聽懂你說的話。
除此之外,谷歌計劃今年上半年發(fā)布平板電腦Google Nexus,并將搭載Majel網(wǎng)絡(luò)語音識別技術(shù)。微軟也稱,新版Tell me將實現(xiàn)人機語音交互,用于Windows 8系統(tǒng)以及下一代Windows Phone系統(tǒng)中。
海爾集團相關(guān)人士表示,以Siri為代表的語音交互給平板電腦操作帶來新思路,預(yù)計會有越來越多平板電腦采用語音技術(shù)。
微博:都能“說”一“說”
記者了解到,一些熱門應(yīng)用,也都具備了語音操控的方式。手機瀏覽器就首當(dāng)其沖。最大的手機瀏覽器廠商UC推出的UC瀏覽器8.2 For Android就主打語音控制,號稱全球首款語音控制瀏覽器。
更新至2.2版本的搜狗地圖Android版,其語音導(dǎo)航功能優(yōu)化了語音導(dǎo)航界面展示和播報內(nèi)容。據(jù)悉,搜狗地圖iPhone客戶端的免費語音導(dǎo)航版本也將在近期發(fā)布。
當(dāng)然,訊飛“語音云”技術(shù)的應(yīng)用,還包括新浪微博、搜狐微博、365日歷、大眾點評網(wǎng)等。
業(yè)內(nèi)觀點
真正的聊天還很遠
李開復(fù)是語音識別技術(shù)專家,此前他在微博上稱,所謂中國Siri或安卓Siri面臨四大問題:1.智能手機主界面是手觸,語音助手解決了用戶什么需求?2.如何克服后臺海量數(shù)據(jù)學(xué)習(xí)技術(shù)門檻?3.應(yīng)用誰開發(fā)?4.語音服務(wù)器和帶寬成本較大,如何克服?同時,他認為,語音技術(shù)上主要挑戰(zhàn)還有三方面:一是語音識別相對容易,但語義理解相對困難。讓軟件聽懂容易,但理解比較難。二是如果能在一定程度上做到語義理解,怎么樣讓開發(fā)者介入不用太花時間?三是用戶體驗的期望值。與多點觸摸不同,一旦人們開始使用語音交互,會有這樣想:我愛怎么說就怎么說,你應(yīng)該能理解,這是一個比較長久的挑戰(zhàn)。
本月初,英國一用戶投訴蘋果Siri廣告誤導(dǎo)消費者被駁回,該用戶認為Siri在英國不能發(fā)揮作用。玩家“liyang”在體驗訊飛語點后表示,當(dāng)一句話中有停頓或者連續(xù)多問它幾個問題,可能無法順利應(yīng)答。問“你好,幾點了?”就不能給出正確回答。問“現(xiàn)在幾點了?明天的天氣?”也只回答天氣而忽略掉了前半部分的問題。網(wǎng)友“mylovemo”也表示, 語音識別率非常高,但是不夠智能。“我說中國足球怎么樣?它給我百度出了中國。只能說它一款語音助手,離智能語音還有非常遠的距離。”
李開復(fù)建議,開發(fā)者應(yīng)該開發(fā)語音識別而非深度語義理解的應(yīng)用;以及娛樂性應(yīng)用,比如Siri,或者一些“眼忙手忙”的場景應(yīng)用,比如駕車。否則很容易讓用戶認為是噱頭。(文、圖整理/記者 李光焱)