智能家居是當(dāng)前炙手可熱的領(lǐng)域。早前,不少人認(rèn)為語音交互技術(shù)的發(fā)展即將打開智能家居的大門,國(guó)際品牌如亞馬遜、蘋果和谷歌在語音識(shí)別上費(fèi)了不少功夫,國(guó)內(nèi)的百度等企業(yè)也加快了這一領(lǐng)域的研究進(jìn)程。那么,語音識(shí)別對(duì)于家居智能化進(jìn)程的推動(dòng)力到底有多大?
國(guó)際大佬爭(zhēng)奪的智能語音市場(chǎng) 為何只能做智能家居的助手?(圖片來源網(wǎng)絡(luò))
亞馬遜VS谷歌 搶灘家庭AI助手市場(chǎng)
在國(guó)外,谷歌的Google Home和亞馬遜Echo的斗爭(zhēng)十分激烈,一方面不斷升級(jí)語音助手服務(wù),另一方面不斷向第三方開放其語音助手平臺(tái)。如4月15日亞馬遜向第三方授權(quán)其Echo的關(guān)鍵語音技術(shù);再如4月20日Google Home 推出其智能音箱可同時(shí)支持6人使用,提供個(gè)性化服務(wù) 。此外,4月23日奔馳也將其新車接入Alexa和Google Assistant,提升其車載系統(tǒng)和對(duì)智能家居等的遠(yuǎn)距離控制。
據(jù)統(tǒng)計(jì),今年美國(guó)語音智能音響用戶約70.6%使用的是亞馬遜產(chǎn)品,遠(yuǎn)遠(yuǎn)領(lǐng)先于谷歌,谷歌只占了23.8%,其它企業(yè)合計(jì)占有5.6%的市場(chǎng),這些企業(yè)包括聯(lián)想、LG、哈曼-卡頓、Mattel。
eMarketer指出,從更廣泛的意義上講,語音助手市場(chǎng)今年將會(huì)增長(zhǎng)23.1%,這個(gè)市場(chǎng)包括了Siri、Alexa、谷歌Now、微軟Cortana。2017年,6050萬美國(guó)人至少每月使用一次助手,從用戶數(shù)量上看已經(jīng)占到了智能手機(jī)用戶的27.5%,也就是說每5名美國(guó)人就有1人使用語音助手。
聚焦智能家居未來發(fā)展 蘋果也按耐不住
早在2011年,蘋果就在其iPhone4S上推出了智能語音助手--Siri,隨后語音助手也逐漸進(jìn)入大家視野。隨著Siri的不斷升級(jí),儼然成為一個(gè)生活管家。Siri可以為你查閱信息,充當(dāng)時(shí)間助手、郵件助手,進(jìn)行歌曲識(shí)別,還是算數(shù)高手,還可以為你提供生活消費(fèi)娛樂等服務(wù)。此外,隨著蘋果Homekit智能家居平臺(tái)的搭建,Siri作為語音助手在智能家居中發(fā)揮了更大的作用。
對(duì)于亞馬遜和谷歌推出的智能音箱,蘋果是怎么看的呢?蘋果負(fù)責(zé)全球市場(chǎng)營(yíng)銷的高級(jí)副總裁菲爾.席勒日前接受媒體采訪時(shí)表示出了對(duì)亞馬遜Echo和谷歌Home的不屑一顧。他表示,蘋果對(duì)語音助手的作用“深信不疑“,越來越多的用戶對(duì)那些無屏幕,只支持語音功能的智能揚(yáng)聲器感興趣。亞馬遜Echo和谷歌Home就是這樣的產(chǎn)品。
“有時(shí)候,當(dāng)你無法看屏幕的時(shí)候,直接使用語音是很方便的一件事。但即便如此,語音助理沒有屏幕仍會(huì)限制它的實(shí)用性。““語音助理在許多時(shí)候都很方便,但這并不意味著你永遠(yuǎn)不需要屏幕,因此我認(rèn)為,沒有屏幕在很多情況下并不適合。“
盡管席勒表達(dá)的意思較為模糊,但這些言論可以體現(xiàn)出蘋果對(duì)語音助理技術(shù)的部分設(shè)想。據(jù)悉,蘋果將推出基于Siri的Echo同類競(jìng)爭(zhēng)產(chǎn)品,或許會(huì)選在今年的WWDC全球開發(fā)者大會(huì)上正式亮相。
為何“語音智能“只能做智能家居的“助手“?
語音交互是未來的發(fā)展趨勢(shì),但中國(guó)人工智能學(xué)會(huì)理事長(zhǎng)、中國(guó)工程院院士李德毅直白地指出,目前很多語音智能技術(shù)還停留在簡(jiǎn)單的語音對(duì)話階段,離交互認(rèn)知還遠(yuǎn)遠(yuǎn)不夠。于行業(yè)而言,待解難題很多,如對(duì)環(huán)境的要求,云知聲IoT副總裁康恒表示,噪聲問題是行業(yè)難點(diǎn)。此外還有說話的距離限制、不能持續(xù)對(duì)話,以及不可打斷等問題存在。
1、距離問題
近場(chǎng)識(shí)別技術(shù)目前已經(jīng)比較成熟,現(xiàn)在手機(jī)上使用的語音輸入功能就屬于近場(chǎng)識(shí)別技術(shù),用戶必須在離手機(jī)比較近的距離內(nèi)說話,但在智能家居環(huán)境中,用戶和智能終端之間的距離被大大增加了,用戶能隨意用語音控制智能家居的一個(gè)必要條件就是在無論你在客廳哪個(gè)角落發(fā)出指令,設(shè)備都能準(zhǔn)確的識(shí)別,語音識(shí)別技術(shù)必須突破距離的障礙。目前室內(nèi)的語音交互受到背景噪音、其他人聲干擾、回聲、混響等多重復(fù)雜因素影響,導(dǎo)致識(shí)別率低甚至無法使用,只能在相對(duì)安靜、近距離的環(huán)境下使用。
2、方言影響
中國(guó)的語音及語言博大精深,雖然國(guó)家在推廣標(biāo)準(zhǔn)普通話方面不遺余力,但是中國(guó)真正掌握標(biāo)準(zhǔn)普通話的人群比例還是比較低的,而中國(guó)的口音現(xiàn)象則是紛繁復(fù)雜,甚至?xí)霈F(xiàn)同城市中都有不同口音的情況。因此,當(dāng)這些帶有或輕或重口音的人群在使用語音輸入時(shí),如果按通常的方法使用標(biāo)準(zhǔn)普通話數(shù)據(jù)進(jìn)行模型的訓(xùn)練,就會(huì)產(chǎn)生很嚴(yán)重的適配問題,從而影響語音輸入時(shí)的識(shí)別效果。
3、識(shí)別能力不高
智能語音技術(shù)除了需要提高用戶語音輸入的識(shí)別準(zhǔn)確率,還需要提高語義理解能力。不同的人在說話時(shí),口音、語速、口頭禪都不一樣,那么家里的智能設(shè)備只會(huì)識(shí)別一些基本詞句顯然是遠(yuǎn)遠(yuǎn)不夠的,它們必須要更懂你。比如,懂你的口音、方言、口頭禪以及時(shí)不時(shí)蹦出的專業(yè)詞匯等。
由此可見,語音之于智能家電確實(shí)有點(diǎn)“路漫漫其修遠(yuǎn)兮,吾將上下而求索“的意味。盡管國(guó)際大佬紛紛搶占智能家居語音識(shí)別這一市場(chǎng),但于技術(shù)層面而言,只有通過攜手合作,共享技術(shù)平臺(tái),發(fā)揮各自優(yōu)勢(shì),才能真正解決家居智能化的難題,給用戶最便捷、有價(jià)值的體驗(yàn)。