今天看了google的黑板報(bào),傳說中的谷歌中文手機(jī)語音搜索正式于二號(hào)發(fā)布,使用者可以通過自己的聲音來和手機(jī)進(jìn)行交互,找到自己所需要的信息。
能夠和計(jì)算機(jī)等設(shè)備進(jìn)行對(duì)話是人們的一個(gè)愿望,人類已經(jīng)不滿足于目前通過鼠標(biāo)、按鍵等方式和設(shè)備進(jìn)行交互,希望可以通過語音來和設(shè)備進(jìn)行交互,通過語音來使用和控制設(shè)備。在語音交互中最主要的就是語音識(shí)別系統(tǒng)。在語音識(shí)別系統(tǒng)中最為困難最難以解決的就是對(duì)用戶背景噪音和用戶發(fā)音變化的處理,這兩個(gè)關(guān)鍵如果可以突破將使語音交互這種方式運(yùn)用在更多的設(shè)備和環(huán)境上。
Google中文語音搜索首先運(yùn)用在手機(jī)設(shè)備上,其是必然的,因?yàn)槠涫謾C(jī)的廣泛使用和語音芯片的發(fā)展,可以在一定程度上解決使用者背景噪音的問題,但是對(duì)于用戶發(fā)音變化(比方言、使用特殊音節(jié)等)這以問題并沒有很好的解決。
對(duì)于用戶來說需要使用語音交互主要有以下情況:
1.用戶有視覺方面的損傷和缺陷
2.用戶肢體處于忙碌狀態(tài)
3.用戶的眼睛被其它事情占用時(shí)
4.需要靈活反應(yīng)時(shí)
5.在某些場合不方便使用鍵盤、鼠標(biāo)等其它輸入形式時(shí)
語音交互形式的廣泛應(yīng)用的前提條件是其相關(guān)技術(shù)的的發(fā)展成熟,目前與語音交互相關(guān)聯(lián)的技術(shù)主要有:
1.語音存儲(chǔ)轉(zhuǎn)發(fā)
2.離散詞語識(shí)別
3.連續(xù)語音識(shí)別
4.聲音信息系統(tǒng)
5.語音生成
語音交互形式相對(duì)于其它交互形式的不足點(diǎn):
語音交互輸入的主要問題
1.與手指交互比,增加用戶認(rèn)知負(fù)擔(dān)
2.容易受到外部噪音的干擾
3.遇到用戶、環(huán)境等變化語音識(shí)別將會(huì)變的很不穩(wěn)定
語音交互輸出的主要問題
1.與視頻輸出相比,速度比較緩慢
2.語音屬于短時(shí)記憶,消失比較快,增加用戶認(rèn)知、記憶難度
3.瀏覽和搜索比較困難
雖然語音交互有不少的缺點(diǎn),但是其巨大的優(yōu)勢還是會(huì)在未來的交互方式中占據(jù)重要一席。希望有越來越多的使用語音交互技術(shù)的產(chǎn)品出現(xiàn),特別是互聯(lián)網(wǎng)產(chǎn)品。