今天看了google的黑板報,傳說中的谷歌中文手機(jī)語音搜索正式于二號發(fā)布,使用者可以通過自己的聲音來和手機(jī)進(jìn)行交互,找到自己所需要的信息。
能夠和計算機(jī)等設(shè)備進(jìn)行對話是人們的一個愿望,人類已經(jīng)不滿足于目前通過鼠標(biāo)、按鍵等方式和設(shè)備進(jìn)行交互,希望可以通過語音來和設(shè)備進(jìn)行交互,通過語音來使用和控制設(shè)備。在語音交互中最主要的就是語音識別系統(tǒng)。在語音識別系統(tǒng)中最為困難最難以解決的就是對用戶背景噪音和用戶發(fā)音變化的處理,這兩個關(guān)鍵如果可以突破將使語音交互這種方式運用在更多的設(shè)備和環(huán)境上。
Google中文語音搜索首先運用在手機(jī)設(shè)備上,其是必然的,因為其手機(jī)的廣泛使用和語音芯片的發(fā)展,可以在一定程度上解決使用者背景噪音的問題,但是對于用戶發(fā)音變化(比方言、使用特殊音節(jié)等)這以問題并沒有很好的解決。
對于用戶來說需要使用語音交互主要有以下情況:
1.用戶有視覺方面的損傷和缺陷
2.用戶肢體處于忙碌狀態(tài)
3.用戶的眼睛被其它事情占用時
4.需要靈活反應(yīng)時
5.在某些場合不方便使用鍵盤、鼠標(biāo)等其它輸入形式時
語音交互形式的廣泛應(yīng)用的前提條件是其相關(guān)技術(shù)的的發(fā)展成熟,目前與語音交互相關(guān)聯(lián)的技術(shù)主要有:
1.語音存儲轉(zhuǎn)發(fā)
2.離散詞語識別
3.連續(xù)語音識別
4.聲音信息系統(tǒng)
5.語音生成
語音交互形式相對于其它交互形式的不足點:
語音交互輸入的主要問題
1.與手指交互比,增加用戶認(rèn)知負(fù)擔(dān)
2.容易受到外部噪音的干擾
3.遇到用戶、環(huán)境等變化語音識別將會變的很不穩(wěn)定
語音交互輸出的主要問題
1.與視頻輸出相比,速度比較緩慢
2.語音屬于短時記憶,消失比較快,增加用戶認(rèn)知、記憶難度
3.瀏覽和搜索比較困難
雖然語音交互有不少的缺點,但是其巨大的優(yōu)勢還是會在未來的交互方式中占據(jù)重要一席。希望有越來越多的使用語音交互技術(shù)的產(chǎn)品出現(xiàn),特別是互聯(lián)網(wǎng)產(chǎn)品。