語(yǔ)音系統(tǒng)開(kāi)發(fā)的新平臺(tái):VoiceXML瀏覽器
張欣
2001/10/19
VoiceXML將語(yǔ)音交互引入了數(shù)據(jù)瀏覽的世界,使電話(huà)等以語(yǔ)音為主要形式的設(shè)備成為新型的網(wǎng)絡(luò)終端,其自然、簡(jiǎn)單,具備了更為廣泛的普及性和友好性。本文對(duì)無(wú)限商機(jī)公司的VoiceXML語(yǔ)音瀏覽器的介紹,將幫助讀者進(jìn)一步了解它的功能和用途。
無(wú)限商機(jī)公司的VoiceXML語(yǔ)音瀏覽器是為解決用戶(hù)的多種需求而設(shè)計(jì)的,在實(shí)現(xiàn)過(guò)程中,分別設(shè)計(jì)了控制層、安全層、事務(wù)層、會(huì)話(huà)層和應(yīng)用層,并開(kāi)放了除控制層之外的所有層的接口。
1.VoiceXML語(yǔ)音瀏覽器的組成部分
一個(gè)完整的VoiceXML語(yǔ)音瀏覽器,由VoiceXML 解析器、語(yǔ)音識(shí)別引擎、語(yǔ)音合成引擎、語(yǔ)音通道等幾個(gè)部分組成。
(1)VoiceXML 解析器
VoiceXML解析器是整個(gè)語(yǔ)音瀏覽器的核心部分,在語(yǔ)音瀏覽器中擔(dān)負(fù)控制中心的角色。VoiceXML解析器通過(guò)網(wǎng)絡(luò)協(xié)議,如HTTP協(xié)議等,獲取VoiceXML
腳本語(yǔ)言所描述的應(yīng)用文檔;解析該應(yīng)用文檔,解釋其中各個(gè)標(biāo)志,生成相應(yīng)的控制命令,控制其他部件進(jìn)行相應(yīng)的動(dòng)作,并獲取結(jié)果;根據(jù)結(jié)果決定應(yīng)用的執(zhí)行方向和順序流。
(2)語(yǔ)音識(shí)別引擎
語(yǔ)音識(shí)別引擎是VoiceXML語(yǔ)音瀏覽器的生命力所在,它使計(jì)算機(jī)能理解用戶(hù)的語(yǔ)音命令,將產(chǎn)生的相應(yīng)的文字結(jié)果送回VoiceXML解析器進(jìn)行處理。
在VoiceXML語(yǔ)音瀏覽器中,語(yǔ)音識(shí)別引擎為命令式的識(shí)別引擎,其根據(jù)有限的語(yǔ)法來(lái)識(shí)別用戶(hù)的語(yǔ)音信號(hào),產(chǎn)生對(duì)應(yīng)語(yǔ)法定義的識(shí)別結(jié)果。所以,語(yǔ)法便成為了VoiceXML語(yǔ)音瀏覽器中的重要概念。在VoiceXML語(yǔ)音瀏覽器中,語(yǔ)法決定了用戶(hù)能說(shuō)什么、如何說(shuō)。好的語(yǔ)法能帶給用戶(hù)良好的交互感覺(jué),也能從邏輯上提高語(yǔ)音識(shí)別引擎的識(shí)別率,使整個(gè)語(yǔ)音應(yīng)用的瀏覽流暢而輕松。
在VoiceXML語(yǔ)音瀏覽器中,語(yǔ)音識(shí)別引擎不僅需要處理對(duì)用戶(hù)語(yǔ)音信號(hào)的識(shí)別,同時(shí)也需要處理對(duì)用戶(hù)按鍵的識(shí)別,按鍵和語(yǔ)音以同樣的機(jī)制被處理和傳遞。
(3)語(yǔ)音合成引擎
VoiceXML語(yǔ)音合成引擎可以將文字轉(zhuǎn)換成語(yǔ)音文件,也可以轉(zhuǎn)換成語(yǔ)音數(shù)據(jù)流,或者直接將事先錄制好的語(yǔ)音文件直接播放或以流的方式播放給語(yǔ)音通道。
語(yǔ)音合成引擎將文字轉(zhuǎn)化為聲音的品質(zhì),決定了用戶(hù)對(duì)系統(tǒng)的直接感覺(jué)。因此,如何提高語(yǔ)音合成引擎的合成品質(zhì),已成為影響語(yǔ)音應(yīng)用效果的重要因素。
(4)語(yǔ)音通道
語(yǔ)音通道是在VoiceXML語(yǔ)音瀏覽器中傳輸用戶(hù)語(yǔ)音數(shù)據(jù)信號(hào)和由合成引擎所產(chǎn)生的聲音數(shù)據(jù)信號(hào)的傳遞通道,它在物理上連接語(yǔ)音采集和播放設(shè)備、語(yǔ)音識(shí)別引擎的語(yǔ)音輸入端和語(yǔ)音合成引擎的語(yǔ)音輸出端。
在基于電信平臺(tái)的語(yǔ)音應(yīng)用系統(tǒng)中,語(yǔ)音通道的物理設(shè)備主要是語(yǔ)音卡、語(yǔ)音信道或是以數(shù)字編碼形式存在的虛擬通道,如IP的語(yǔ)音編碼數(shù)據(jù)包等;而在PC平臺(tái)上,聲卡則成為主要的語(yǔ)音通道。
對(duì)不同平臺(tái)的語(yǔ)音通道物理設(shè)備的支持,決定了VoiceXML語(yǔ)音瀏覽器是一個(gè)可實(shí)際應(yīng)用的平臺(tái)。
2.VoiceXML語(yǔ)音瀏覽器各部分的協(xié)作
VoiceXML語(yǔ)音瀏覽器的協(xié)作核心是VoiceXML解析器,其通過(guò)建立應(yīng)用和會(huì)話(huà),獲取包含控制命令的文檔,根據(jù)文檔中的標(biāo)志建立對(duì)話(huà),從而解釋各個(gè)對(duì)話(huà),控制語(yǔ)音識(shí)別、語(yǔ)音合成引擎以及語(yǔ)音通道的觸發(fā)、開(kāi)啟關(guān)閉和掛起等,實(shí)現(xiàn)與用戶(hù)的會(huì)話(huà)式的交互,并根據(jù)對(duì)用戶(hù)反饋的識(shí)別結(jié)果進(jìn)行導(dǎo)向判斷,進(jìn)行文檔之間的轉(zhuǎn)移和應(yīng)用之間的轉(zhuǎn)移。
3.VoiceXML語(yǔ)音瀏覽器的開(kāi)放機(jī)制
在無(wú)限商機(jī)公司的VoiceXML語(yǔ)音瀏覽器中,對(duì)識(shí)別引擎和合成引擎進(jìn)行了開(kāi)放性的接口設(shè)計(jì),實(shí)現(xiàn)了與引擎無(wú)關(guān)的設(shè)計(jì)。根據(jù)此接口,開(kāi)發(fā)商可以開(kāi)發(fā)用于其他識(shí)別或合成引擎的封裝模塊,從而在無(wú)限商機(jī)的VoiceXML語(yǔ)音瀏覽器中使用其他的識(shí)別或合成引擎。其可建立于電話(huà)服務(wù)器、PC
、嵌入式設(shè)備中,支持國(guó)內(nèi)外語(yǔ)音卡,支持IP等語(yǔ)音信道。
無(wú)限商機(jī)公司VoiceXML語(yǔ)音瀏覽器中,所有開(kāi)發(fā)接口是以CORBA規(guī)范設(shè)計(jì)的,開(kāi)發(fā)商可以用各種編程語(yǔ)言,如C、C++、Java等,在不同的平臺(tái)和操作系統(tǒng)上實(shí)現(xiàn),從而實(shí)現(xiàn)對(duì)各種操作系統(tǒng)平臺(tái)的支持。并且,利用CORBA強(qiáng)大的分布式機(jī)制,整個(gè)VoiceXML語(yǔ)音瀏覽器可以建立于跨越各種物理平臺(tái)、操作系統(tǒng)之上的分布式網(wǎng)絡(luò)中。
4.在VoiceXML語(yǔ)音瀏覽器上開(kāi)發(fā)語(yǔ)音應(yīng)用
在VoiceXML語(yǔ)音瀏覽器上開(kāi)發(fā)語(yǔ)音應(yīng)用,如同開(kāi)發(fā)Web應(yīng)用一樣輕松簡(jiǎn)單,只需要有XML的知識(shí),就可以開(kāi)發(fā)VoiceXML應(yīng)用。基于VoiceXML的語(yǔ)音應(yīng)用系統(tǒng),可以很好地與其他已有的Web
應(yīng)用系統(tǒng)或數(shù)據(jù)應(yīng)用系統(tǒng)實(shí)現(xiàn)良好結(jié)合。
在VoiceXML語(yǔ)音瀏覽器基礎(chǔ)上的應(yīng)用開(kāi)發(fā),改變了傳統(tǒng)的CTI系統(tǒng)的開(kāi)發(fā)概念。開(kāi)發(fā)人員不必關(guān)心復(fù)雜的流程和模塊,不必為數(shù)據(jù)接口編寫(xiě)程序模塊,不必重新建立已有系統(tǒng)的邏輯實(shí)現(xiàn),也不必一次次地重復(fù)某個(gè)模塊的開(kāi)發(fā)。
計(jì)算機(jī)世界網(wǎng) 2001/10/19
相關(guān)鏈接:
民勤县|
闽清县|
信阳市|
安宁市|
郓城县|
乌海市|
石楼县|
弥渡县|
碌曲县|
开江县|
古交市|
闻喜县|
夏河县|
嵊泗县|
朝阳县|
平凉市|
清水县|
东平县|
都兰县|
安阳市|
龙游县|
应城市|
都安|
德令哈市|
西平县|
额济纳旗|
尚志市|
武清区|
印江|
五大连池市|
邯郸县|
平武县|
社会|
托里县|
大港区|
灵武市|
景泰县|
莱芜市|
盱眙县|
驻马店市|
平原县|