曾幾何時(shí),人們對XML已耳熟能詳,并將它用于描述圖像和結(jié)構(gòu)復(fù)雜的其他數(shù)據(jù)。Web技術(shù)發(fā)展之快令人驚嘆!現(xiàn)在,業(yè)界又正在展開一項(xiàng)XML的新的應(yīng)用:VoiceXML(話音可擴(kuò)展標(biāo)記語言),其主要特點(diǎn)是通過語音輸入和音頻輸出支持人機(jī)對話。
VoiceXML的基本功能
VoiceXML是萬維網(wǎng)集團(tuán)(W3C)定義的可擴(kuò)展標(biāo)記語言(XML)的一種新的應(yīng)用。或者說它是一種域?qū)S谜Z言,根據(jù)所播放的音頻文件、要口述的文本、要記錄和識別的語言以及所收集的按鍵音輸入,定義人和計(jì)算機(jī)之間的對話。VoiceXML可以描述傳統(tǒng)的語音響應(yīng)業(yè)務(wù)以及新的混合主動(dòng)式業(yè)務(wù)。
VoiceXML的主要特性
VoiceXML 1.0版的主要特性可以分為4個(gè)方面:對話、電話、平臺和性能。
VoiceXML分布式模型
Web為每個(gè)用戶提供全球范圍的信息,同時(shí)給每個(gè)信息和服務(wù)提供商提供全球范圍的用戶。因此,分布式應(yīng)用模型是Web的基本模型;VoiceXML建立在與基于Web的相同的模型上。圖1表示通過電話訪問的VoiceXML業(yè)務(wù)使用的基于Web的分布式應(yīng)用模型。
青出于藍(lán)而勝于藍(lán)
盡管VoiceXML重用許多HTML的概念和設(shè)計(jì),但由于可視和語音交互之間的區(qū)別,它在幾個(gè)方面具有不同的特點(diǎn)。例如,HTML文件是從統(tǒng)一資源識別符確定的網(wǎng)絡(luò)資源中讀出的單個(gè)元素,并同時(shí)將所有的元素提供給用戶。VoiceXML則不同,它包含若干對話元素(選單、表格),依次順序地將這些元素提供給用戶。這種區(qū)別歸因于可視媒介能夠同時(shí)顯示若干選項(xiàng),而話音媒介本來就具有連續(xù)性特點(diǎn)。
話音媒介連續(xù)性的再一個(gè)不同特點(diǎn)是要求標(biāo)記包含應(yīng)用邏輯,以用于在對話元素之間排列程序。這一要求反映在順序邏輯元素的集成方面,VoiceXML比HTML更緊湊。例如,VoiceXML包含順序控制元素,而在HTML中,這種控制只能通過更麻煩的編寫腳本的方法才能實(shí)現(xiàn)。
W3C語音瀏覽器工作組已將VoiceXML 1.0版確定為對話標(biāo)記語言的基礎(chǔ)。VoiceXML客戶程序和VoiceXML應(yīng)用業(yè)務(wù),目前已在許多公司中開始實(shí)用。