隨著我國通信事業(yè)的迅速發(fā)展,電話的普及率在大大提高。從這個意義上講,計算機技術及其網絡系統的發(fā)展,將給公共語音識別系統的應用帶來廣闊的發(fā)展空間和市場前景。
語音門戶的發(fā)展背景
在當今飛速發(fā)展的信息社會,“移動”與“互聯”已經成為不可阻擋的潮流,越來越多的人們要通過網絡來優(yōu)化自己的生活,如: 查詢股票信息、天氣預報、航班列車時刻、網上購物等。隨時隨地獲取信息并進行基于電子商務平臺的交易,已越來越成為人們的迫切需要。Internet的蓬勃發(fā)展和迅速普及已逐漸使很多人把從網上獲取信息和通過網絡實現電子商務,視作日常生活中的一部分。
然而,人們通過計算機上網的同時,也越來感到這種方式受到時間、地點等諸多因素限制,很難做到信息的及時獲取,人們希望通過隨處可見的電話得到自己所需要的信息。目前,像160等傳統的聲訊服務臺,采用雇傭話務員提供信息服務的方式,不僅成本昂貴,而且由于工作繁重容易導致接聽人員服務水平下降。而通過如168等自動聲訊服務方式,雖然也可以獲取一些信息,但是由于電話機按鍵的限制,很多信息無法用按鍵輸入表示。因而許多具體的應用不是難以實現,就是在實現時由于多級菜單過于繁瑣使用戶感到不便; 另外,繁多的聲訊臺號碼也讓使用者在急需服務時,往往一時找不到所需的號碼。
由于以上原因,人們越來越希望可以通過電話設備實現快速便捷的交流,即通過電話接入網絡并操縱遠程的信息源,以得到信息或進行電子化交易。交談式語言是人類最自然的交流方式,通過語音瀏覽和接入互聯網,也一直是人類的追求目標。目前,采用撥號接入網絡的程序通常需耗時數十秒,而通過語音接入所需的時間只有短短幾秒,因而通過語音界面,無疑將大大提高接入速度。另外,這種語音技術將令使用者無論在何時、身處何地,都可以利用手中的電話裝置(移動或固定均可),就能輕松接入網絡,得到所需信息或購買商品及服務。更重要的是,這種方式將大大提高商業(yè)自動化程度,降低企業(yè)的運營成本,改善服務質量,使商務活動更加便捷。語音門戶(Voice Portal)的出現,正滿足了人們這些需要,為互聯網詮釋出全新的涵義。
從技術的角度看,過去數十年,自動語音識別(ASR)技術、文本轉語音(TTS)技術已經從實驗室中逐步走向成熟,其算法復雜性也以每兩年下降一半的速度遞減,從而使這些技術逐步在市場中得到廣泛應用; 另一方面,電子計算機的運算能力每兩年可以翻一番,也為這些技術的商業(yè)應用奠定了堅實的基礎;再加上移動用戶終端的種類與功能也在以前所未有的速度增長。所有這些技術的發(fā)展都為基于語音的互聯網門戶—語音門戶的發(fā)展提供了可靠保證。
言豐科技從事語音技術多年,在自動語音識別(ASR)、文本轉語音(TTS)等語音技術領域都擁有成熟可靠的產品,在此基礎上,融合了CTI技術、Web技術、電信技術、計算機及網絡等技術,構筑出了新一代的上網平臺——語音門戶。它代表了計算機語音與互聯網融合的新趨勢,將使更多的用戶能夠快速接入互聯網,為企業(yè)帶來新的業(yè)務增長點。
系統平臺帶來的益處
從該系統面向的對象來看,無論對于企業(yè),還是個人,語音門戶都將帶來很大的益處。
首先,它可為最終用戶帶來巨大的方便,用戶只要對著一部隨手可得的電話發(fā)話即可,不再受制于按鍵音頻,也不必因為不便攜帶電腦而“望信息興嘆”。這不僅使那些并不擅于使用計算機的人也能夠輕松地通過互聯網獲得服務,同時也使那些手邊沒有計算機的人也能夠獲得必要的信息。目前,市場上推出的互聯網移動終端只注重將互聯網內容移到終端上,卻沒有充分考慮這些系統的易用性,而語音門戶恰好彌補了這一不足,使任何人都能夠通過語音門戶暢游互聯網。
另一方面,該平臺具有巨大的商業(yè)價值,企業(yè)本身會從該系統中受益。從系統平臺的角度看,它能夠替代話務員工作,可令企業(yè)將更多的人力與精力投放在對其核心增值服務的開拓上,并為其產品和服務在激烈的市場競爭中開辟出新的空間。比如,我們最常用的交互式語音應答系統IVR,具有自動語音交互功能,可使企業(yè)在節(jié)省更多成本的同時,享受更自然、更舒適的交互界面。同時,實現語音交互功能的IVR應用也比雙音多頻(DTMF)或按鈕應用更方便,這也將為企業(yè)帶來更好的投資回報。
從應用功能上來看,語音門戶為用戶帶來了方便的應用:
一方面,語音門戶讓用戶可隨時隨地輕松獲取各種信息。例如,用戶只需用普通電話機或移動電話撥打語音門戶網的特定號碼,就可在語音提示引導之下用自然語言和耳朵便捷地“瀏覽”天氣、新聞、體育等多方面的信息。在這個過程中,不必鍵入菜單選擇,僅需簡單的語音應答即可完成操作。所以,無論是通過PC機、手機或者固定電話,也無論是在辦公室、家中,還是在路上、車上,用戶只要通過與語音門戶展開交互式對話,就可以像“網上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè),使“瀏覽”網絡的過程變得輕松無比。
另一方面,語音門戶還可讓用戶隨時隨地進行訂票、購物等電子化交易。人們采用語音門戶平臺獲得網上信息并開展交易活動的方式,與通過代理人建立連接相比,速度更快,并且還可享受到更廉價的服務。正如門戶網站把自身信息和其他信息整合起來一樣,語音門戶也把自身語音信息資源和其他資源綜合在了一起,在普通的電話網上以一個統一的號碼向用戶提供各種各樣的信息服務。其他的諸如虛擬個人助理、股票交易代理、企業(yè)內自動值守、旅游訂票系統等,也可靈活地在該平臺上構筑實現。
業(yè)務功能實現
作為VoiceXML組織的重要成員,言豐推出了完全自主設計的語音門戶平臺。用戶通過這個平臺,可把有線電話網、無線通信網、尋呼網、Internet聯系為一個有機的整體,用戶通過電話不但可以查詢股票行情、天氣預報、航班動態(tài)、火車時刻表等信息,而且可點播自己定制的新聞、證券評論等; 同時也可以把它作為自己的統一消息平臺。更為重要的是,在該平臺上,用戶還可直接與計算機系統進行互動操作,通過該平臺實現購買飛機票、股票等語音電子商務活動。歸納起來,該系統可分為信息查詢、信息點播、交易處理、統一消息等4個功能模塊。
信息查詢功能
通過該功能模塊,用戶在全天24小時內可隨時得到全方位的語音信息服務,企業(yè)也可通過該平臺提高服務質量,并在實現了呼叫自動化的基礎上節(jié)省企業(yè)運營成本。該模塊的主要功能包括:
- 168、121等各種特服信息查詢;
- 證券信息的公告和委托;
- 銀行系統賬目查詢和電話銀行;
- 社會調查;
- 法律、保險信息咨詢;
- 旅游信息查詢;
- 政府公告及各種法律法規(guī)查詢;
- 運輸業(yè)信息查詢: 如航班查詢、火車運行時刻查詢和運送貨物查詢等。
用戶對股票信息進行查詢時,不但可查詢實時股票行情,而且對另開戶進行股票交易的客戶和利用存折進行股票交易的客戶,還提供資金查詢服務;也可對客戶所擁有的證券情況或客戶的委托情況等進行全方位的信息查詢服務。
信息點播功能
信息點播可以使用戶訂購和點播自己想得到的內容,如股票實時行情查詢、證券指數查詢、天氣查詢、出港航班查詢等信息,可實現股票點播、天氣預報、股票漲跌告警、體育(福利)彩票、航班信息、火車時刻、熱點新聞、電視節(jié)目、生活常識等實用信息的點播服務。
交易處理功能
通過語音平臺,用戶可以實現電子化交易,即語音電子商務。該項業(yè)務可以針對某一行業(yè)進行定制,也可以提供多種行業(yè)的綜合交易服務。
用戶通過電話辦理某項交易時,由于交易不同,所涉及的用戶資料也不同,如用戶業(yè)務性能和功能變化、用戶產權變更等,所以必須先通過用戶賬號、密碼管理系統等手段確認、證實,并制定相應的管理制度,以進行嚴格管理。
統一消息功能
信息社會的快速發(fā)展使每天都有各種各樣的信息涌向我們每一個人,這些信息給我們帶來巨大的便利和經濟效益,同時也使我們處于這樣一種窘境:我們擁有如此之多的通信聯系方式,如電話、手機、呼機等,而這些通信工具又互不相干,無法實現信息互通,以至于我們不得不逐項檢查這些信息源,去提取屬于我們的有用信息。而語音平臺中“統一消息”功能模塊可將這些功能集中在一起,用戶通過一個統一的號碼接入系統,即可得到全部所需信息。
結 束 語
語言,一直是并且仍將是人們進行信息交流的最自然、最直接和最主要的方式。人們希望用語音和計算機直接進行交流,讓計算機擁有能聽懂語言的“耳朵”,這就是人們對計算機自動語音識別的構想。計算機智能語音識別的意義十分重大,它使人們可以方便地通過語音完成各種操作。目前,世界上一些服務行業(yè)的企業(yè),如銀行、股票公司、旅游服務公司、航空公司等,紛紛投資、合作開發(fā)或購買具有語音功能的服務系統,以此降低其運營成本。如AT&T電話公司,通過自動語音交互應答系統,可以識別出用戶的付費方式。僅此一項,每年就為該公司節(jié)省下巨額成本。可見,語音識別系統應用已給一些發(fā)達國家?guī)砹司薮蟮慕洕б? 同時,也說明了自動語音識別服務系統已經形成了一定的市場規(guī)模,并將迅速成為具有市場競爭力的高技術含量的產品。
電話語音智能識別系統利用現有發(fā)達的電話網,使用戶能夠以最簡單、最方便、最滿意的方式獲取信息。以“說話”的方式來操縱計算機網絡系統,將徹底改變人們幾十年形成的按鍵操作的傳統概念和習慣,使人重歸自然,輕松自由。美國朗訊科技公司在推廣使用具有語音識別功能的電話自動服務系統時,做過一個統計: 在增加語音識別功能之前,大約有19%的打電話者聽到第一組提示時沒有任何反應; 增加該功能后,這個百分比降到了2%。此外,起初約有36%的打電話者仍堅持用按鍵方式,但在一星期后,完全使用語音識別功能的人數增加到46%。
《計算機世界》2001/05/11