在語音識別技術(shù)領(lǐng)域,IBM是全球的領(lǐng)導廠商。1996年,IBM公司發(fā)布了VoiceType中文語音識別軟件,首次將其語音識別產(chǎn)品介紹給中國用戶。1997年9月,IBM推出了ViaVoice中文連續(xù)語音識別系統(tǒng),標志著中文語音識別技術(shù)商業(yè)化進程開始啟動。IBM在語音識別技術(shù)領(lǐng)域已進行了近三十年的研究,獲得了近百項專利,故而有著深厚的技術(shù)積淀。
在以計算機和網(wǎng)絡(luò)為代表的信息設(shè)施應用如此頻繁的社會里,人機交互技術(shù)的作用非常重要。人們必須把信息內(nèi)容輸入到信息設(shè)備之中,一般而言,人們使用鍵盤把字符輸入到計算機。手寫識別技術(shù)可以通過書寫筆把文字輸入到計算機里,而語音識別技術(shù)則通過口說方式把文字輸入到信息設(shè)備中。
ViaVoice是IBM語音識別核心引擎,它在全世界擁有數(shù)百萬的用戶。因為說話是人們最基本的信息“輸出”方式,所以語音識別技術(shù)可以應用到許許多多的領(lǐng)域,如Internet、工業(yè)控制、教育、娛樂、醫(yī)療保健、電子商務、辦公自動化、企業(yè)管理、旅游服務和交通等。
從大的方面來說,語音識別技術(shù)的應用可分為:桌面應用、網(wǎng)絡(luò)/電話系統(tǒng)應用、Web和信息家電應用。桌面應用是指集成于桌面的應用軟件,如市場上已出現(xiàn)的用于PC機的語音輸入、聽寫系統(tǒng)軟件。網(wǎng)絡(luò)/電話系統(tǒng)應用是指把語音技術(shù)與遠程信息查詢、處理、生成等相結(jié)合。Web應用是把語音技術(shù)與Web應用結(jié)合,例如語音瀏覽器、網(wǎng)上語音聊天室等。信息家電方面的應用則是指手持式或移動通訊設(shè)備及家用電器的語音控制和內(nèi)容輸入,如語音撥號手機、帶語音識別的門禁系統(tǒng)、語音控制的冰箱和空調(diào)等。
為順應網(wǎng)絡(luò)的發(fā)展,IBM公司推出了“IBM網(wǎng)頁之聲”中文語音合作技術(shù)(TTS)。TTS使人可以聽到網(wǎng)頁的內(nèi)容,給有視覺障礙的人上網(wǎng)帶來了方便。“IBM網(wǎng)頁之聲”利用小鍵盤控制瀏覽,用戶可以自定義瀏覽替代信息。它具有網(wǎng)頁信息歸類和區(qū)分功能,并提供電子郵件接口,還提供有聲的軟件安裝和聯(lián)機幫助。
IBM ViaVoice電話系統(tǒng)開發(fā)工具為使用者提供了一個開放式的語音識別引擎和完善的應用開發(fā)環(huán)境。用戶可以方便快捷地在電話系統(tǒng)中集成語音識別功能,為聲訊服務系統(tǒng)、電子商務平臺和涉及電話通信的語音應用系統(tǒng)提供語音交互界面。
“巍巍世紀版”是ViaVoice最新產(chǎn)品,它在自然語言識別率、界面、靈活性等方面都較以前版本有所增強。此外,ViaVoice “巍巍世紀版”具有更強大的智能化識別技術(shù),它在使用過程中會一直學習用戶的講話,學習用戶語音的特點,每次使用都有改進。