首頁>>廠商>>軟件開發(fā)商>>microsoft

聲控你的系統(tǒng) Vista語音識(shí)別全體驗(yàn)

2007/03/22

  Vista是微軟首個(gè)內(nèi)置了語音識(shí)別功能的操作系統(tǒng)。通過這個(gè)特性,你可以完成一些任務(wù),例如打開或關(guān)閉程序,保存或刪除文件,通過聽寫輸入文檔并編輯文本等等。下面就一起來分享一下在Vista中使用語音識(shí)別的體驗(yàn),并講解一下可用的選項(xiàng)。

  隨著科技的發(fā)展,許多的計(jì)算機(jī)用戶都?jí)粝肽軌驋仐壦麄兊逆I盤,遠(yuǎn)離他們的鼠標(biāo),只用聲音就能夠控制他們的計(jì)算機(jī)。一些能夠通過聲音指示命令或聽寫文本的程序已經(jīng)存在了很多年,也證實(shí)了它們對(duì)于那些身體上不能使用其它輸入方法的人來說,是特別有用的,但這樣的程序卻始終沒有得到真正地廣泛普及。

  Windows Vista是微軟第一個(gè)內(nèi)置了語音識(shí)別功能的操作系統(tǒng)。在以前,語音識(shí)別是作為微軟Office XP或Office 2003的一部分,或是通過像Dragon NaturallySpeaking這樣的第三方軟件進(jìn)行添加。微軟的Voice Command將語音識(shí)別功能添加到了Windows移動(dòng)操作系統(tǒng)中。但無論如何,在這些情況下,你都需要購買并安裝額外的軟件。

圖1 你可以在控制面板中對(duì)語音識(shí)別進(jìn)行設(shè)置

  在Vista中,你就不需要再購買其它的東西來對(duì)你的計(jì)算機(jī)說話。但它在默認(rèn)情況下是沒有啟用的,但它一直都呆在你的控制面板中,時(shí)刻嚴(yán)陣以待。

  如圖2所示,你也可以在“所有程序|附件|輕松訪問”菜單下找到語音識(shí)別特性。圖2 在“輕松訪問”菜單中,你也能看到“語音識(shí)別”

它是如何工作的呢?在此,有兩種情況能夠使用語音識(shí)別技術(shù):

  1. 用來控制軟件:打開和關(guān)閉程序,以及在它們之間進(jìn)行切換;保存和刪除文件等等。

  2. 聽寫文本,逐字譯入文檔以及對(duì)文本進(jìn)行編輯。

  開發(fā)者可以使用Vista語音的API來對(duì)任何應(yīng)用程序添加語音識(shí)別功能。然而,Vista的語音識(shí)別目前還不能支持所有語言,它只能夠支持英語(美式和英式)、德語、法語、西班牙語、日語和中文(簡體與繁體)。

對(duì)語音識(shí)別進(jìn)行設(shè)置和配置

  在你開始使用語音識(shí)別之前,你需要完成以下步驟:

  1. 打開語音識(shí)別。

  2. 安裝好你的麥克風(fēng)。

  3. 完成指導(dǎo)學(xué)習(xí)(這并非必須,但推薦這么做)。

  4. 訓(xùn)練識(shí)別引擎,使它能理解你的聲音(這也并非必須,但我們還是推薦這么做)。

   當(dāng)你雙擊控制面板中的“語音識(shí)別”,或在“輕松訪問”菜單中選擇“語音識(shí)別”時(shí),“語音識(shí)別選項(xiàng)”對(duì)話框就會(huì)出現(xiàn),如圖3所示。

圖3 第一步要做的就是對(duì)你的語音識(shí)別進(jìn)行配置

  當(dāng)你點(diǎn)擊了“啟動(dòng)語音識(shí)別”時(shí),語音控制臺(tái)就會(huì)出現(xiàn)在屏幕的頂部,如圖4所示。


圖4 語音識(shí)別啟動(dòng)時(shí)出現(xiàn)的語音識(shí)別控制臺(tái)

  如果你將語音識(shí)別設(shè)置為當(dāng)Windows啟動(dòng)時(shí)啟動(dòng),那么每當(dāng)你開啟你的電腦,這個(gè)控制臺(tái)就會(huì)出現(xiàn)在屏幕上方。同時(shí),一個(gè)“語音”圖標(biāo)(趁著藍(lán)色圓形背景的一個(gè)白色的麥克風(fēng))就會(huì)當(dāng)語音識(shí)別啟動(dòng)時(shí)出現(xiàn)在系統(tǒng)托盤處。

  你可以通過右鍵點(diǎn)擊這個(gè)麥克風(fēng)圖標(biāo)來選擇語音選項(xiàng),無論是在控制臺(tái)上的還是系統(tǒng)托盤中的圖標(biāo)。接著就會(huì)顯示如圖5所示的相關(guān)菜單。

圖5 在相關(guān)菜單中你有很多可選項(xiàng)目

在菜單中,你可以做如下選擇:

  開:計(jì)算機(jī)會(huì)聆聽你所說的一切,并嘗試執(zhí)行它能夠識(shí)別的命令。
  休眠:計(jì)算機(jī)會(huì)聆聽,但除非你說“開始聆聽”,否則它不會(huì)做出任何反應(yīng)。
  關(guān):計(jì)算機(jī)將不會(huì)聆聽你所說的任何東西。
  打開語音參考卡:這是一個(gè)便利的簡單說明,關(guān)于一些常用的命令以及如何操作的信息。
  開始語音教程:這是一個(gè)互動(dòng)的簡單視頻教程,它會(huì)通過實(shí)際操作教你如何使用語音識(shí)別。
  幫助:這將會(huì)打開幫助文件,告訴你關(guān)于設(shè)置以及使用語音識(shí)別的信息。
  選項(xiàng):在此,你可以選擇是否需要語音識(shí)別播放聲訊反饋、啟動(dòng)時(shí)運(yùn)行、朗讀更正對(duì)話框中的文本、以及在所有位置啟用聽寫。
  配置:在此,你可以設(shè)置你的麥克風(fēng)、提高語音識(shí)別,或是打開語音控制面板。
  打開語音詞典:你可以添加新的詞到你的詞典中,特別是可以添加一些名字之類引擎難以識(shí)別的詞,或是阻止某些詞會(huì)被聽寫出來(例如一些你不會(huì)聽寫到的詞)。
  聽寫主題:在此僅有一個(gè)“敘述性”選項(xiàng)。
  你還可以訪問“Windows語音識(shí)別網(wǎng)站”。
  關(guān)于Windows語音識(shí)別:這也就是熟悉的Windows“關(guān)于”對(duì)話框,它能夠告訴你版本號(hào)以及許可授予名。
  打開語音識(shí)別。
  退出:關(guān)閉語音識(shí)別,控制臺(tái)會(huì)從屏幕上消失,而語音圖標(biāo)也會(huì)從系統(tǒng)托盤中消失。

設(shè)置麥克風(fēng)

  你可以在語音識(shí)別選項(xiàng)對(duì)話框或是語音關(guān)聯(lián)菜單中設(shè)置你的麥克風(fēng)。麥克風(fēng)設(shè)置程序首先會(huì)要求你確認(rèn)麥克風(fēng)的類型(頭戴式、桌面式或其它)。程序推薦你使用的是頭戴式麥克風(fēng),而我能夠證明,麥克風(fēng)類型的不同會(huì)造成語音識(shí)別使用過程中很大的差異。

  第一次我嘗試使用Vista的語音識(shí)別時(shí),我使用的是桌面式的麥克風(fēng),在Camtasia中錄制PowerPoint的演示的聲音中的一些任務(wù)中,它能夠很好地完成。然而,當(dāng)我在 Vista中進(jìn)行聽寫時(shí),所得到的結(jié)果是非常可笑的;我?guī)缀醪荒苈爩懗鰶]有一處錯(cuò)誤的完整的一個(gè)句子,無論我如何清晰、認(rèn)真地發(fā)音。當(dāng)我換成花費(fèi)了比桌面式麥克風(fēng)更昂貴的頭戴式麥克風(fēng)時(shí),準(zhǔn)確性就得到了改進(jìn),每五六個(gè)句子中只會(huì)發(fā)生一次錯(cuò)誤,而不是之前的每個(gè)句子中的幾個(gè)錯(cuò)誤。

  在你選擇好麥克風(fēng)類型之后,設(shè)置過程的下一頁會(huì)告訴你如何放置麥克風(fēng)的位置能獲得最好的效果。接下來,你會(huì)被要求對(duì)著麥克風(fēng)大聲閱讀一個(gè)短句,如圖6所示。

圖6 你必須對(duì)著麥克風(fēng)說話,這樣Windows才能夠自動(dòng)適應(yīng)你的音量

  現(xiàn)在,麥克風(fēng)就設(shè)置完畢等待使用了。然而,這并不意味著語音引擎就已經(jīng)為你的聲音做好了充分準(zhǔn)備。如果你像新聞播報(bào)員那樣發(fā)音標(biāo)準(zhǔn),沒有口音,又總是咬字清晰的話,你也許可以在不做訓(xùn)練的情況下使用語音識(shí)別。如果你有一些口音,或是并不能說完全標(biāo)準(zhǔn)的普通話,那么如果你想要獲得更好的使用效果,你需要通過一個(gè)訓(xùn)練的過程。

  訓(xùn)練過程就是閱讀屏幕上一系列的文本選段,如圖7所示。

圖7 訓(xùn)練語音引擎以適應(yīng)你的發(fā)音方式能提高語音識(shí)別的準(zhǔn)確度

使用聲音命令

  現(xiàn)在,你就可以使用你的聲音命令來讓你的計(jì)算機(jī)完成一些任務(wù)。語音引擎統(tǒng)稱在識(shí)別命令上要比聽寫來得準(zhǔn)確,因?yàn)樗鼉H需要聽取有限的幾個(gè)命令。

  首先,確認(rèn)你的語音控制臺(tái)的語音狀態(tài)是“正在聽”。如果不是,那么你就可以說“開始聆聽”,或右鍵點(diǎn)擊麥克風(fēng)圖標(biāo)并選擇“開:聆聽我說的所有話語”。

  聲音命令的設(shè)計(jì)基本上都是盡可能地讓你能夠憑直覺地發(fā)出指令。例如,要打開一個(gè)開始菜單中的程序:

  說“點(diǎn)擊開始”

  說“點(diǎn)擊所有程序”

  說“Office Word 2007”(或是在“程序”菜單中任何其它你想要打開的程序名稱)

  簡單的命令是很容易使用的。但在一些程序中進(jìn)行一些操作時(shí)則會(huì)更具一些挑戰(zhàn),但你還是能夠做到的。

  如果你想要點(diǎn)擊一個(gè)按鈕或是連接,而它的名字是你不知道的,例如Office中,左上角的Office標(biāo)志按鈕,那么這時(shí)你該怎么做呢?在此有一個(gè)巧妙的方法:只需要說“顯示編號(hào)”,在當(dāng)前活動(dòng)窗口中所有能夠互動(dòng)的元素就會(huì)被數(shù)字所覆蓋,如圖8所示。

圖8 “顯示編號(hào)”能夠幫助你點(diǎn)擊不知道名字的按鈕或鏈接

  現(xiàn)在,你所需要做的就是說出你想要點(diǎn)擊的按鈕的編號(hào)。之后,一個(gè)“確定”就會(huì)出現(xiàn)在對(duì)應(yīng)的元素上。說“確定”,你就點(diǎn)擊了這個(gè)按鈕。

獲得幫助

  如果你不明白一些事要如何操作,你可以通過說“我能說什么”來使用幫助。在使用“我能說什么”命令之后,Windows的幫助和支持就會(huì)彈出,你可以在里面尋找你所需要的幫助信息。

圖9 你可以通過說“我能說什么”打開幫助獲得相關(guān)信息

聽寫文本

  你可以在任何可以使用語音的應(yīng)用程序中通過聽寫輸入文本。你不會(huì)像過去那樣,只能在微軟的Office應(yīng)用程序中才能夠使用。例如,你可以在記事本或是寫字板中聽寫文本。

  在默認(rèn)情況下,我無法在Open Office和其它非微軟的程序中聽寫文本,但我可以通過語音關(guān)聯(lián)菜單中的“選項(xiàng)|在所有位置啟用聽寫”,這樣就能夠在那些不是自動(dòng)接受聽寫的程序中聽寫輸入文本,這樣我就能夠在Open Office中進(jìn)行聽寫輸入了。然而,它工作起來的效果就不如在微軟的程序中所使用的效果。它不能在我說的時(shí)候馬上輸入文本,它會(huì)彈出一些可選的提示讓我選擇。使用語音API,開發(fā)者能夠讓他們的應(yīng)用程序可以使用語音,而更多的可能在將來就能夠使用。

小貼士:

  當(dāng)你在聽寫的時(shí)候,Vista會(huì)將你所說的所有東西輸入文檔。這也許會(huì)造成一些不便,如果當(dāng)你在編輯文檔時(shí),有一會(huì)兒可能聽下來去與同事談話,之后你可能會(huì)發(fā)現(xiàn)你的談話內(nèi)容也輸入了文檔。當(dāng)你希望有些話語不被轉(zhuǎn)譯到文檔中時(shí),你可以先說“停止聆聽”,再開始說其它內(nèi)容。

  Vista在轉(zhuǎn)譯你的聽寫時(shí)很可能會(huì)產(chǎn)生錯(cuò)誤。而只得慶幸的是它們能夠很容易地得到糾正。例如,如果你說“我現(xiàn)在能說任何”,而Vista輸入的是“我不能說任何”,這時(shí)你可以說“更正不能”,接著你就會(huì)看到一個(gè)清單,里面列有可替換的詞,如圖10所示。

圖10 你只需要在列表中選擇替換詞語進(jìn)行錯(cuò)誤更正

  如果你要更正的錯(cuò)誤不再列表中,只需要再次說出詞語,就會(huì)有新的列表出現(xiàn)在其中供你選擇。當(dāng)你想輸入英文時(shí),它可能會(huì)不能識(shí)別,你可以說“拼寫”來將英文單詞拼寫出來。

圖11 你可以通過“拼寫”輸入英文單詞

高級(jí)配置設(shè)置

  你可以通過點(diǎn)擊語音識(shí)別選項(xiàng)對(duì)話框左邊窗格中的“高級(jí)語音選項(xiàng)”鏈接來訪問一些高級(jí)的配置設(shè)置,如圖12所示。

圖12 你可以在此設(shè)置高級(jí)配置選項(xiàng)并進(jìn)行用戶設(shè)置

  在此,你可以創(chuàng)建并進(jìn)行用戶設(shè)置。這當(dāng)你的計(jì)算機(jī)不止一人使用時(shí)就顯得特別有用。你可以選擇是否在啟動(dòng)時(shí)就運(yùn)行語音識(shí)別,以及是否允許計(jì)算機(jī)檢查文檔和郵件,以提高語音識(shí)別的準(zhǔn)確性。

  此外,你還可以選擇在標(biāo)點(diǎn)符號(hào)后插入的空格數(shù),并調(diào)節(jié)麥克風(fēng)的等級(jí)。

語音識(shí)別的局限性

  在對(duì)語音識(shí)別進(jìn)行了一個(gè)半小時(shí)的訓(xùn)練后,我感受到了Vista準(zhǔn)確的語音識(shí)別所帶來的輕松使用的感受。之前我也試用過一些聽寫程序,但都沒有發(fā)現(xiàn)它們具有足夠的實(shí)用性,我使用鍵盤輸入總是要比聽寫出正確的文本要快的多。但現(xiàn)在我的感受就是,如果我失去了雙手,還是有辦法能夠讓我的工作繼續(xù)得以完成。對(duì)于我來說,語音識(shí)別結(jié)合鍵盤輸入就能達(dá)到完美的工作效果。

  然而,我是在一臺(tái)具有Core Duo processor和2GB內(nèi)存的計(jì)算機(jī)上使用Vista,我不敢保證如果在性能稍遜一些的計(jì)算機(jī)上使用時(shí)它能有多迅速。我一直使用的也是最上乘的麥克風(fēng)。之前我提到過,在我的體驗(yàn)中,使用桌面式的麥克風(fēng)是不能很好地完成工作的。使用你自己的聲音進(jìn)行一些訓(xùn)練也能夠帶來不同的效果。

  顯然,語音識(shí)別是不能在嘈雜的環(huán)境下很好地工作的,比如你身在一個(gè)與其他人公用的辦公室中,而其他人在你工作的時(shí)候打電話。另外,當(dāng)你在聽音樂或廣播時(shí),它也無法良好地工作。

安全問題

  在你決定一直都對(duì)著你的計(jì)算機(jī)說話的時(shí)候,請(qǐng)意識(shí)到使用語音識(shí)別會(huì)存在一個(gè)安全問題。攻擊者可能將一個(gè)聲音文件植入,當(dāng)你瀏覽網(wǎng)頁時(shí)能夠自動(dòng)播放,或使用電子郵件將聲音文件發(fā)送給你,當(dāng)你雙擊時(shí)它就會(huì)自動(dòng)播放。如果所播放的聲音文件傳入你的麥克風(fēng),而它又是Vista的語音引擎能夠識(shí)別的命令,那么語音識(shí)別就會(huì)將它運(yùn)行,計(jì)算機(jī)就會(huì)執(zhí)行這個(gè)命令。

  但這并不需要引起太大的恐慌。因?yàn)樵赩ista中要以管理員身份執(zhí)行大多數(shù)命令的時(shí)候,你都需要回應(yīng)用戶帳戶控制的提示,而這是不能通過聲音來做到的。但是,攻擊者還是有可能使用這種方法刪除你計(jì)算機(jī)上的文件。

  當(dāng)語音識(shí)別處在休眠模式下時(shí),它僅會(huì)對(duì)“開始聆聽”命令做出反應(yīng),但攻擊者很容易就能將這個(gè)詞組當(dāng)成一個(gè)聲音文件。因此,當(dāng)你不使用它時(shí),你應(yīng)該習(xí)慣地將語音識(shí)別完全關(guān)閉,而不是僅讓它處在休眠模式,并且不要設(shè)置它在Windows啟動(dòng)時(shí)隨之運(yùn)行。

www.17tech.com



相關(guān)鏈接:
微軟國內(nèi)首推Push mail 酷派3G產(chǎn)品率先支持 2009-09-28
鮑爾默:我們搞砸了Windows Mobile 7 2009-09-25
微軟全球基礎(chǔ)服務(wù)部門副總裁離職加盟思科 2009-09-24
微軟推最新手機(jī)操作系統(tǒng)WindowsMobile6.5 2009-09-04
微軟Windows Mobile 6.5系統(tǒng)手機(jī)10月上市 2009-09-02

分類信息:        
巴彦县| 舟山市| 塘沽区| 龙门县| 大悟县| 五河县| 秦安县| 宣汉县| 延津县| 克拉玛依市| 合川市| 汶上县| 灵璧县| 淳化县| 龙口市| 视频| 衡阳市| 虹口区| 浑源县| 莒南县| 周口市| 东山县| 当阳市| 象山县| 江都市| 德清县| 榆树市| 苏州市| 西藏| 锡林郭勒盟| 惠来县| 平南县| 清原| 曲麻莱县| 南昌县| 忻州市| 贵定县| 岳普湖县| 南涧| 文成县| 时尚|