首頁>>廠商>>語音識別與合成>>科大訊飛

多語種語音合成助力數(shù)字奧運

2003/12/01

  為進一步提高語音合成的自然度、人性化等指標,科大訊飛在國家“863”計劃支持下,承擔了面向奧運的多語言信息服務系統(tǒng)中的重要課題——“面向奧運的多語種語音合成研究”項目,這一項目的承擔將使語音合成技術更適用于奧運環(huán)境的應用。該項目大部分研發(fā)任務已經完成,目前已經處于項目的最后攻堅階段,該項目的主要研發(fā)重點分為以下幾個方面:

  1.對于語音合成引擎的應用程序接口和輸入輸出以及中間數(shù)據(jù)格式上,將提供一種跨平臺的服務提供機制和具有良好擴展性的中間數(shù)據(jù)描述語言規(guī)范,使得遵循此規(guī)范的客戶應用可以有效地在不同平臺上使用語音合成服務。

  2.科大訊飛利用自己在多語種語音合成研究領域的優(yōu)勢,繼續(xù)推進具有高穩(wěn)定、高性能、高質量的多語種和混合語種合成引擎,使得語音合成服務可以滿足中(含粵語)、英、日等不同語種的應用要求,另外針對奧運應用進行了優(yōu)化,使在某些奧運應用領域可以達到完全和人語音相媲美的語音合成效果。

  3.科大訊飛在嵌入式環(huán)境下的語音合成技術取得突破,在小存儲空間和計算資源需求下,可以實現(xiàn)比較高質量的合成語音。另外采用的分布式語音合成技術有機消除了語音合成中由于資源存儲的限制而產生的對語音效果的影響。這就為語音合成的實際應用環(huán)境提供了多種可選的模式,使得在不同應用模式下都可以得到比較理想的語音合成服務。

  4.對于語音應用平臺,智能服務接入技術、可擴展的標準數(shù)據(jù)交互技術的應用可以使用戶專注于服務的結果上而不是如何去獲取服務。另外大規(guī)模集群服務技術的采用,使超大規(guī)模應用和吞吐量的語音應用成為可能,有效解決了企業(yè)或電信級應用中由于多路并發(fā)以及大數(shù)據(jù)量交換產生的問題。

  在語音合成的下一步研究中,除了上述目標外,語音合成中的人性化研究是個重點研發(fā)目標。目前的語音合成系統(tǒng)雖然可以得到比較高自然度的合成語音,但是生成語音的風格比較單一。下一步的工作重點在于:在強大自然語言處理能力的指導下,能夠根據(jù)當前文本的特點,使用與之相適合的風格以及語氣語調來完成文本到語音的轉換。

  另外,文本分析器可以按照當前文本的內容,給出文章中的重點段落、句子以及其它文本片斷,即信息的焦點。這樣,用戶在使用語音合成服務時,不但能享受到高品質的合成語音服務,而且可以更容易地使用這種服務來獲取所需的信息。另外聲音特征的轉換也是研究重點之一,用戶可以用自己需要或是喜愛的聲音特征作為目標,根據(jù)這種聲音特征提供少量的聲音樣本,就可以使用語音合成服務中的相關智能工具,通過自適應的訓練,使得合成的語音可以基本無損傷地轉變?yōu)橛脩羲谕哪繕苏Z音。


多語種語音合成示意圖

科大訊飛供稿 原文刊登于塞迪網(wǎng)



相關鏈接:
訊飛暢言語音教具系統(tǒng)榮獲“創(chuàng)新軟件產品” 2009-09-08
科大訊飛嵌入式語音新產品發(fā)布會在深圳舉行 2009-09-07
“會說話”的顯示屏提升居民小區(qū)信息服務水平 2009-09-07
訊飛語音助力太平人壽客服中心 2009-08-28
訊飛語音助力CDMA手機競爭終端市場 2009-08-14

分類信息:  語音合成TTS_與_語音識別ASR     熱點專題_2008北京奧運會_文摘   新聞頻道   技術_語音合成_新聞   技術_語音識別_新聞
         
涪陵区| 陕西省| 通山县| 万山特区| 斗六市| 含山县| 安多县| 偏关县| 阳高县| 沛县| 凉山| 玉门市| 新平| 巴南区| 花垣县| 民县| 怀远县| 南昌市| 瓮安县| 祁门县| 偃师市| 邵东县| 手游| 广东省| 彰化市| 含山县| 长泰县| 廊坊市| 电白县| 柏乡县| 建始县| 荣昌县| 屏东市| 武城县| 庆城县| 长治县| 曲松县| 张家港市| 石渠县| 巍山| 乐业县|