中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當前的位置是:  首頁 > 資訊 > 國內(nèi) >
 首頁 > 資訊 > 國內(nèi) >

標貝科技語音庫|模仿童聲、中文女聲情感數(shù)據(jù)庫

--分為喜、怒、哀、驚、懼、厭六種情感的表達

2020-04-24 10:45:51   作者:   來源:CTI論壇   評論:0  點擊:


  語音合成技術的推廣應用,對語音合成的質(zhì)量提出了更高的要求。如何進一步提高語音合成的表現(xiàn)力,特別是讓合成語音能夠模擬表達說話人的情感狀態(tài),是語音合成未來發(fā)展的趨勢,也是語音合成研究領域所面臨的一個難題。而情感語音庫是語音合成技術的基礎,也是決定語音合成效果的關鍵因素。
(點擊試聽情感效果)
  模仿童聲—情感音庫
  【模仿童聲DB-6-情感音庫】采集對象為標準普通話女聲模仿兒童,聽感活潑甜美。分為喜、怒、哀、驚、懼、厭六種情感的表達。錄制環(huán)境為專業(yè)錄音室和錄音軟件,錄音環(huán)境和設備自始至終保持不變,錄音環(huán)境的信噪比不低于35dB;單聲道錄音,用48KHz16比特采樣頻率、PCMWAV格式。錄音語料為中文,利于各情感的表達,并對音節(jié)、音子、韻律等在有限語料基礎上做了盡可能全面的覆蓋。根據(jù)合成語音標注標準,依據(jù)發(fā)音人實際發(fā)音對音庫進行文本音字校對、韻律層級標注。
 。c擊試聽情感效果)
  數(shù)據(jù)應用場景
  本語音數(shù)據(jù)庫應用廣泛,可用于以下方面:
  1.科研,可用于語音合成系統(tǒng)模型訓練;
  2.有聲讀物;
  3.生活出行;
  3.智能科技;
  4.教育、娛樂等。
  技術參數(shù)

數(shù)據(jù)規(guī)格

數(shù)據(jù)內(nèi)容

中文女聲DB-6情感音庫數(shù)據(jù)

錄音語料

6種情感各2000句語料(喜、怒、哀、驚、懼、厭)

有效時長

14成品小時(12000句)

平均字數(shù)

15/

語言類型

標準普通話

發(fā)音人

女;20-30歲;聲音溫柔親切

錄音環(huán)境

聲音采集環(huán)境為專業(yè)錄音棚環(huán)境

1)        錄音棚符合專業(yè)音庫錄制標準;

2)        錄音環(huán)境和設備自始至終保持不變;

3)        錄音環(huán)境的信噪比不低于35dB

錄制工具

專業(yè)錄音設備及錄音軟件

采樣格式

無壓縮PCM WAV格式,采樣率為48KHz、16bit。

標注內(nèi)容

中文音字標注、韻律標注、聲韻母邊界標注

標注格式

文本標注為.txt格式文檔;邊界標注為.interval格式文檔

質(zhì)量標準

1. 語音文件為48k 16bit wav格式,音色、音量、語速一致,無截幅;

2.標注文件字準率不低于99.8%;

3.韻律無明顯不合理標注錯誤;

4.音素邊界錯誤大于10ms的比例小于1%;音節(jié)邊界準確率大于98%.

存儲方式

本地FTP存儲

文件格式

音頻文件:WAV 文本標注文件:TXT 邊界標注文件:INTERVAL

數(shù)據(jù)脫敏

數(shù)據(jù)敏感項

產(chǎn)品應用

適用領域

科研、智能科技、生活、教育、娛樂等多領域應用

版權歸屬

版權所有者

標貝(北京)科技有限公司

  中文女聲—情感音庫
  【中文女聲DB-6情感音庫】采集對象為標準普通話女聲,分為喜、怒、哀、驚、懼、厭六種情感的表達。錄制環(huán)境為專業(yè)錄音室和錄音軟件,錄音環(huán)境和設備自始至終保持不變,錄音環(huán)境的信噪比不低于35dB;單聲道錄音,用48KHz16比特采樣頻率、PCMWAV格式。錄音語料為中文,利于各情感的表達,并對音節(jié)、音子、韻律等在有限語料基礎上做了盡可能全面的覆蓋。根據(jù)合成語音標注標準,依據(jù)發(fā)音人實際發(fā)音對音庫進行文本音字校對、韻律層級標注、聲韻母邊界標注。
(點擊試聽情感效果)
  數(shù)據(jù)應用場景
  本語音數(shù)據(jù)庫應用廣泛,可用于以下方面:
  1.科研,可用于語音合成系統(tǒng)模型訓練;
  2.有聲讀物;
  3.生活出行;
  3.智能科技;
  4.教育、娛樂等。
  技術參數(shù)

數(shù)據(jù)規(guī)格

數(shù)據(jù)內(nèi)容

模仿童聲DB-6情感音庫數(shù)據(jù)

錄音語料

6種情感各2000句語料

有效時長

14成品小時(12000句)

平均字數(shù)

15/

語言類型

標準普通話

發(fā)音人

女聲模仿兒童,活潑甜美風格

錄音環(huán)境

聲音采集環(huán)境為專業(yè)錄音棚環(huán)境

1)        錄音棚符合專業(yè)音庫錄制標準;

2)        錄音環(huán)境和設備自始至終保持不變;

3)        錄音環(huán)境的信噪比不低于35dB。

錄制工具

專業(yè)錄音設備及錄音軟件

采樣格式

無壓縮PCM WAV格式,采樣率為48KHz、16bit。

標注內(nèi)容

中文音字標注、韻律標注

標注格式

文本標注為.txt格式文檔

質(zhì)量標準

1.語音文件為48k 16bit wav格式,音色、音量、語速一致,無截幅;

2.標注文件字準率不低于99.8%

3.韻律無明顯不合理標注錯誤。

存儲方式

本地FTP存儲

文件格式

音頻文件:WAV 文本標注文件:TXT

數(shù)據(jù)脫敏

數(shù)據(jù)敏感項

產(chǎn)品應用

適用領域

科研、智能科技、生活、教育、娛樂等多領域應用

版權歸屬

版權所有者

標貝(北京)科技有限公司

 

【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)

中宁县| 南部县| 沐川县| 天津市| 调兵山市| 清水河县| 林州市| 民勤县| 普兰店市| 大邑县| 四会市| 乡城县| 惠来县| 德安县| 同江市| 满城县| 汕尾市| 烟台市| 随州市| 龙陵县| 宜兴市| 南投市| 巧家县| 石首市| 博乐市| 西丰县| 法库县| 福海县| 甘泉县| 锦州市| 谷城县| 莱阳市| 东阳市| 四川省| 渑池县| 女性| 惠安县| 沂源县| 修武县| 措勤县| 湛江市|