中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

中科信利

中科信利關鍵詞識別引擎

2016-05-24 16:19:38   作者:   來源:CTI論壇   評論:0 點擊:


  在某些特定情況下,我們并不關心說話者所說的每一句話,只是想了解個大概的主題,這時關鍵詞檢測系統(tǒng)是理想的選擇。關鍵詞檢測是語音識別技術的一個重要分支,其目的就是在連續(xù)語音流中檢測是否存在某些感興趣的關鍵詞。
  在關鍵詞檢測的很多實際應用中,輸入的信號是各種信道的自然對話語音數(shù)據(jù)。一般來說,由于聲學模型和語音數(shù)據(jù)的不匹配,關鍵詞檢測的性能會急劇地下降。為了解決這個問題,中科信利研發(fā)的關鍵詞檢測系統(tǒng)采用了一種基于混淆網(wǎng)絡的搜索策略。與以往不同的是,解碼是在整個聲學空間上進行的,而不僅僅是關鍵詞所構成的聲學空間,解碼器輸出不僅是首選結果,而是一種混淆網(wǎng)絡的數(shù)據(jù)結構。通過統(tǒng)計訓練數(shù)據(jù)中的發(fā)音變異情況,我們得到音素間的混淆度。利用這種音素間的混淆度和關鍵詞列表,我們就可以從解碼器輸出的混淆網(wǎng)絡中搜索獲取最有可能出現(xiàn)的關鍵詞。這種方法大大提高了關鍵詞的識別率,但同時也引入了一定的虛警。最后,我們采用了可靠的置信度策略來有效地降低了虛警。
  體系框架:
  功能模塊:
  語音識別模塊
  首先,輸入的實時語音流或語音文檔,經(jīng)過語音分段模塊處理后,產(chǎn)生分段信息和語音片斷;其次,各語音片斷經(jīng)連續(xù)語音識別引擎進行識別產(chǎn)生網(wǎng)格結構;最后,網(wǎng)格結構經(jīng)分解對齊后產(chǎn)生音節(jié)混淆網(wǎng)絡。
  索引模塊
  分段信息和音節(jié)混淆網(wǎng)絡通過前向索引產(chǎn)生前向索引文件。前向索引文件再經(jīng)逆向索引產(chǎn)生逆向索引文件。采用逆向索引的數(shù)據(jù)結構,是為了方便和減速后續(xù)的搜索過程。
  檢索模塊
  給定的關鍵詞首先通過字音轉換產(chǎn)生音節(jié)序列,再通過應用音節(jié)混淆矩陣,采用中科信利在國際上首次提出的基于混淆網(wǎng)絡和模糊動態(tài)規(guī)劃的關鍵詞檢索策略,在逆向索引文件中進行快速模糊匹配,產(chǎn)生候選關鍵詞列表。
  技術特點:
  • 關鍵詞檢測引擎與說話人無關。支持自然對話語音(如:電話聊天,廣播電視訪談等)。
  • 支持電話信道、廣播電視信道、互聯(lián)網(wǎng)信道等各類信道數(shù)據(jù)。
  • 關鍵詞列表可由用戶自主定義和修改。
  • 檢測結果不但包含關鍵詞在語音流或音頻文件中出現(xiàn)的位置,還包括相應的置信度得分。
  • 操作點調(diào)整方便,可按不同的應用需求調(diào)整操作點閾值,使系統(tǒng)性能根據(jù)應用需求達到最優(yōu)。
  • 引擎處理速度快,核心算法支持海量并行處理。適應于大規(guī)模語音數(shù)據(jù)的自動檢測。
  • 引擎函數(shù)接口簡單,用戶可以方便靈活地應用開發(fā)。
  性能指標:
  應用范圍:
  中科信利的關鍵詞檢測系統(tǒng),居于國內(nèi)領先、國際先進水平。目前已在國內(nèi)電信、安全、廣電等多個行業(yè)領域中得到成功應用。
  關鍵詞檢測的主要應用領域大概有以下兩個方面:一是國家的信息安全領域。主要是用來對敏感語音信號的監(jiān)測,一旦發(fā)現(xiàn)敏感關鍵詞可以立刻報警。二是多媒體檢索領域。采用關鍵詞檢測技術,可以利用文字檢測出感興趣的音視頻流。

相關熱詞搜索: 中科信利 關鍵詞識別

上一篇:中科信利靜音檢測引擎

下一篇:最后一頁

相關閱讀:

分享到: 收藏

最新新聞

柳州市| 海淀区| 衡山县| 福鼎市| 泉州市| 正宁县| 文化| 太保市| 茌平县| 新田县| 宜良县| 宁波市| 望都县| 福建省| 孟州市| 靖州| 南漳县| 陇西县| 河津市| 瑞丽市| 都兰县| 剑河县| 章丘市| 兴文县| 清河县| 三原县| 汉中市| 盖州市| 台北市| 芮城县| 桂东县| 白山市| 郓城县| 湘阴县| 肇州县| 东方市| 同心县| 中卫市| 大连市| 安远县| 武胜县|