國(guó)際領(lǐng)先的“得意”聲紋識(shí)別引擎
2005/07/20
得意公司的聲紋識(shí)別引擎(d-Ear VPR)包括聲紋辨認(rèn)版本和聲紋確認(rèn)版本,可以是文本無(wú)關(guān)的,也可以是文本相關(guān)的,而且均支持開(kāi)集的識(shí)別方式。其中文本無(wú)關(guān)的版本同時(shí)具有文本和語(yǔ)言的無(wú)關(guān)性,對(duì)語(yǔ)音長(zhǎng)度的要求也非常低,通常訓(xùn)練只需要幾十秒有效語(yǔ)音,而識(shí)別階段只需幾秒鐘的有效語(yǔ)音即可。有很高的識(shí)別精度,也可以靈活地調(diào)整操作點(diǎn)參數(shù)從而適應(yīng)于不同應(yīng)用的需求。
"得意"聲紋識(shí)別技術(shù)與其他聲紋識(shí)別技術(shù)的比較
得意聲紋識(shí)別技術(shù)
|
其他聲紋識(shí)別技術(shù)
|
|
1 | 具文本無(wú)關(guān)性,確保了身份確認(rèn)的安全性和用戶(hù)的方便性 對(duì)聲紋的識(shí)別與所說(shuō)的文本和語(yǔ)言無(wú)關(guān),用戶(hù)訓(xùn)練系統(tǒng)和系統(tǒng)對(duì)用戶(hù)的聲音進(jìn)行鑒別和確認(rèn),可以是完全不同的文本,完全不同的語(yǔ)言。比如,在用戶(hù)在系統(tǒng)注冊(cè)聲音時(shí),可以使用中文說(shuō)一段文學(xué)章節(jié),而識(shí)別時(shí)用戶(hù)可以用英文談?wù)撚?jì)算機(jī)的發(fā)展方向。 |
與文本相關(guān),安全性和使用方便性都顯不足 對(duì)聲紋的識(shí)別與所說(shuō)的文本和語(yǔ)言相關(guān),用戶(hù)訓(xùn)練系統(tǒng)和系統(tǒng)對(duì)用戶(hù)的聲音進(jìn)行鑒別和確認(rèn),必須是完全一致的文本,使用相同的語(yǔ)言,容易導(dǎo)致口令的外泄。 |
2 | 對(duì)語(yǔ)音長(zhǎng)度沒(méi)有特殊要求,方便實(shí)際的應(yīng)用 使用時(shí)的測(cè)試語(yǔ)音2-4 秒,并可不斷累積調(diào)整聲紋模型精度;用戶(hù)訓(xùn)練系統(tǒng),讓其記住其聲紋,只需要幾秒種的聲音;而在識(shí)別時(shí),系統(tǒng)只要獲得被測(cè)試人幾秒的聲音,就可以進(jìn)行聲紋識(shí)別。 |
要求進(jìn)行特定的語(yǔ)音訓(xùn)練,用戶(hù)需跟著朗讀和學(xué)習(xí),方便性和實(shí)用性不強(qiáng) |
3 | 很高的精度 得意的技術(shù)辨認(rèn)和確認(rèn)準(zhǔn)確度都很高,說(shuō)話(huà)人辨認(rèn)的正確率不小于99%;說(shuō)話(huà)人確認(rèn)的誤識(shí)率和誤拒率均低于1% |
精度一般 識(shí)別精度約為90%,誤識(shí)率和誤拒率相對(duì)較高 |
4 | 操作點(diǎn)調(diào)整方便 可根據(jù)實(shí)際情況和環(huán)境,按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值,使最終準(zhǔn)確率達(dá)到最高或使錯(cuò)誤率降到最低。 |
沒(méi)有操作點(diǎn)調(diào)整功能 不同用戶(hù)和不同的環(huán)境使用只能使用同一模型,不能確保高的安全性和準(zhǔn)確率 |
5 | 聲紋模型存儲(chǔ)空間小 每個(gè)人的聲紋模型存儲(chǔ)空間小于5KB,能可靠地存儲(chǔ)于加密鑰匙內(nèi),與硬件緊密結(jié)合能最高程度地保證系統(tǒng)的安全性,防止非法的攻擊和竊取 |
聲紋模型存儲(chǔ)空間小 不能存儲(chǔ)于加密鑰匙內(nèi),沒(méi)有硬件的保護(hù),不能有效防止非法的攻擊和竊取 |
得意音通公司供稿 CTI論壇編輯