聲網(wǎng)Agora：游戲的語(yǔ)音通話解決方案

2016-06-27 16:22:27 作者：來(lái)源：CTI論壇評(píng)論：0 　點(diǎn)擊cti：

　　隨著手機(jī)性能的提高，手游開(kāi)始向復(fù)雜化發(fā)展。不再是以消消樂(lè)這種簡(jiǎn)單的小游戲?yàn)橹�，RPG、實(shí)時(shí)對(duì)戰(zhàn)類(lèi)游戲開(kāi)始變火。

　　這種游戲，由于有玩家間的交互，有團(tuán)隊(duì)作戰(zhàn)、配合，保證玩家能夠進(jìn)行實(shí)時(shí)語(yǔ)音通話，成為極大的需求。

　　本文將說(shuō)明游戲語(yǔ)音通話的難點(diǎn)在哪？

　　現(xiàn)在的游戲語(yǔ)音通話解決方案存在什么問(wèn)題？

　　目前有兩種解決方案：

　　1、第三方通話APP

　　這種方案，第三方的APP獨(dú)立在后臺(tái)運(yùn)行，比如YY語(yǔ)音手機(jī)版。這種方案存在兩個(gè)問(wèn)題：

音效和語(yǔ)音的音量無(wú)法控制在一個(gè)合理比例，無(wú)法統(tǒng)一調(diào)節(jié)；
APP在后臺(tái)運(yùn)行，會(huì)自己關(guān)閉，或者掉線。
對(duì)手機(jī)性能要求很高，容易增加耗電量，造成手機(jī)發(fā)燙。

　　2、集成在游戲APP里的語(yǔ)音功能。

　　這種方案存在的問(wèn)題是：

　　由于適配問(wèn)題，安卓機(jī)型上游戲音效會(huì)被對(duì)方聽(tīng)到，或者說(shuō)話會(huì)有回聲。

　　游戲語(yǔ)音通話方案最注重什么？

　　1、游戲玩家最關(guān)心游戲語(yǔ)音的實(shí)時(shí)性。

　　高對(duì)戰(zhàn)游戲處處要求快，要求低延時(shí)。網(wǎng)游中，團(tuán)隊(duì)下副本，最影響團(tuán)隊(duì)成功率的就是加血的角色。一旦這個(gè)人加血加慢了，導(dǎo)致一個(gè)人犧牲。在激烈的時(shí)候，損失一個(gè)人的代價(jià)基本就宣判團(tuán)隊(duì)的死刑。

　　從技術(shù)的角度而言，要求的不是加血快，是加血的流程快。我們之前和強(qiáng)大的競(jìng)爭(zhēng)對(duì)手競(jìng)爭(zhēng)PC上游戲通信軟件地位的時(shí)候，是什么案例讓我們活下來(lái)，就是一個(gè)加血的案例。我們用對(duì)手的軟件，隊(duì)友說(shuō)，加血，加血。結(jié)果等了1s~2s才傳到保姆那里�？上攵�，血還沒(méi)加，就掛了。而用我們的軟件，加血成功的概率提高了幾倍幾十倍。就算跨國(guó)玩游戲，我們延時(shí)也不過(guò)百毫秒。所以當(dāng)時(shí)，玩家像愛(ài)惜槍一樣愛(ài)惜、使用我們的軟件。

　　2、游戲廠商最關(guān)心的是占用系統(tǒng)資源量和耗電量

　　游戲廠商如果選擇語(yǔ)音通話SDK集成方案，那么SDK占用系統(tǒng)資源量和耗電量會(huì)起到很大的影響因素。SDK編解碼器、前后端處理性能差，造成手機(jī)CPU、內(nèi)存吃緊，會(huì)影響游戲體驗(yàn)，游戲卡，讓手機(jī)發(fā)燙，導(dǎo)致手機(jī)耗電量增加。這對(duì)一個(gè)游戲來(lái)說(shuō)，是致命的硬傷。

　　這些恰恰是聲網(wǎng)Agora音視頻引擎通過(guò)多年研發(fā)和技術(shù)積累能給大家提供的技術(shù)特性和產(chǎn)品特性。聲網(wǎng)Agora。io實(shí)時(shí)云技術(shù)團(tuán)隊(duì)，曾經(jīng)提供10億分鐘每天的運(yùn)營(yíng)支撐，最多180w人同時(shí)在一個(gè)頻道內(nèi)實(shí)時(shí)視頻直播服務(wù)。并且可以提供多聲道甚至帶有垂直聲道的音頻音效系統(tǒng)。并提供“軍用”級(jí)的低延時(shí)傳輸系統(tǒng)。通過(guò)這些來(lái)助力VR游戲?qū)崿F(xiàn)通信和直播的業(yè)務(wù)需求。

　　接下來(lái)，就以聲網(wǎng)Agora.io的語(yǔ)音通話SDK為例，說(shuō)明SDK解決方案如何解決這些問(wèn)題。

　　聲網(wǎng)Agora.io是如何做的

　　通常整套的實(shí)時(shí)云通信系統(tǒng)概述下來(lái)包括后臺(tái)技術(shù)、客戶端技術(shù)和運(yùn)維技術(shù)等等。

　　全高清音頻通信系統(tǒng)，首先要怎么搭建這樣一個(gè)系統(tǒng)，通常搭建一個(gè)最小音頻子系統(tǒng)分成下面幾個(gè)步驟：

　　1、采集播放。如果把采集的數(shù)據(jù)存成文件，或是交給播放，就形成一個(gè)閉環(huán)，我稱(chēng)他為第一閉環(huán)，也可以稱(chēng)為ADM（audio device module）。

　　2、編碼解碼。只有采集播放還不夠，數(shù)據(jù)量太大，還要加上編碼解碼，進(jìn)行數(shù)據(jù)壓縮，采集壓縮后的數(shù)據(jù)再解壓縮播放，我稱(chēng)他為第二閉環(huán)，加上的這個(gè)編解碼模塊叫作ACM（audio coding module）。

　　3、網(wǎng)絡(luò)模塊。實(shí)現(xiàn)網(wǎng)絡(luò)發(fā)送接收，ANM（audio network module），我叫他第三閉環(huán)。

　　4、前后處理模塊。也就是第四閉環(huán)，Audio Processing module。這個(gè)模塊主要實(shí)現(xiàn)3A引擎：回聲消除AEC，增益控制AGC，噪聲抑制ANS。

　　1.回聲消除

　　AEC是3A引擎的一部分，是很重要的一部分，為什么第一個(gè)問(wèn)題就是它。因?yàn)槟闷痣娫�，除非你打不通，打通了，不管質(zhì)量怎么樣，聲音一出來(lái)就是回聲，我在音頻行業(yè)做了11年，說(shuō)長(zhǎng)不長(zhǎng)說(shuō)短不短，深知國(guó)內(nèi)公司做音頻通常有個(gè)一很好的標(biāo)準(zhǔn)，“出聲就行”。但是沒(méi)有回聲消除，你出聲就是噪聲，最基本的底線都滿足不了。

　　那么，是什么問(wèn)題困擾我們這么久，它就是回聲，準(zhǔn)確說(shuō)是聲學(xué)回聲。自己的聲音傳到遠(yuǎn)端再通過(guò)遠(yuǎn)端的麥克風(fēng)錄音傳回來(lái)，就是回聲。回聲從信號(hào)特性上看，有線性部分和非線性部分。回聲消除就是要通過(guò)信號(hào)處理算法消除這些回聲，消除回聲的線性部分和非線性部分。有電話的年頭就有回聲，早期是線路回聲，都是線性的，很好處理，一個(gè)自適應(yīng)濾波器，搞定了。

　　回聲消除的算法算算也有幾十年了，為什么今天還要研究？不是搞定了嗎，一個(gè)自適應(yīng)濾波就搞定了。不是的，回聲問(wèn)題和設(shè)備緊密相關(guān)。一個(gè)回聲消除算法的設(shè)計(jì)實(shí)現(xiàn)和其他算法設(shè)計(jì)實(shí)現(xiàn)有很大的區(qū)別，因?yàn)樗驮O(shè)備緊密相關(guān)，和系統(tǒng)狀態(tài)緊密相關(guān)。早期，GIPS和某些AEC算法提供公司，通常設(shè)計(jì)AEC模塊的時(shí)候，都是給固定電話和移動(dòng)電話設(shè)備設(shè)計(jì)，是給定的一款設(shè)備，也就是說(shuō)，芯片廠商設(shè)計(jì)公版硬件，找合作伙伴或是自己設(shè)計(jì)AEC模塊，然后針對(duì)該款設(shè)備調(diào)試AEC參數(shù)，調(diào)好之后就不變了，以后所有該款設(shè)備的出貨都用這組參數(shù)，一旦換了設(shè)備，軟件要重新調(diào)。當(dāng)初GIPS，SpritDSP就是做這些事情的公司。如果有人參與過(guò)手機(jī)出廠的回聲消除設(shè)計(jì)，你就知道每款手機(jī)的回聲消除參數(shù)都不同。

　　那么為什么回聲消除為什么和手機(jī)設(shè)備關(guān)系這么大呢？是信號(hào)特性決定的，回聲是聲音經(jīng)過(guò)揚(yáng)聲器傳導(dǎo)到mic，經(jīng)過(guò)了多少路徑就被處理多少次。通常手機(jī)由于聲腔的原因，沒(méi)辦法設(shè)計(jì)的音量很大所以當(dāng)你放大音量的時(shí)候，如果是10格調(diào)整的音量放大器，前5格還是線性放大，5格以上就是非線性放大，這是揚(yáng)聲器第一級(jí)處理。

　　聲音從外部傳給mic，經(jīng)過(guò)空氣和手機(jī)殼，設(shè)備殼的特性的傳導(dǎo)作用產(chǎn)生第二級(jí)的非線性影響。不同的手機(jī)殼，鐵殼，塑料殼，甚至手機(jī)殼發(fā)熱導(dǎo)致聲傳導(dǎo)特性不一樣，都會(huì)影響聲音傳導(dǎo)的處理，導(dǎo)致回聲消除算法不一樣。我曾經(jīng)遇到過(guò)，一套收回聲消除算法，換不換殼，就能決定算法工不工作。這是手機(jī)。

　　還有pc，如果pc外接音箱，音箱一般多少都會(huì)自帶功放，又是非線性放大。設(shè)備mic的位置也緊密相關(guān)，早期有一款thinkpad，mic和speaker離的非常近，極其難處理。談來(lái)談去，好像都是非線性放大的問(wèn)題嘛，是的，線性的東西是科學(xué)，非線性的東西是藝術(shù)�？梢哉f(shuō)，設(shè)備的差異性導(dǎo)致非線性問(wèn)題，非線性信號(hào)的處理是回聲消除技術(shù)的第一個(gè)攔路虎。

　　非線性回聲問(wèn)題是不是全部呢？不是的�；芈曄撕驮O(shè)備有關(guān)，還和系統(tǒng)有關(guān)和系統(tǒng)有什么關(guān)系，回聲消除兩大模塊，自適應(yīng)濾波和非線性處理，一個(gè)是線性處理，一個(gè)是非線性處理。上一段說(shuō)了非線性處理，線性處理部分還有問(wèn)題，自適應(yīng)濾波前置第一個(gè)模塊就是延時(shí)搜索，其實(shí)WebRtc本身的延時(shí)搜索技術(shù)是非常先進(jìn)的，是由這個(gè)領(lǐng)域的大牛Keilgn大師設(shè)計(jì)的專(zhuān)利技術(shù)。但是大師東西雖好，但是有個(gè)依賴，延時(shí)估計(jì)要在一定范圍內(nèi)估計(jì)，就是要有一個(gè)預(yù)先設(shè)計(jì)的值，如果在一個(gè)很大的范圍內(nèi)搜索，會(huì)極大消耗CPU資源。而這個(gè)預(yù)設(shè)的delay值通常不準(zhǔn)，為什么不準(zhǔn)呢？因?yàn)榘沧肯到y(tǒng)線程調(diào)度設(shè)計(jì)不是很實(shí)時(shí)導(dǎo)致。一旦資源搶占，會(huì)在安卓底層buffer產(chǎn)生莫名的延時(shí)導(dǎo)致delay不準(zhǔn)。還是那個(gè)問(wèn)題，每款手機(jī)甚至每個(gè)手機(jī)都不一樣。我遇到過(guò)一種情況，某國(guó)內(nèi)手機(jī)品牌，不同款手機(jī)delay不準(zhǔn)，同款手機(jī)不同子款比如（帶不帶s）。同款手機(jī)不同批次，delay不同，同款手機(jī)同一批次不同時(shí)間測(cè)試delay都不同。如何拿到穩(wěn)定的低延時(shí)的聲音信號(hào)，為此，谷歌專(zhuān)門(mén)有個(gè)一視頻教程。無(wú)奈，安卓手機(jī)的碎片化和私人裁剪導(dǎo)致這個(gè)問(wèn)題無(wú)法一致性解決。

　　那么Agora怎么做的呢，Agora的回聲消除技術(shù)，發(fā)展到今天，已經(jīng)是第四代回聲消除技術(shù)。

　　聲網(wǎng)Agora的第三代回聲消除技術(shù)，通過(guò)逐個(gè)機(jī)型的適配。累計(jì)適配了幾百款機(jī)型，而我們的第四代“免”適配技術(shù)保證我們實(shí)現(xiàn)4000款機(jī)型的適配。

　　聲網(wǎng)Agora的“免”適配，免帶一個(gè)小引號(hào)。聲網(wǎng)Agora的免適配和適配相互配合，適配的機(jī)型，效果更好。不適配的機(jī)型是公版算法，基本也沒(méi)有大問(wèn)題，一般不會(huì)出現(xiàn)整句回聲。只會(huì)間或的出現(xiàn)小回聲，比如2分鐘1次，或是10分鐘1次的殘留回聲。很小的回聲也會(huì)有，不想適配過(guò)的手機(jī)，你完全聽(tīng)不到回聲。適配的機(jī)型，聲網(wǎng)Agora有整套測(cè)試方法驗(yàn)證；免適配的機(jī)型，聲網(wǎng)Agora依靠線上數(shù)據(jù)的反饋，判斷“免”的效果。也正是依賴聲網(wǎng)Agora線上數(shù)據(jù)的反饋，才能做到“免”適配。

　　如果線上數(shù)據(jù)反映效果不好，聲網(wǎng)Agora會(huì)嘗試聯(lián)系用戶和采購(gòu)機(jī)型進(jìn)行適配。正是因?yàn)槁暰W(wǎng)Agora充分適配了足夠多的機(jī)型，接觸過(guò)各式各樣的回聲消除技術(shù)和歷史才有這個(gè)把握掌握開(kāi)發(fā)進(jìn)階技術(shù)。如果“免”適配技術(shù)無(wú)法滿足，立刻有適配技術(shù)補(bǔ)上。結(jié)合聲網(wǎng)Agora網(wǎng)絡(luò)傳輸?shù)膬?yōu)勢(shì)，“免”適配和適配互相配合，助力聲網(wǎng)Agora實(shí)現(xiàn)很好的回聲消除效果。當(dāng)然回聲消除只是我們APM引擎的一部分。在APM里，還有降噪技術(shù)，單麥克降噪雙麥克降噪，聲網(wǎng)Agora在個(gè)別機(jī)型上開(kāi)啟了雙mic降噪功能。

　　2.測(cè)試評(píng)估

　　聲網(wǎng)Agora的評(píng)估體系有三個(gè)層次：

　　第一層次，客觀測(cè)試。我們把手機(jī)出廠測(cè)試和VOIP測(cè)試相結(jié)合，提出了我們的測(cè)試方法、這個(gè)測(cè)試方法是ITU、3GPP、ETSI或是電信運(yùn)營(yíng)商要求測(cè)試的標(biāo)準(zhǔn)通信測(cè)試的交集。按照這套方法，我們經(jīng)常會(huì)去泰爾實(shí)驗(yàn)室做客觀測(cè)試。國(guó)內(nèi)我們是第一個(gè)互聯(lián)網(wǎng)廠家把這套測(cè)試用在云服務(wù)標(biāo)準(zhǔn)上的。

　　第二個(gè)層次，主觀測(cè)試。因?yàn)榭陀^測(cè)試只是一個(gè)基本測(cè)試，很多手機(jī)出廠都做，但是出廠之后還是有很多很多問(wèn)題，尤其對(duì)我們這樣的全平臺(tái)多機(jī)型通信引擎，只做客觀測(cè)試是不夠的，所以我們定義出很多細(xì)的標(biāo)準(zhǔn)，比如，聲音質(zhì)量、卡、失真、回聲情況、雙講情況、是否有切音、延時(shí)等等。安排測(cè)試人員，對(duì)海量機(jī)型，逐個(gè)機(jī)器逐個(gè)機(jī)型的去聽(tīng)，去感受我們音頻的效果。

　　第三個(gè)層次，線上測(cè)試。也就是線上用戶的使用反饋，我們兩個(gè)DemoAPP，一個(gè)就是我們的Beckon，可以在AppStore搜索到，這個(gè)APP是我們用來(lái)做實(shí)驗(yàn)和演示的。用戶可以體驗(yàn)Beckon的效果，我們收集用戶的反饋，判斷我們音頻系統(tǒng)的質(zhì)量。

　　通過(guò)這三個(gè)層次的測(cè)試，我們能保證提供最好的音頻通信引擎。高清音頻通信引擎，整個(gè)通信系統(tǒng)都是32khz音頻采樣頻率，對(duì)系統(tǒng)的ADM，APM，ACM，ANM要求的處理算法都針對(duì)32Khz。我們比通信標(biāo)準(zhǔn)更早的把32Khz代入實(shí)際應(yīng)用，今天VoLTE還沒(méi)有普及全高清音頻傳輸系統(tǒng)，而我們做到了。

　　本文作者：

　　高澤華，11年音樂(lè)語(yǔ)音編解碼學(xué)習(xí)經(jīng)驗(yàn)。理解幾十種音頻編解碼標(biāo)準(zhǔn)。先后在中磊電子、士蘭微電子、虹軟科技主導(dǎo)音頻項(xiàng)目。任職YY期間負(fù)責(zé)語(yǔ)音音頻技術(shù)工作。對(duì)音頻算法在芯片設(shè)計(jì)、嵌入式系統(tǒng)、桌面軟件。在互聯(lián)網(wǎng)應(yīng)用和專(zhuān)利分析方面有多年研發(fā)經(jīng)驗(yàn)和積累。目前負(fù)責(zé)聲網(wǎng)Agora。io的音頻開(kāi)發(fā)工作。

復(fù)制網(wǎng)址收藏打印郵件微信新浪微博一鍵分享 QQ 更多

相關(guān)熱詞搜索：聲網(wǎng)Agora 語(yǔ)音通話

上一篇:華為助山西醫(yī)科大學(xué)第二醫(yī)院打造數(shù)字化醫(yī)院

下一篇:10W＋驚艷現(xiàn)場(chǎng)互動(dòng)幕后的神秘功臣

相關(guān)閱讀：

·從脈脈宕機(jī)15個(gè)小時(shí)看如何實(shí)現(xiàn)高可用性架構(gòu)2016-08-03 09:27:02
·聲網(wǎng)Agora.io：柏拉圖CEO揭秘“性格標(biāo)簽”火爆的背后邏輯2016-07-18 09:27:51
·聲網(wǎng)Agora.io@ArchSummit架構(gòu)師峰會(huì)20162016-07-11 09:35:37
·如何全面的評(píng)估語(yǔ)音通話服務(wù)（引擎）質(zhì)量？2016-07-07 14:15:15
·7月底，聲網(wǎng)Agora.io和您一起探討科技如何改變教育2016-07-07 13:45:42
·WebRTC回聲抵消模塊簡(jiǎn)要分析2016-06-01 14:09:20
·聲網(wǎng)Agora助陪我App做成了一門(mén)聲音社交的生意2016-06-01 10:38:31
·QCon北京第二天，移動(dòng)互聯(lián)網(wǎng)的音視頻傳輸挑戰(zhàn)2016-04-22 11:23:29
·聲網(wǎng)Agora.io：SaaS2引領(lǐng)新創(chuàng)業(yè)方向，估值過(guò)億2016-04-19 10:41:50
·聲網(wǎng)Agora.io實(shí)時(shí)云以開(kāi)放API助企業(yè)應(yīng)用創(chuàng)新2016-04-18 15:21:47

評(píng)論排行

專(zhuān)題

G-Summit客戶體驗(yàn)大會(huì): 為了讓眾多客戶了解當(dāng)前客戶體驗(yàn)和服務(wù)的市場(chǎng)導(dǎo)向、技術(shù)...[詳細(xì)]

Fintech火了銀行客...: 互聯(lián)網(wǎng)對(duì)金融業(yè)的沖擊毋庸置疑， "狼來(lái)了 ...[詳細(xì)]

2016世界移動(dòng)大會(huì)...: 由GSMA主辦的2016世界移動(dòng)大會(huì)-上海，以“移我所想” ...[詳細(xì)]

免費(fèi)試用JABRA B...: 免費(fèi)試用音質(zhì)卓越且堅(jiān)固耐用的Jabra BIZ 系列專(zhuān)業(yè)耳麥[詳細(xì)]

點(diǎn)擊排行
周排行
月排行

電話：+86-10-82012787，+86-10-82079677
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號(hào)513室（100088）

電話：+86-10-82012787，+86-10-82079677
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號(hào)513室（100088）

經(jīng)營(yíng)性網(wǎng)站備案信息

京ICP證030771號(hào)

網(wǎng)絡(luò)110報(bào)警服務(wù)

京公網(wǎng)安備110102000104-1號(hào)

中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

聲網(wǎng)Agora：游戲的語(yǔ)音通話解決方案

評(píng)論排行

推薦閱讀

專(zhuān)題