中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當(dāng)前的位置是:  首頁(yè) > 資訊 > 文章精選 >
 首頁(yè) > 資訊 > 文章精選 >

語(yǔ)音技術(shù)離邊緣越來(lái)越近

2021-05-14 10:08:14   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  CTI論壇(ctiforum.com)(編譯/老秦):語(yǔ)音識(shí)別是一項(xiàng)復(fù)雜的技術(shù),需要強(qiáng)大的處理能力、高速連接和非常智能的軟件。到目前為止,大部分繁重的工作都是在云端完成的。然而,新一代邊緣設(shè)備正在出現(xiàn),預(yù)計(jì)將推動(dòng)大型數(shù)據(jù)中心的許多處理功能更接近用戶。這一變化有可能縮短響應(yīng)時(shí)間并降低成本,但配套基礎(chǔ)設(shè)施尚不成熟,基本上未經(jīng)測(cè)試。因此,企業(yè)應(yīng)該開(kāi)始涉足邊緣技術(shù),但要意識(shí)到,目前這是一項(xiàng)正在進(jìn)行的工作。
 
  這種緊迫性源于這樣一個(gè)事實(shí):數(shù)據(jù)量正以令人難以置信的速度增長(zhǎng)。國(guó)際數(shù)據(jù)公司(IDC)的數(shù)據(jù)顯示,全球數(shù)據(jù)總量預(yù)計(jì)將從2018年的33zettabyte字節(jié)(1zettabyte字節(jié)相當(dāng)于1萬(wàn)億千兆字節(jié)--trillion gigabytes)增長(zhǎng)到2025年的175zettabyte字節(jié),復(fù)合年增長(zhǎng)率(CAGR)為61%。
  自然,公司正在努力處理、存儲(chǔ)和保護(hù)其不斷擴(kuò)大的信息池,而不斷增長(zhǎng)的數(shù)據(jù)量正在推動(dòng)邊緣計(jì)算業(yè)務(wù)案例。在較高的層次上,邊緣計(jì)算是一種架構(gòu),它將位于數(shù)據(jù)中心(通常稱為核心)的云服務(wù)與靠近最終用戶的邊緣計(jì)算設(shè)備相結(jié)合,這些設(shè)備可以自主地滿足部分應(yīng)用程序功能。最近兩方面都發(fā)生了變化。
  云計(jì)算為企業(yè)提供了一種比傳統(tǒng)系統(tǒng)更簡(jiǎn)單的部署和管理計(jì)算機(jī)基礎(chǔ)設(shè)施的方法,但這種差距一直在擴(kuò)大。云將計(jì)算機(jī)處理集中在海量數(shù)據(jù)中心。據(jù)Gartner統(tǒng)計(jì),2018年,90%的企業(yè)數(shù)據(jù)是在云端創(chuàng)建的,只有10%是在邊緣中創(chuàng)建的。
  然而,到2025年,邊緣計(jì)算將占75%,云計(jì)算僅占25%。因此,一些云基礎(chǔ)設(shè)施的缺陷正在顯現(xiàn)。“專門(mén)的語(yǔ)音應(yīng)用程序,比如互聯(lián)汽車(chē),需要將大量數(shù)據(jù)傳送到云端,但網(wǎng)絡(luò)可用性和質(zhì)量并不總是有保證,”Conversational Technologies的負(fù)責(zé)人Deborah Dahl解釋道。
  隱私是另一個(gè)問(wèn)題。“Dahl補(bǔ)充說(shuō):“人們?cè)絹?lái)越懷疑供應(yīng)商的動(dòng)機(jī),不喜歡他們的個(gè)人信息進(jìn)入云端,因?yàn)樗麄儫o(wú)法控制這些信息,也無(wú)法知道這些信息會(huì)發(fā)生什么。”這種不安在醫(yī)療保健和金融服務(wù)等垂直行業(yè)尤其普遍,但很少有行業(yè)能完全幸免。此外,消費(fèi)者還擔(dān)心黑客可能會(huì)利用語(yǔ)音系統(tǒng)進(jìn)入自己家中。家長(zhǎng)們尤其擔(dān)心從孩子身上收集到什么信息以及如何使用這些信息。
  “因此,語(yǔ)音行業(yè)一直在尋求將計(jì)算能力和存儲(chǔ)能力推向網(wǎng)絡(luò)邊緣。語(yǔ)音平臺(tái),如Amazon Alexa、Google Assistant、Microsoft Cortana和Nuance Communications的Dragon,從提供解決方案的一開(kāi)始就基本上部署了邊緣技術(shù)。”Opus Research的創(chuàng)始人兼首席分析師Dan Miller解釋說(shuō):“有很多智能終端,比如揚(yáng)聲器、自動(dòng)信息娛樂(lè)系統(tǒng)、信息亭和智能手機(jī),都有語(yǔ)音用戶界面。”
  然而,本地發(fā)生的計(jì)算和分析量很小,主要由喚醒系統(tǒng)的命令組成。一個(gè)原因是他們的設(shè)計(jì)是幾年前開(kāi)發(fā)的,當(dāng)時(shí)邊緣設(shè)備缺乏本地處理能力和電池電源。
  隨著行業(yè)的發(fā)展,這些障礙已經(jīng)被清除,云計(jì)算的局限性已經(jīng)明確化。將大部分會(huì)話發(fā)送到云端進(jìn)行解碼、解釋和響應(yīng),會(huì)降低響應(yīng)時(shí)間,增加網(wǎng)絡(luò)基礎(chǔ)設(shè)施需求(及其成本),并引發(fā)安全問(wèn)題。
  邊緣計(jì)算對(duì)語(yǔ)音技術(shù)的許多好處
  邊緣計(jì)算正在發(fā)展成為一種更具吸引力的選擇,因?yàn)樗治鰯?shù)據(jù)時(shí)更接近數(shù)據(jù)的創(chuàng)建位置,并將信息從終端設(shè)備到語(yǔ)音識(shí)別系統(tǒng)的移動(dòng)最小化。更智能的邊緣系統(tǒng)可以支持音頻捕獲等功能;壓縮;傳輸;語(yǔ)言處理;還有語(yǔ)音追蹤。此外,將更大的單詞子集和自然語(yǔ)言處理功能放在更接近用戶的位置會(huì)帶來(lái)許多好處,包括:
  • 它增強(qiáng)了應(yīng)用程序的響應(yīng)能力,因?yàn)橄到y(tǒng)不會(huì)受到網(wǎng)絡(luò)或云數(shù)據(jù)中心速度減慢的阻礙。
  • 它減少了互聯(lián)網(wǎng)帶寬的使用,向云發(fā)送簡(jiǎn)單的文本消息,而不是復(fù)雜的語(yǔ)音記錄。
  • 它降低了成本,使公司能夠削減網(wǎng)絡(luò)成本,因?yàn)樗鼈儌鬏數(shù)男畔⑤^少。
  • 減少延遲。延遲是有問(wèn)題的,數(shù)據(jù)從設(shè)備傳輸?shù)綀?zhí)行分析并返回結(jié)果所需的時(shí)間。將數(shù)據(jù)移近終點(diǎn)會(huì)縮短響應(yīng)時(shí)間,并允許在后臺(tái)處理選定的任務(wù),如將項(xiàng)目添加到購(gòu)物列表或創(chuàng)建提醒。
  • 它更好地支持任務(wù)關(guān)鍵型應(yīng)用程序。處理速度如此之快,以至于公司可以部署需要即時(shí)數(shù)據(jù)處理的實(shí)時(shí)應(yīng)用程序。
  • 提供離線可用性。有了云,就不能保證網(wǎng)絡(luò)始終可用或可靠。通過(guò)邊緣計(jì)算,語(yǔ)音助手處理某些命令并執(zhí)行選擇功能,例如自動(dòng)發(fā)出警報(bào)和發(fā)送提醒,即使設(shè)備處于飛行模式或超出覆蓋范圍。
  • 它保持?jǐn)?shù)據(jù)的私有性,因?yàn)楣⿷?yīng)商可以進(jìn)行檢查,這樣用戶數(shù)據(jù)就保持在本地,而不會(huì)發(fā)送到云。
  • 它符合隱私要求,如歐盟的一般數(shù)據(jù)保護(hù)條例(GDPR),該條例限制了信息的存儲(chǔ)位置;更少的移動(dòng)意味著更少的潛在問(wèn)題。
  • 它提高了安全性,因?yàn)檫吘壪到y(tǒng)越來(lái)越善于區(qū)分和識(shí)別用戶聲音。本地處理可以通過(guò)重置系統(tǒng)配置文件快速阻止試圖闖入的人。
  但要使邊緣計(jì)算全面運(yùn)行,還需要進(jìn)行一些基礎(chǔ)設(shè)施升級(jí)。一個(gè)好的起點(diǎn)是硬件。“圍繞本地自然語(yǔ)言處理這類事情的最大挑戰(zhàn)是將應(yīng)用程序和數(shù)據(jù)模型限制在便攜式設(shè)備上的小腳印上,”Miller解釋說(shuō)。
  供應(yīng)商必須升級(jí)他們的邊緣硬件,使其更強(qiáng)大。例如,亞馬遜的Echo設(shè)備使用該公司的AZ1神經(jīng)邊緣處理器,它需要的功耗減少20倍,內(nèi)存使用率降低85%,但語(yǔ)音處理能力卻翻了一番。此外,CEVA、Fluent。ai、NVIDIA、Intel和Syntiant等半導(dǎo)體供應(yīng)商正在開(kāi)發(fā)專用中央處理單元、圖形處理單元、數(shù)字信號(hào)處理器和系統(tǒng)芯片語(yǔ)音處理解決方案,旨在以小型、節(jié)能的形式提供所需的處理能力。
  傳統(tǒng)的無(wú)線廣域網(wǎng)(WAN)技術(shù)不適合邊緣計(jì)算。認(rèn)識(shí)到這些局限性,國(guó)際電信聯(lián)盟(International Telecommunications Union)、3GPP和互聯(lián)網(wǎng)工程任務(wù)組(Internet Engineering Task Force(IETF))開(kāi)發(fā)了IMT-2020,即5G。它提供了許多增強(qiáng)功能,包括:
  支持更多設(shè)備:新標(biāo)準(zhǔn)是為邊緣設(shè)計(jì)的。4G網(wǎng)絡(luò)支持每平方公里最多約4000臺(tái)設(shè)備;5G與100萬(wàn)人合作。
  減少延遲:4G延遲通常在20毫秒到30毫秒之間;5G是1毫秒到10毫秒。
  更快的速度:4G以每秒1G的速度運(yùn)行;5G的最高速度高達(dá)每秒20G。
  人工智能和機(jī)器學(xué)習(xí)的進(jìn)步使得語(yǔ)音系統(tǒng)變得更加復(fù)雜。檢測(cè)到關(guān)鍵字后,設(shè)備開(kāi)始主動(dòng)偵聽(tīng)。更多的智能可以放在本地,因此邊緣系統(tǒng)可以在嘈雜的環(huán)境中更好地處理信息,例如繁忙的辦公室。新興的技術(shù)將用戶的聲音與周?chē)穆曇舴珠_(kāi)。
  例如,波束形成處理來(lái)自多個(gè)麥克風(fēng)的音頻,以便將注意力集中在用戶所在的方向。如果員工從一個(gè)地方移動(dòng)到另一個(gè)地方,語(yǔ)音跟蹤算法會(huì)調(diào)整麥克風(fēng)信號(hào)之間的平衡,這樣系統(tǒng)就能知道說(shuō)話者在哪里,并能聽(tīng)到他們?cè)谡f(shuō)什么。
  軟件還可以抑制會(huì)話干擾。與消除噪音耳機(jī)的工作方式類似,該設(shè)備負(fù)責(zé)抑制干擾和音樂(lè),即使在大聲播放時(shí)也是如此。
  先進(jìn)的邊緣計(jì)算能力支持語(yǔ)音生物識(shí)別,防止未經(jīng)授權(quán)的用戶輸入信息,進(jìn)行購(gòu)買(mǎi),或更改關(guān)鍵系統(tǒng)設(shè)置。在處理敏感客戶或員工信息(如人力資源數(shù)據(jù)或帳單)的部門(mén)中,這些功能非常重要。
  設(shè)備上的人工智能語(yǔ)音識(shí)別可以執(zhí)行高級(jí)安全功能。一種裝置探測(cè)到玻璃破碎的聲音并觸發(fā)警報(bào)。當(dāng)連接到攝像頭時(shí),聲音會(huì)觸發(fā)對(duì)視頻的特寫(xiě)錄制事件。
  邊緣計(jì)算功能正在被添加到智能設(shè)備、計(jì)算機(jī)、打印機(jī)、家用電器、燈具、辦公設(shè)備和玩具中。用戶可以輸入命令來(lái)執(zhí)行任務(wù),比如打印文檔,或者幫助員工閱讀重要文檔。
  邊緣計(jì)算提供了潛在的成本節(jié)約。供應(yīng)商語(yǔ)音識(shí)別的應(yīng)用程序編程接口(API)調(diào)用通常每1000個(gè)APIs調(diào)用花費(fèi)4美元。將智能放在離設(shè)備更近的地方可以消除它們并降低系統(tǒng)開(kāi)銷。
  邊緣計(jì)算是一項(xiàng)正在進(jìn)行的工作
  然而,邊緣應(yīng)用程序開(kāi)發(fā)工作非常復(fù)雜,處于開(kāi)發(fā)的初級(jí)階段,需要一個(gè)更加健壯的生態(tài)系統(tǒng)。隨著數(shù)據(jù)從云端移動(dòng)到邊緣,軟件復(fù)雜性增加。
  IDC邊緣策略研究總監(jiān)Dave McCarthy表示,硬件平臺(tái)及其支持的通信協(xié)議日益多樣化也帶來(lái)了挑戰(zhàn)。將這些信息保存在一個(gè)地方,云計(jì)算比在多個(gè)地方協(xié)調(diào)信息要簡(jiǎn)單得多。
  規(guī)模也是一個(gè)問(wèn)題。“邊緣適用于只有少量設(shè)備的應(yīng)用程序,但隨著供應(yīng)商規(guī)模擴(kuò)大到數(shù)百或數(shù)千臺(tái),這種模式往往會(huì)崩潰,”Mc Carthy說(shuō)。
  缺乏標(biāo)準(zhǔn)使這一挑戰(zhàn)雪上加霜。目前,供應(yīng)商正在以自己的方式解決這些問(wèn)題,因此軟件的可移植性和開(kāi)發(fā)的一致性受到限制。
  軟件更新和維護(hù)變得更加復(fù)雜,因?yàn)閿?shù)據(jù)必須在多個(gè)位置同步。“如果有一小部分可能的功能,比如說(shuō)對(duì)于一個(gè)玩具,更新應(yīng)該是簡(jiǎn)單的;如果一個(gè)應(yīng)用程序很復(fù)雜,比如說(shuō)庫(kù)存,那么工作就會(huì)變得更麻煩。”
  隨著數(shù)據(jù)從數(shù)據(jù)中心轉(zhuǎn)移到邊緣,公司也需要新的管理工具。如果沒(méi)有它們,他們可能無(wú)法監(jiān)視事務(wù)中每個(gè)步驟發(fā)生的情況,識(shí)別潛在的瓶頸,并在問(wèn)題對(duì)性能產(chǎn)生負(fù)面影響之前理想地解決問(wèn)題。
  最后,請(qǐng)注意,這一領(lǐng)域是新的,因此基本上缺少所需的支持基礎(chǔ)設(shè)施和技能。很少有開(kāi)發(fā)人員了解新的體系結(jié)構(gòu),而最佳實(shí)踐的開(kāi)發(fā)才剛剛起步。總之,生態(tài)系統(tǒng)需要做很多工作。
  邊緣計(jì)算找到了一個(gè)利基市場(chǎng)
  由于邊緣語(yǔ)音系統(tǒng)的雛形,它們是例外而不是規(guī)則。它們存在于選擇性用例中,包括需要以下條件的用例:
  速度,當(dāng)系統(tǒng)需要以難以置信的速度處理數(shù)據(jù)時(shí),比如實(shí)時(shí)解決方案;
  缺乏可用帶寬,當(dāng)機(jī)器生成大量數(shù)據(jù)時(shí),將無(wú)法有效地發(fā)送到遠(yuǎn)程數(shù)據(jù)中心;
  自治,解決方案需要能夠在沒(méi)有網(wǎng)絡(luò)連接的情況下運(yùn)行;和遵守,當(dāng)信息必須保持在特定區(qū)域內(nèi)以遵守法規(guī)時(shí)。
  因此,專注于這一領(lǐng)域的供應(yīng)商數(shù)量很小。2019年11月,Nuance Communications剝離了Cerence,該公司成為一家獨(dú)立的汽車(chē)軟件公司。Cerence Drive語(yǔ)音識(shí)別系統(tǒng)用于3.5億輛汽車(chē),其虛擬助手功能可執(zhí)行諸如打開(kāi)空調(diào)和找到最近的Wi-Fi咖啡館等任務(wù)。
  Sensor的邊緣解決方案嵌入了來(lái)自ATT、Hasbro、華為、谷歌、亞馬遜、三星、LG、摩托羅拉、GoPro、索尼、騰訊、Garmin、LG、Microsoft和聯(lián)想等數(shù)百家消費(fèi)電子廠商的30多億個(gè)產(chǎn)品中。
  那么未來(lái)會(huì)怎樣呢?“我沒(méi)有看到大多數(shù)語(yǔ)音應(yīng)用程序使用邊緣技術(shù),但是那些需要低延遲、隱私和安全性的應(yīng)用程序會(huì)發(fā)現(xiàn)它很有吸引力,”Dahl總結(jié)道。
  聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
  作者:Paul Korzeniowski
  原文網(wǎng)址:
  https://www.speechtechmag.com/Articles/Editorial/Features/Speech-Technology-Inches-Closer-to-the-Edge--146809.aspx
 
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)

四会市| 越西县| 连城县| 巴林左旗| 左贡县| 枝江市| 博罗县| 敦煌市| 遵化市| 绥棱县| 灵川县| 商河县| 灌阳县| 托克逊县| 南京市| 芦山县| 岗巴县| 崇仁县| 县级市| 和平县| 开封市| 嘉兴市| 阜新| 灌云县| 视频| 长白| 龙井市| 邹平县| 公主岭市| 大荔县| 文登市| 克东县| 华坪县| 麻城市| 双辽市| 台江县| 会东县| 嘉禾县| 宝兴县| 新巴尔虎右旗| 浑源县|