123,123

华平音频信息网络数字化实时传输技术

CCTIME飞象网

摘要： 随着视音频编解码技术的提高，各种基于互联网络的远程音视频交互迅速普及，音频采集、编解码、传输等技术得到较快的发展和进步，各种音频编解码标准和网络传输纠错技术也都有成熟的应用。但是，在现有技术中，网络带宽依然是大多数网络流媒体交互应用的瓶颈。因为在许多应用场合中，网络带宽的实时稳定性根本无法得到保证。由于网络带宽不足或者带宽不稳定，经过编解码压缩后的音频信息可能无法完整的传输给接收方，或造成通信中断，更有甚者，常会因为音频传递质量差而导致信息的接收方误判传递信息，从而造成更大损失。

關(guān)鍵詞： 华平音频信息网络数字化传输技术

Abstract：

Key words :

技術(shù)背景

隨著視音頻編解碼技術(shù)的提高，各種基于互聯(lián)網(wǎng)絡(luò)的遠程音視頻交互迅速普及，音頻采集、編解碼、傳輸?shù)燃夹g(shù)得到較快的發(fā)展和進步，各種音頻編解碼標(biāo)準和網(wǎng)絡(luò)傳輸糾錯技術(shù)也都有成熟的應(yīng)用。但是，在現(xiàn)有技術(shù)中，網(wǎng)絡(luò)帶寬依然是大多數(shù)網(wǎng)絡(luò)流媒體交互應(yīng)用的瓶頸。因為在許多應(yīng)用場合中，網(wǎng)絡(luò)帶寬的實時穩(wěn)定性根本無法得到保證。由于網(wǎng)絡(luò)帶寬不足或者帶寬不穩(wěn)定，經(jīng)過編解碼壓縮后的音頻信息可能無法完整的傳輸給接收方，或造成通信中斷，更有甚者，常會因為音頻傳遞質(zhì)量差而導(dǎo)致信息的接收方誤判傳遞信息，從而造成更大損失。

基于上述問題，業(yè)界目前的做法是借助其他的手段，例如郵件傳遞、拷貝等，將音頻信息發(fā)送給接收方，這樣不但降低了工作效率，而且大大增加了信息交互的時間成本。鑒于以上所述現(xiàn)有技術(shù)的缺點，華平創(chuàng)造性的推出了一種音頻信息網(wǎng)絡(luò)數(shù)字化實時傳輸技術(shù)，以解決現(xiàn)有技術(shù)中存在的因網(wǎng)絡(luò)帶寬不足、不穩(wěn)定，丟包率比較高，致使接收方無法完整接收到音頻信息的問題。

技術(shù)介紹

音頻信息網(wǎng)絡(luò)數(shù)字化實時傳輸技術(shù)，應(yīng)用于具有至少一個音頻信息發(fā)送端及一個音頻信息接收端的網(wǎng)絡(luò)架構(gòu)中。該技術(shù)系統(tǒng)包括以下十個模塊：1、音頻信息輸入模塊，用于采集音頻信息；2、信息源緩存模塊，用于緩存接收到的音頻信息源；3、編碼模塊，用于將音頻信息源編碼為音頻包；4、網(wǎng)絡(luò)傳輸模塊，用于將音頻包通過網(wǎng)絡(luò)傳輸至音頻信息接收端，還用以將音頻識別模塊輸出的文字信息傳送至文字顯示模塊；5、檢測模塊，用于實時檢測網(wǎng)絡(luò)傳輸模塊，將音頻包傳輸給音頻信息接收端時的丟包率，當(dāng)檢測到丟包率大于丟包率閥值時，發(fā)出音頻識別指令；6、音頻識別模塊，用于接收音頻識別指令，并將提取的音頻信息源識別為文字信息；7、文字轉(zhuǎn)音頻識別模塊，用于接收文字信息，并將該文字信息識別為音頻信息；8、音頻信息輸出模塊，用于輸出接收到的音頻信息；9、解碼模塊，用于將音頻包進行解碼為音頻信息；10、文字顯示模塊，用于將文字信息轉(zhuǎn)換為文字字幕予以顯示。

音頻信息網(wǎng)絡(luò)數(shù)字化實時傳輸過程圖

音頻信息傳輸過程：首先在音頻信息發(fā)送端設(shè)置一個丟包率閥值，使用音頻信息輸入模塊采集音頻信息，將采集的音頻信息作為信息源緩存到信息源緩存模塊，同時使用編碼模塊將信息源編碼為音頻包，通過網(wǎng)絡(luò)傳輸模塊傳輸至音頻信息接收端，在傳輸過程中由檢測模塊實時檢測傳輸時的丟包率，當(dāng)丟包率大于預(yù)設(shè)的丟包率閥值時，發(fā)出音頻識別指令，音頻識別模塊根據(jù)接收到的音頻識別指令提取緩存的音頻信息源，并將音頻信息源識別為文字信息經(jīng)由網(wǎng)絡(luò)傳輸至音頻信息接收端，音頻信息接收端再將該文字信息識別為音頻信息輸出(也可根據(jù)客戶需求，將音頻信息接收端接收到的文字信息直接轉(zhuǎn)換為文字字幕顯示)；若實時檢測的丟包率不大于預(yù)設(shè)的丟包率閥值，音頻信息接收端會將接收到的音頻包直接解碼為音頻信息輸出。

技術(shù)特點

1、可保證音頻信息的完整傳輸：本技術(shù)主要是將音頻信息在發(fā)送端通過預(yù)設(shè)丟包率閥值來判斷網(wǎng)絡(luò)帶寬是否穩(wěn)定，能否滿足音頻傳輸需求，并根據(jù)實際情況設(shè)置音頻傳輸方式，保證在各種網(wǎng)絡(luò)情況下的音頻信息完整傳輸。

2、靈活的輸出方式：在某些特殊應(yīng)用中，例如不便接收聲音的場合，或者接收信息的場合聲音過于嘈雜，可直接將語音轉(zhuǎn)成文字輸出。

技術(shù)應(yīng)用

低帶寬、高丟包率的成功應(yīng)用

本技術(shù)被廣泛應(yīng)用于遠程視頻會議、遠程監(jiān)控指揮、視頻教學(xué)等應(yīng)用場景中。解決了現(xiàn)有技術(shù)中存在的因網(wǎng)絡(luò)帶寬不足或不穩(wěn)定，丟包率高等原因，造成對方無法完整接收到音頻信息的問題，保證了音頻信息在各種復(fù)雜網(wǎng)絡(luò)情況下的完整傳輸。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容