摘 要: 視頻傳輸技術在現(xiàn)代社會廣泛應用,人們對其的要求也越來越高,其發(fā)展的趨勢是方便、快捷、隨時隨地。傳統(tǒng)的視頻傳輸過于依賴線路,線路的走向限制了傳輸?shù)暮芏嗫赡埽詿o線傳輸才是發(fā)展的方向。本文提出了一種基于WebRTC的Android移動端視頻傳輸技術,介紹了信令與WebRTC連接實現(xiàn)機制,以及穿透的具體過程。
關鍵詞: 信令;安卓;WebRTC
0 引言
本文提出了一種在移動端上(Android)的視頻傳輸技術,選取了兩臺Android設備作為測試設備,方便快捷,而且可攜帶性強。移動智能終端作為監(jiān)控端也是一個最佳的應用平臺。隨著谷歌Android的飛速發(fā)展[1],越來越多的人選擇Android平臺來觀察視頻數(shù)據(jù)。
1 技術簡介
?。?)Android系統(tǒng)
Android是基于Linux開放性內(nèi)核的操作系統(tǒng),也是一個開放的移動終端操作系統(tǒng)平臺,為移動設備提供了一個包含了操作系統(tǒng)及應用程序的軟件疊層架構。Android作為Google最具創(chuàng)新的產(chǎn)品之一[2],越來越多地被移動終端廠商使用和二次開發(fā)。Android具有很多特性,最大的特性是開放性,還有就是在其平臺上開發(fā)的應用程序權限由開發(fā)人員決定。
?。?)WebRTC
WebRTC是Google于2011年6月3日開源的即時通訊項目[3]。它是一個支持網(wǎng)頁瀏覽器進行實時語音對話或視頻對話的技術,其出現(xiàn)可以幫助Web瀏覽器、個人電腦或手機實現(xiàn)實時多媒體通信功能。WebRTC提供了各種實現(xiàn)視頻會議的核心技術,包括音視頻的采集、編解碼、信號優(yōu)化和處理以及網(wǎng)絡傳輸?shù)取?/p>
2 系統(tǒng)設計及實現(xiàn)
系統(tǒng)設計主要包含三個部分:音視頻模塊、信令服務和打洞服務。
2.1 音視頻模塊
VoiceEngine(WebRTC音頻引擎)是包含一系列音頻多媒體處理的框架,包括從視頻采集卡到網(wǎng)絡傳輸端等整個解決方案。ISAC(Internet Speech Audio Codec)是針對VoIP和音頻流的寬帶和超寬帶音頻編解碼器,是WebRTC音頻引擎的默認編解碼器。NetEQ for Voice是針對音頻的語音信號處理算法、自適應抖動控制算法以及語音包丟失隱藏算法。能夠快速且高解析度地適應不斷變化的網(wǎng)絡環(huán)境,確保音質(zhì)優(yōu)美且緩沖延遲最小,能夠有效地處理由于網(wǎng)絡抖動和語音包丟失對語音質(zhì)量產(chǎn)生的影響。VideoEngine(WebRTC視頻處理引擎),是包含一系列視頻處理的整體框架,是從攝像頭采集視頻到視頻信息網(wǎng)絡傳輸再到視頻顯示整個完整過程的解決方案。VP8視頻圖像編解碼器是WebRTC視頻引擎的默認編解碼器,VP8適合實時通信應用場景,因為它主要是針對低延時而設計的編解碼器。Video Jitter Buffer(視頻抖動緩沖器),可以降低由于視頻抖動和視頻信息包丟失帶來的不良影響。對音視頻模塊VoiceEngine和VideoEngine進行編譯使用,首先要到Google上下載安卓NDK,然后還要安裝其他一些工具。以下對兩個庫文件簡單解釋,voe_audio_processingadds消噪(NS):自動增益控制和回聲控制;voe_rtp_rtcp:增加了RTCP發(fā)送器報告、RTP/RTCP統(tǒng)計、前向糾錯(FEC)和RTP實時捕捉。
2.2 信令服務
信令服務的作用是在通信雙方都不知道對方的IP以及端口的情況下建立連接。由服務器建立連接來實現(xiàn)。WebRTC實現(xiàn)了兩個API,分別是:MediaStream:通過MediaStream的API能夠通過設備的攝像頭及話筒獲得視頻、音頻的同步流;RTCPeerConnection:RTCPeerConnection是WebRTC用于構建點對點之間穩(wěn)定、高效的流傳輸?shù)慕M件。WebRTC使用RTCPeerConnection傳遞數(shù)據(jù),但傳遞數(shù)據(jù)之前,需要一種機制來協(xié)調(diào)通信并發(fā)送控制信息,而這種機制就是信令機制。WebRTC并沒有制定任何信令的機制和協(xié)議,所以可以靈活選擇任何信令協(xié)議[4]。Openfire是一種開源的實時協(xié)作(RTC)服務器,本文設計用它作為信令服務器。
信令交換的信息有:(1)用來控制通信開啟或者關閉的連接控制消息;(2)媒體流元數(shù)據(jù),比如解碼器、解碼器的配置、帶寬、媒體類型等;(3)發(fā)生錯誤時彼此告知的消息;(4)外界所看到的網(wǎng)絡上的數(shù)據(jù),如IP地址、端口等;(5)用來建立安全連接的關鍵數(shù)據(jù)。
具體的連接建立方式由一種叫JSEP(JavaScript Session Establishment Protocol)的協(xié)議來規(guī)定,使用JSEP的原因在于在JSEP中需要交換的關鍵信息是多媒體會話描述(Multimedia Session Description)。JSEP將客戶端之間傳遞的信令分為兩種:offer信令和answer信令。它們主要內(nèi)容的格式都遵循會話描述協(xié)議(Session Description Protocal,SDP)。通過offer和answer交換SDP描述符,流程如下:
?。?)A和B雙方建立一個RTCPeerConnection實例。
?。?)A通過createOffer()方法建立一個包含A的SDP描述符的offer信令。
?。?)A通過setLocalDescription()方法,將A的SDP描述符交給A的RTCPeerConnection實例。
?。?)A將offer信令通過服務器發(fā)送給B。
?。?)B將A的offer信令中所包含的SDP描述符提取出來,并通過setRemoteDescription()方法交給B的RTCPeerConnection實例。
?。?)B通過createAnswer()方法建立一個包含B的SDP描述符的answer信令。
?。?)B通過setLocalDescription()方法將B的SDP描述符交給B的RTCPeerConnection實例。
(8)B將answer信令通過服務器發(fā)送給A。
?。?)A接收到B的answer信令后,將其中B的SDP描述符提取出來,調(diào)用setRemoteDescripttion()方法交給B的RTCPeerConnection實例。通過這一系列的信令交換之后,A和B所創(chuàng)建的RTCPeerConnection實例都包含了A和B的SDP描述符了。
2.3 打洞服務
打洞服務就是為了獲取連接兩端設備的網(wǎng)絡地址[5]。要實現(xiàn)P2P視頻傳輸,實際應用中不可能讓用戶自己去設置對方的IP和音視頻端口,而且即使設置了對方的IP和端口也不一定能運行,因為P2P視頻傳輸過程中,如果雙方不在同一個網(wǎng)段則還需穿透NAT。
打洞原理:主要思路就是通過STUN服務器獲取自己的IP、Port及NAT信息,然后通過信令服務器交換這些信息,最后兩客戶端根據(jù)各自得到的IP、Port、NAT信息進行相應的穿透。STUN是一種網(wǎng)絡協(xié)議,可以讓處于NAT后的客戶端找出自己所處的公網(wǎng)IP地址,而且可以獲取自己的NAT類型,以及一些相關的端口信息,這些信息用來在兩個處于NAT之后的主機建立UDP通信。STUN由RFC 5389定義,是一個客戶機-服務器協(xié)議,由于每個peer可能處于不同的網(wǎng)絡中,所以每個peer都需要NAT穿越,確保雙方都可訪問對方的IP地址和端口以及STUN服務器。在RTCPeerConnection中,使用ICE框架來保證RTCPeerConnection能實現(xiàn)NAT穿越。ICE(Interactive Connectivity Establishment),交互式連接建立,是一種綜合性的NAT穿越技術,可以整合各種NAT穿越技術,如STUN、TURN(Traversal Using Relay NAT,中繼NAT實現(xiàn)的穿透)。ICE會先使用STUN,如果失敗,ICE就會使用一個中繼的TURN服務器。圖1為iceServers配置信息。
在iceServers配置對象(RTCPeerConnection constructor)中設置STUN and/or TURN服務器地址信息,包括IP地址、端口號等。有了這些信息ICE會自動啟動。STUN服務架設在外網(wǎng),它有一個簡單的任務:獲取一個發(fā)送請求的設備(運行在NAT后邊的應用)的IP和端口,然后返回這個地址。換句話說,應用使用STUN服務器發(fā)現(xiàn)它的外網(wǎng)IP和端口,這個過程確保了一個WebRTC端獲得它自己的公共地址,然后通過signaling機制發(fā)送這個信息給另一端,這樣就可以建立起一個直接連接。在實際應用中,不同的NATs有不同的工作方式,可能有多個NAT層,但是原理是一樣的,原理如下:
?。?)A通過公共IP與服務器建立連接。
?。?)A發(fā)送一個加入某房間的信令,并設置房間號,信令中需要包含該房間的編號。
(3)若有新用戶B加入,B會向服務器發(fā)送一個請求信令(new_peer),信令中包含新加入的用戶B的信息以及房間號。
?。?)若房間號相同,則建立A和B的通信連接。
系統(tǒng)框架如圖2所示。
圖2中兩個peer分別指兩個終端用戶,NAT的用途是作為穿透使用,turnserver是由一個STUN服務器加上中繼功能構成,當建立一個基于UDP的連接失敗了,ICE就會使用一個中繼的TURN服務器也就是Relay server。
3 測試及結果
在本次測試中,采用的兩臺Android手機分別是三星平板和魅族手機。如圖3所示兩臺Android平臺(一臺是安卓手機,一臺是安卓平板)正在進行視頻傳輸,從屏幕中既可以觀察遠端傳過來的情況又可以觀察自己要傳出去的視頻情況。
4 結論
本文采用WebRTC音視頻技術,利用NAT穿透和信令服務的搭建,實現(xiàn)了移動終端的無線視頻傳輸。NAT穿透在實現(xiàn)跨網(wǎng)功能上起到了巨大的作用,對于安卓移動端具有良好的應用價值。
參考文獻
[1] 李寧.Android開發(fā)權威指南[M].北京:人民郵電出版社,2011.
[2] 丁鶴洋,李太君,徐瑛.3G無線視頻監(jiān)控系統(tǒng)的設計與實現(xiàn)[J].通信技術,2012,45(2):68-70.
[3] 鄒勇.基于XMPP和Webrtc的web實時通訊[D].南京:南京大學,2012.
[4] 王璐.Web模式下基于XMPP的即時通信系統(tǒng)的設計與實現(xiàn)[D].北京:北京郵電大學,2010.
[5] 楊佳勝.基于Android終端的視頻通話系統(tǒng)設計與實現(xiàn)[D].大連:大連理工大學,2011.