文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2011)09-139-03
網(wǎng)絡(luò)視頻監(jiān)控是一種基于寬帶網(wǎng)絡(luò)為用戶提供圖像和各種報(bào)警信號(hào)遠(yuǎn)程采集、傳輸、儲(chǔ)存、處理等功能的全新電信業(yè)務(wù)。這是一個(gè)由前端、中間端、后端三部分組成的網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)。其中解碼模塊將收到的完整數(shù)據(jù)幀放入解碼器中進(jìn)行解碼,生成實(shí)時(shí)視頻影像。
H.264是繼MPEG4之后的新一代數(shù)字視頻壓縮格式,它既保留了以往壓縮技術(shù)的優(yōu)點(diǎn)和精華,又具有其他壓縮技術(shù)無法比擬的優(yōu)點(diǎn)。H.264最具價(jià)值的部分是更高的數(shù)據(jù)壓縮比。在同等的圖像質(zhì)量條件下,H.264的數(shù)據(jù)壓縮比能比當(dāng)前DVD系統(tǒng)中使用的MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因?yàn)槿绱?,?jīng)過H.264壓縮的視頻數(shù)據(jù),在網(wǎng)絡(luò)傳輸過程中所需要的帶寬更少,也更加經(jīng)濟(jì)。所以本系統(tǒng)選擇采用H.264格式視頻。
DirectX軟件開發(fā)包是微軟公司提供的一套在Windows操作平臺(tái)上開發(fā)高性能圖形、聲音、輸入、輸出和網(wǎng)絡(luò)游戲的編程接口??梢杂脕黹_發(fā)游戲以及作為其他各類多媒體應(yīng)用程序的底層API函數(shù)集。它是一種基于COM的系統(tǒng),既不屬于驅(qū)動(dòng)程序?qū)?,也不屬于?yīng)用程序?qū)印W鳛镈irectX的一個(gè)COM組成元素,Directshow應(yīng)用程序編程接口是一個(gè)Windows平臺(tái)上的流媒體架構(gòu),提供各種格式的高品質(zhì)多媒體流的捕獲、處理、傳送和回放。Directshow集成了DirectX其他組件中的先進(jìn)技術(shù),能做到自動(dòng)檢測(cè)、使用視頻和音頻硬件加速設(shè)備。它不僅支持基于WDM驅(qū)動(dòng)程序的硬件設(shè)備,也向上兼容Video for Windows驅(qū)動(dòng)程序的硬件設(shè)備。Directshow采用多線程多任務(wù)的方式,還支持寬松的格式變化。Directshow為播放視頻監(jiān)控中涉及到的各種類型的音頻、視頻數(shù)據(jù)提供了非常有效的途徑。因此本系統(tǒng)采用Directshow來實(shí)現(xiàn)視頻監(jiān)控系統(tǒng)中H.264視頻的解碼。
1 Directshow體系結(jié)構(gòu)
Directshow基于模塊化結(jié)構(gòu),每個(gè)功能模塊都采取COM組件方式,稱為Filter。Filter負(fù)責(zé)執(zhí)行一些多媒體流的處理過程,采用Filter Graph模型來管理整個(gè)數(shù)據(jù)流的處理過程。Directshow的體系結(jié)構(gòu)圖如圖1所示。它通過提供各種功能的Filter完成總體應(yīng)用框架的工作,從而使多媒體應(yīng)用程序設(shè)計(jì)變得簡(jiǎn)單。每個(gè)Filter都分別具有一個(gè)不同的應(yīng)用功能,F(xiàn)ilter之間通過Pin相互連接。每個(gè)過濾器都擁有屬于自己的針腳。針腳分為輸入針腳和輸出針腳,輸入針腳把過濾器外部的數(shù)據(jù)接收到過濾器中進(jìn)行處理,輸出針腳把過濾器中處理后的數(shù)據(jù)傳送到下一個(gè)過濾器。經(jīng)過輸入輸出針腳的傳遞,數(shù)據(jù)從一個(gè)過濾器傳送到了下一個(gè)過濾器中。當(dāng)兩個(gè)pin連接的時(shí)候,必須有一個(gè)pin提供一個(gè)allocator。Directshow定義了一系列函數(shù)調(diào)用來確定由哪個(gè)pin提供allocator,以及buffer的數(shù)量和大小。在數(shù)據(jù)流開始之前,allocator會(huì)創(chuàng)建一個(gè)內(nèi)存池pool of buffer,在開始發(fā)送數(shù)據(jù)流以后,源Filter就會(huì)將數(shù)據(jù)填充到內(nèi)存池中一個(gè)空閑的buffer中,然后傳遞給下一個(gè)的Filter。
1.1 Filter的原理
Directshow技術(shù)的最核心就是作為過濾器的可插入標(biāo)準(zhǔn)組件,它是具有特殊功能的COM對(duì)象。過濾器又可分為:源過濾器(Source Filter)、變換過濾器(Trans-form Filter)、提交過濾器(Renderer Filter)等。源過濾器引入數(shù)據(jù)到過濾器圖表中,數(shù)據(jù)來源可以是文件、網(wǎng)絡(luò)、照相機(jī)等。不同的源過濾器處理不同類型的數(shù)據(jù)源,然后將數(shù)據(jù)往下傳輸;變換過濾器的工作是獲取輸入流,處理數(shù)據(jù),并生成輸出流,其對(duì)數(shù)據(jù)的處理包括編解碼、格式轉(zhuǎn)換、壓縮解壓縮等;提交過濾器主要負(fù)責(zé)數(shù)據(jù)的最終去向,接收數(shù)據(jù)并把數(shù)據(jù)提交給外設(shè)。Directshow使Filter Graph Manager中的Filter按一定的順序連接成一條“流水線”協(xié)同工作,F(xiàn)ilter Graph的結(jié)構(gòu)如圖2所示。過濾器通過文件讀寫、修改數(shù)據(jù)和顯示數(shù)據(jù)輸出設(shè)備來操作流媒體。為了完成整個(gè)任務(wù),必須將所有的過濾器Filter連接起來。應(yīng)用程序只需要通過COM接口訪問過濾器圖表、控制流媒體或者接收過濾器事件來完成視頻的播放。
1.2 COM組件
Directshow是基于COM系統(tǒng)的開發(fā)包。而COM組件對(duì)象模型是一種軟件架構(gòu),它定義了不同的對(duì)象使用一致同意的協(xié)議進(jìn)行通信的一套機(jī)制。所有的COM對(duì)象都支持相同的接口規(guī)范,這使得COM對(duì)象可以不依賴于具體的語言和系統(tǒng)平臺(tái)。每個(gè)COM都至少有一個(gè)接口,這里所說的接口是指一套函數(shù)和它們參數(shù)的定義。每個(gè)COM有它自己的GUID-CLSID,每個(gè)接口也有它自己的GUID-IID。GUID是一串128 bit數(shù)字,由專門的程序產(chǎn)生,可以保證每個(gè)GUID的全球唯一性。當(dāng)知道了一個(gè)COM的CLSID和它的接口IID,就可以用CoCreateInstance函數(shù)來實(shí)例化該COM對(duì)象的其他接口,可用該接口的IID作參數(shù),調(diào)用QueryInterface查詢接口函數(shù)來完成[1]。得到COM的接口后,就可以用它訪問該接口的一些函數(shù)。
2 Directshow的應(yīng)用
本系統(tǒng)采用VC++6.0開發(fā)多媒體應(yīng)用程序,開發(fā)應(yīng)用程序之前先要配置開發(fā)和編譯環(huán)境,在寫應(yīng)用程序時(shí)要包含頭文件Dshow.h并連接到庫(kù)文件strmbased.lib;在VC++的Library和Include中要加入DirectX SDK中的Lib和Include文件,并且放在標(biāo)準(zhǔn)的VC目錄之前[2]。利用Directshow開發(fā)應(yīng)用程序的步驟 :(1) 創(chuàng)建Source Filter、
Trans-form Filter、Renderer Filter; (2) 創(chuàng)建FilterGraph管理各個(gè)Filter,并且負(fù)責(zé)和應(yīng)用程序交互實(shí)現(xiàn)播放控制等。
由于Directshow使用COM技術(shù)實(shí)現(xiàn),首先要調(diào)用CoInitialize函數(shù)進(jìn)行初始化。接著創(chuàng)建用于組建過濾器的過濾器組件管理器和Capture -GraphBuilder組件,定義接口指針并獲取接口[3]。
2.1 COM對(duì)象的創(chuàng)建
COM對(duì)象的創(chuàng)建要經(jīng)過以下步驟:
(1) CoCreateInstance調(diào)用CoGetClassObject函數(shù);
(2) COM庫(kù)找到DLL程序并進(jìn)入進(jìn)程;
(3) 調(diào)用DLLGetClassObject函數(shù);
(4) DLLGetClassObject函數(shù)創(chuàng)建類工廠;
(5) DLLGetClassObject把類工廠接口指針返回給CoGetClassOjbect函數(shù);
(6) CoGetClassObject把類工廠接口指針返回給CoGetClassObject函數(shù);
(7) CoCreateInstance得到類工廠后,調(diào)用類工廠的對(duì)象創(chuàng)建函數(shù);
(8) 類工廠創(chuàng)建COM對(duì)象;
(9)類工廠把COM對(duì)象返回給CoCreateInstance函數(shù),CoCreateInstance函數(shù)返回;
(10) 客戶直接調(diào)用COM對(duì)象。
2.2 開發(fā)DirectShow一般過程
(1) 創(chuàng)建一個(gè)Filter Graph Manager
IGraphBuilder *pGraph=NULL
HRESULThr=CoCreateInstance(CLSJD_FilterGraph, NULL,CLSCTX_INPROC_SERVER,IDD_IGraphBuilder,(void**)& pGraph)
(2) 根據(jù)實(shí)際應(yīng)用,創(chuàng)建一條完整的Filter鏈路。
(3) 調(diào)用Filter Graph Manager上各個(gè)接口的方法進(jìn)行控制,并且完成Filter Graph Manager 與應(yīng)用程序的事件交互。調(diào)用ImediaControl接口的方法控制Filter Graph的狀態(tài)轉(zhuǎn)換:
IMediacontol *pControl=NULL
hr=pGraph->QueryInterface(IID_IMediaControl,(void**)&pControl)
hr=pControl->Run()
2.3媒體類型的檢測(cè)
當(dāng)兩個(gè)Filter連接的時(shí)候,它們會(huì)采用某一種媒體類型達(dá)成一致的協(xié)議。媒體類型定義了處于源頭的Filter將要給下一個(gè)與其相連接的Filter發(fā)送什么樣的數(shù)據(jù),以及數(shù)據(jù)的physical layout。兩個(gè)Filter必須支持同一種類型的媒體格式[4]。
3 解碼器設(shè)計(jì)
在Directshow環(huán)境中播放一個(gè)H.264格式的文件,需要一個(gè)能夠?qū).264格式的壓縮視頻進(jìn)行解碼的解碼器。由于Directshow沒有提供H.264的解碼Filter,所以H.264視頻解碼器需要自行開發(fā)。
3.1 Filter的設(shè)計(jì)
為了實(shí)現(xiàn)H.264視頻解碼器,可設(shè)計(jì)一個(gè)名為H264 Decoder的Transform Filter,包含一個(gè)出pin、一個(gè)輸入pin,用于接收H.264的視頻流輸入,解碼后輸出YUV格式的圖像幀序列。
Filter的注冊(cè)名:“H.264 Decoder”
Filter類型:Transform Filter
CLSID:CLSID_FilterH.264
Merit值:MERIT_DO_NOT_USE
此Filter的功能是接收視頻流的輸入,解碼后輸出YUV格式的圖像幀序列。而輸入輸出視頻流是通過不同功能的Filter連接完成的。Filter的連接實(shí)際上是Filter上pin的連接,連接的方向一般是從上一級(jí)Filter的輸出pin指向下一級(jí)Filter的輸入pin。只有兩個(gè)Filter都在Graph里,連接才能成功。應(yīng)用程序可以通過IFilterGraph::AddFilter將Filter添加Graph中,當(dāng)一個(gè)Filter被添加到graph中時(shí),F(xiàn)ilter圖標(biāo)管理器通過IbaseFilter::JoinFilterGraph來通知Filter。pin連接的過程為:
(1) Filter Graph Manager表管理器首先調(diào)用輸出pin上的IPin::Connect;
(2)如果輸出pin接受連接,就調(diào)用輸入pin上的IPin::ReceiveConnection;
(3) 如果輸入pin也接受連接,則雙方連接成功。
從Directshow的基類繼承得到Filter以實(shí)現(xiàn)一個(gè)獨(dú)立的線程,專門用于H.264的解碼輸出。在輸入pin上實(shí)現(xiàn)媒體類型檢查(CheckMediaType)。
HRESULT CheckMediaType(const CMediaType *mtOut)
{if(mDecodeFilter->mMpegInputPin->IsConnerted())
{if((mtOut->subtype==MEDIASUBTYPE_YUV||mtOut->subtype==MEDIASUBTYPE_RGB24)&&mtOut->formattype==FORMAT_VideoInfo)
{VIEDEOINFOHEADED*pFormat=(VIDEOINFOHEADER*)mtOut->pbFormat;
if(pFormat->bmilteader.biHeight==mDecodeFilter->mImageHeight&&pFormat->bmiHeader.biWidth==mDecodeFilter->mImageWidth)
{ return S_OK}
}
}
Return E_FAIL
}
3.2基類的選擇
可以選擇的基類有:CTransformFitler、CTransInPlaceFilter、CVideoTransformFilter、CBaseFilter。當(dāng)Filter的輸入pin接收數(shù)據(jù)后,經(jīng)過一定的處理由輸出pin再輸出數(shù)據(jù),一般選擇CTransformFilter或者CTransInPlaceFilter。由于在Filter上的兩個(gè)pin要求的媒體類型互不相同,而CTransInPlaceFilter的輸入和輸出pin上一般使用相同的媒體類型進(jìn)行連接,并且使用相同的Sample管理器,所以這個(gè)Filter不適合用CTransInPlaceFilter。而CBaseFitler是個(gè)一最基本的類,需要做比其他的基類更多的工作。此視頻解碼Filter最后選擇了CTransformFilter類。
CTransformFilter類是從CBaseFilter繼承而來,其最大特征是將pin上必須實(shí)現(xiàn)的函數(shù)委托到了Filter上。一般不需要重新寫輸入和輸出pin類,只需要在Filter上實(shí)現(xiàn)相應(yīng)的函數(shù)即可。CTransformFilter類使用時(shí)需要重載函數(shù):
CTransformFilter::CheckInputType
CTransformFilter::CheckTransform
CTransformFilter::DecideBufferSize
CTransformFilter::GetMediaType
CTransformFilter::Transform
由于微軟公司推出的Directshow沒有提供H.264的視頻解碼器。因此本文還需要使用ffmpeg中提取出的、經(jīng)過優(yōu)化的H.264視頻解碼組件。
本系統(tǒng)采用Directshow設(shè)計(jì)了H.264視頻的解碼器,并且利用ffmpeg提取出了H.264解碼代碼,實(shí)現(xiàn)了H.264視頻的解碼播放,如圖3所示。
參考文獻(xiàn)
[1] 潘愛民.COM原理與應(yīng)用[M].北京:清華大學(xué)出版社,1999.
[2] 陸其明.Directshow開發(fā)指南[M].北京:清華大學(xué)出版社,2003.
[3] 陸其明. Directshow實(shí)務(wù)精選[M]. 北京:科學(xué)出版社,2004.
[4] 侯春明.MPEG-2視頻解碼器在Directshow中的實(shí)現(xiàn)[J].計(jì)算機(jī)技術(shù)與自動(dòng)化,2007(4):86-88.