摘 要: 通過對嵌入式Pocket PC環(huán)境下音頻播放的研究,提出了基于FMOD音頻播放的設(shè)計與實現(xiàn)原理,以此說明Pocket PC下多媒體應(yīng)用" title="多媒體應(yīng)用">多媒體應(yīng)用的開發(fā)方法。
關(guān)鍵詞: Pocket PC 多媒體 FMOD
隨著嵌入式應(yīng)用的迅速發(fā)展,很多傳統(tǒng)的基于臺式機的應(yīng)用迅速轉(zhuǎn)向嵌入式應(yīng)用平臺。WinCE為微軟開發(fā)的嵌入式系統(tǒng)" title="嵌入式系統(tǒng)">嵌入式系統(tǒng),其廣泛應(yīng)用于Pocket PC(PPC)嵌入式應(yīng)用平臺。在嵌入式平臺下實現(xiàn)多媒體應(yīng)用是當(dāng)前應(yīng)用研究的熱點。
使用嵌入式技術(shù)與音頻播放相結(jié)合的研究已經(jīng)很多,如嵌入式音頻點播、MP3播放系統(tǒng)等,但它們多是使用特定的硬件解碼器完成音頻解碼,對于嵌入式PPC下如何實現(xiàn)軟實時音頻解碼缺乏系統(tǒng)性研究。通過研究發(fā)現(xiàn)FMOD可以實現(xiàn)完整的音頻播放功能。由于PPC上沒有DirectSound的設(shè)計,因此只能用CPU來模擬。
本文使用EVC作為開發(fā)語言,設(shè)計方法亦適合其他平臺。此方法也可以在游戲和應(yīng)用程序" title="應(yīng)用程序">應(yīng)用程序中使用,為PPC上的音頻播放提供解決思路。
1 音頻技術(shù)介紹
1.1 PPC上音頻播放的現(xiàn)狀
PPC上通常使用WAV聲音文件進(jìn)行音頻播放。若使用微軟的Media接口進(jìn)行音頻播放,一方面播放效率比較低,滿足不了實時應(yīng)用對時間效率的要求,例如游戲、多媒體、播放器等應(yīng)用;另一方面,播放文件格式單一,WAV文件相對于mp3等壓縮音頻文件所占存儲空間較多,對以存儲卡" title="存儲卡">存儲卡為存儲介質(zhì)的PPC來說,顯然不合適。
對于音頻引擎中API編程的應(yīng)用,可選擇Windows Multimedia、DirectSound、OpenAL、Aureal A3D,其中以DirectSound較為著名。但是這些技術(shù)不適合在資源緊張的PPC上使用。
另外,還有一些沒有真正硬件支持的應(yīng)用程序接口,它們以API組件包的形式提供給應(yīng)用程序使用,例如:Miles Sound System、RenderWare Audio、GameCoda、FMOD、Galaxy、BASS、SEAL。其中FMOD是最新引入的技術(shù),具有廣泛的功能選擇和對API技術(shù)的完美支持。
1.2 PPC上FMOD簡介
FMOD是一個非常容易使用的跨平臺聲音引擎,支持三維環(huán)繞聲、MIDI、MOD、MP3、OGG、WMA、AIFF、CD,可以在Windows、Windows CE、Linux、Macintosh、GAMECUBE、PLAYSTATION 2和XBOX上使用,支持C/C++、VB、DELPHI。同時通過分析其接口可知,它還為PPC平臺定制了一個mini版本,用以在PPC上進(jìn)行音頻播放,并且在非商業(yè)程序的情況下是免費的,這為研究提供了便利條件。
2 音頻播放器實現(xiàn)中的關(guān)鍵技術(shù)
2.1 形式化結(jié)構(gòu)設(shè)計
自20世紀(jì)90年代后期以來,軟件體系結(jié)構(gòu)的研究成為一個熱點。從研究現(xiàn)狀來看,當(dāng)前的研究和對軟件體系結(jié)構(gòu)的描述,在很大程度上還停留在非形式化的層次上。從FDT[5](Formal Description Technique)在實際項目應(yīng)用中的技術(shù)特征來看,SDL(Specification and De-
scription Language)與UML(Unified Modeling Language)是比較容易結(jié)合使用的。
PPC上音頻播放借助于FMOD的音頻解碼,本文嘗試使用形式化描述的方法設(shè)計音頻播放流程。
PPC上音頻播放的功能EBNF[6]范式描述如下:
player:={player_files,player_status,player_decoder,frame_views}
player_files:={*.MOD|*.S3M|*.XM|*.IT|*.MID|*.RMI|*.SGT|*.FSB}
player_status:=sequence(play,pause,stop);
player_decoder:={FMOD modules}
frame_views:={Player information}
音頻播放的系統(tǒng)協(xié)作圖如圖1所示。
(1)PPC上的控制邏輯:用以對音頻文件的播放、停止、文件裝載、顯示等的控制。
(2)FMOD引擎:具體音頻數(shù)據(jù)解碼、軟實時播放,同時與PPC的播放控制和音頻文件管理相關(guān)聯(lián)。
(3)PPC音頻文件管理:管理要播放的音頻文件,播放音頻列表等。對PPC上文件管理不方便的功能進(jìn)行擴(kuò)充。
2.2 PPC上音頻文件選擇的方法
可使用GetOpenFileName方法對PPC上音頻文件進(jìn)行選擇,但選擇的文件位置被系統(tǒng)固定在My Document的Personal目錄之下,使文件可選擇范圍縮小并存在很多限制,例如,在這種情況下文件不能存放在存儲卡上。
在PPC系統(tǒng)不以盤符存放文件,只根據(jù)系統(tǒng)的根目錄,即“”。為此需要通過以下文件選擇實現(xiàn)對PPC上文件目錄的訪問:
(1)文件目錄選擇:在此功能下可以對文件目錄進(jìn)行瀏覽訪問;
(2)文件目錄中的文件選擇:包括文件名稱、大小、創(chuàng)建日期等內(nèi)容;
(3)文件過濾功能:包括對特定后綴音頻文件的選擇。
在PPC的模擬器上進(jìn)行文件選擇時,由于PPC的文件系統(tǒng)是以雙字節(jié)UNICODE形式編碼,所以要使用WideCharToMultiByte把文件名稱轉(zhuǎn)換為多字節(jié)流信息,否則無法打開具體的音頻文件。對于目錄下的文件目錄和文件名稱,可通過以下遍歷搜索方法獲得:
hFind=FindFirstFile(strSearch,&fd);
bFind=(hFind !=INVALID_HANDLE_VALUE);
while(bFind)
{if(!(fd.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY) &&!(fd.dwFileAttributes & FILE_ATTRIBUTE_HIDDEN))
{
strFile=pszPath;
strFile +=fd.cFileName;//處理文件名方法
m_cont.push_back(fd);//保存到隊列中
}
bFind=FindNextFile(hFind,&fd);
}
通過使用FindFirstFile和FindNextFile可以獲得PPC下文件系統(tǒng)相關(guān)信息的列表,同時為了對文件類型進(jìn)行較好的表示,系統(tǒng)通過SHGetFileInfo方法獲得在系統(tǒng)中注冊的圖標(biāo)信息。PPC下自制音頻文件瀏覽器如圖2所示。
2.3 音頻文件播放時波形顯示
對于播放的音頻文件信息,通常使用波形表示聲音的時頻變化,通過在FMOD引擎中創(chuàng)建DSP效果單元和相關(guān)數(shù)據(jù)緩沖單元得到音頻的FFT(快速傅式變換)變換數(shù)據(jù)。使用FSOUND_DSP_GetSpectrum方法獲得512個頻譜幅度的浮點數(shù)值信息,然后把頻譜數(shù)據(jù)繪制成波形譜。將FFT頻譜數(shù)據(jù)轉(zhuǎn)換到界面顯示的算法描述如下:
(1)假設(shè)對于頻譜數(shù)據(jù)要顯示區(qū)域的長度、寬度分別為height、width;
(2)將頻譜數(shù)值f(i),i1...512歸一化后映射到顯示區(qū)域:
(3)頻譜線顯示著色映射方法。事實上對于頻譜的振幅,期望其高振幅與低振幅有明顯的對比度,同時還要在振幅的變化過程中體現(xiàn)出著色變化的聯(lián)系性。據(jù)此,采用彩色空間RGB系統(tǒng)??晒潭ㄆ渲械腂(blue)分量,把R、G分量進(jìn)行線性劃分,即R=255-G,把歸一化的heightf(i)映射到0~255范圍f′(i),令R=f′(i),則彩色空間G分量:G=255-f′(i)。因此,可以通過連續(xù)變化的RGB彩色空間分量表示頻率分量的振幅信息。
(4)通過上述方法,把頻譜信息映射到圖像中,映射處理完畢。
聲音播放的頻譜波形顯示如圖3(a)所示,通過這種直觀方式可以更加清楚地了解音頻的頻譜特征。同理可以獲得頻譜振蕩情況的振蕩曲線圖如圖3(b)所示。
2.4 音頻文件播放時控制
對于FMOD音頻引擎庫,F(xiàn)MOD SDK函數(shù)處理方式如下:
FSOUND_Sample_Load(int index,const char *name_or_data,unsigned int inputmode,int offset,int length);
或者:FSOUND_PlaySound(int channel,F(xiàn)SOUND_SAMPLE*sptr)
其中index和channel為音頻數(shù)據(jù)標(biāo)識,通過控制音頻數(shù)據(jù)塊實現(xiàn)聲音的播放。
音頻播放文件類型可分為FMUSIC_MODULE和FSOUND_STREAM類型。其中FMUSIC_MODULE是對MOD、S3M、XM、IT、MID、RMI、SGT、FSB等后綴播放文件的處理描述,而FSOUND_STREAM是對audio file、url網(wǎng)上流媒體文件、 cd文件的描述。
為了對音頻播放模塊進(jìn)行控制并在文件播放時進(jìn)行管理,定義管理結(jié)構(gòu)如下:
typedef struct{
FMUSIC_MODULE *mod;//音頻標(biāo)示
FSOUND_STREAM *stream;//流數(shù)據(jù)音頻標(biāo)示
int channel;
} SONGTYPE;
音頻文件加載" title="加載">加載及播放形式如下:
WideCharToMultiByte(CP_ACP,0,strFullPath,-1,s,256,NULL,NULL);//轉(zhuǎn)換
FMUSIC_MODULE mod=FMUSIC_LoadSong(s);
//加載音頻文件
FMUSIC_PlaySong(mod);//播放音頻數(shù)據(jù)
播放過程中暫停的方法:
FMUSIC_SetPaused(mod,!FMUSIC_GetPaused(mod));
停止播放的方法:
FMUSIC_FreeSong(mod);
3 音頻播放及其性能分析
通過以上分析和關(guān)鍵技術(shù)實現(xiàn),得到如圖4所示的音頻播放界面,包括打開文件、播放停止、信息顯示等功能。
為了測試在PPC上使用FMOD進(jìn)行軟播放音頻的性能,隨機從網(wǎng)上獲取一些不同格式的音頻文件進(jìn)行測試:以100ms為周期對CPU使用率進(jìn)行采樣,然后把整個時間內(nèi)的CPU使用率平均,可由以下公式計算得到:
其中:xi表示各個時刻的CPU使用百分比。
表1描述了PPC模擬器上的測試結(jié)果,其中宿主機為賽揚1.2,內(nèi)存392MB。從實際的CPU使用消耗來看,效果非常好。對于時間反應(yīng)要求較高的應(yīng)用(例如游戲、仿真等),音頻播放也是完全可以勝任的。
本文討論了在嵌入式PPC上進(jìn)行音頻播放的方法,并對開發(fā)中存在的問題提出了解決方案。作為PPC上的音頻開發(fā)研究,可以應(yīng)用到其他PPC應(yīng)用中,為PPC上多媒體開發(fā)提供借鑒。當(dāng)然,如何把當(dāng)前流行的多媒體與嵌入式系統(tǒng)更好地結(jié)合,有待于進(jìn)一步研究。
參考文獻(xiàn)
1 杜 劍,熊建設(shè),邵敏等.基于嵌入式系統(tǒng)的音頻點播系統(tǒng)[J].重慶郵電學(xué)院學(xué)報,2005;(17)
2 亓中瑞,高振明.MP3播放系統(tǒng)的設(shè)計與實現(xiàn)[J].山東電子,2003;(3)
3 FMOD組織網(wǎng)站.http://www.fmod.org/[DB/OL]
4 Kruchten P B.The 4+1 view model of architecture.IEEE Software[J],1995;12(6)