《電子技術應用》
您所在的位置:首頁 > 其他 > 业界动态 > 一种Java字节码静态调整的方法及应用

一种Java字节码静态调整的方法及应用

2008-05-14
作者:蒋 凡,杨建国

  摘 要: 提出了一種改善J2ME中多維" title="多維">多維數(shù)組運算效率的方法。該方法不占用額外的內存,不需要修改虛擬機,通過靜態(tài)修改已經(jīng)編譯好的Java 字節(jié)碼提高多維數(shù)組運算效率。實驗表明,本方法比現(xiàn)有針對J2SE的多維數(shù)組運算效率解決方法更適用于J2ME環(huán)境。
  關鍵詞: Java J2ME JVM 多維數(shù)組 Java字節(jié)碼


  J2ME廣泛應用在嵌入式系統(tǒng)中,其中有不少基于多維數(shù)組的運算[1]。而Java語言的以下兩個機制是制約這類運算效率的瓶頸。
  (1)Java用包含數(shù)組的數(shù)組來存儲多維數(shù)組,而不同于CC++使用一塊連續(xù)的空間進行存儲,如圖1所示。對于一個n維數(shù)組,當需要訪問其中的某一個元素時,總共需要n+2次訪問堆中的對象。第1和第2次訪問該數(shù)組所屬類的對象和數(shù)組對象;第3到第n+1次逐級訪問代表每一維的數(shù)組對象;最后1次才能到達所需要訪問的數(shù)組元素。如果相鄰兩次訪問數(shù)組的元素不屬于同一維,則很可能導致緩存失效,從而降低運算效率。


  (2)Java中采用了嚴格的異常機制,以保證在發(fā)生異常之前的運算都遵從用戶程序。在進行多維數(shù)組訪問時,要對每一維的下標進行空指針檢查和下標越界檢查,并在有異常發(fā)生時進行相應的處理。這一機制從兩個方面影響了程序的運行效率:捕獲和處理異常需要占用大量的運算;阻止了代碼優(yōu)化,特別是影響了廣泛應用于多維數(shù)組訪問的循環(huán)代碼的優(yōu)化[2]。
  因此,需要通過改變J2ME中多維數(shù)組的存儲和訪問方式或者改變異常機制來改進J2ME程序的運行效率。
1 已有的解決方案
  目前,針對J2SE的Java多維數(shù)組來提高運算效率的方法主要有以下三種" title="三種">三種:
  (1)使用特殊類庫。這一解決方案由IBM Ninja 項目組提出[3]。該方案基于現(xiàn)有編譯和優(yōu)化技術,定義了專門用來處理多維數(shù)組運算的數(shù)據(jù)結構和函數(shù),易于實現(xiàn)且高效,但需占用額外的內存來存儲特殊類庫,并且會消耗更多時間來動態(tài)加載程序。
  (2)動態(tài)改變多維數(shù)組在內存中的存儲結構" title="存儲結構">存儲結構。該方案通過降低緩存失效率來提高程序的整體效率。其實現(xiàn)方法是在程序運行過程中監(jiān)測緩存失效率,并在需要時動態(tài)調整多維數(shù)組在內存中的存儲結構,使得相鄰的兩次多維數(shù)組操作所涉及的數(shù)組元素在內存中處于相鄰的物理空間。調整算法已由F.Li,P給出[4]。這一方案需要額外的內存空間來完成存儲結構動態(tài)調整,同時需要操作系統(tǒng)對緩存失效率進行實時監(jiān)測,實施起來有一定困難。
  (3)修改Java虛擬機。該方案通過修改Java虛擬機來提高效率。其策略是去除多維數(shù)組操作中進行的指針有效性檢查和數(shù)組下標越界檢查[5]。由于不同的嵌入式系統(tǒng)所使用的Java虛擬機不同,所以需要對不同系統(tǒng)上的Java虛擬機做相應的修改。
  可見,以上三種解決方案對于J2SE來說都是可行且高效的,但對于J2ME而言就不是這樣。本文提出了一種在可行性和高效性之間折衷的解決方案,并實現(xiàn)了一種靜態(tài)調整Java字節(jié)碼的工具原型。
2 靜態(tài)調整方法及實現(xiàn)
  本文提出的方法旨在降低緩存失效率,避免JVM對空引用的檢測和異常處理,從而提高多維數(shù)組運算效率。通過靜態(tài)調整Java字節(jié)碼,使其被JVM裝載之后,使多維數(shù)組能保存在一塊連續(xù)的內存區(qū)域。這樣,對多維數(shù)組的引用就在一個循環(huán)過程中始終處于緩存內,不需要在每次使用時進行空引用和異常檢測。
2.1 調整規(guī)則
  首先聲明用同等容量及類型的1維數(shù)組代替原多維數(shù)組,從而在運行時獲得JVM堆中一塊連續(xù)的存儲空間。同時修改所有對多維數(shù)組的引用。當把一個d維數(shù)組轉化為一個1維數(shù)組時,對數(shù)組中的每一個元素需要使用2×d個變量來訪問:1個變量A包含該數(shù)組的引用;一個(d-1)維的向量w記錄原數(shù)組前(d-1)維的權值,向量w中的第m個值標明原多維數(shù)組第m維空間的大小;另外一個d維向量i,記錄所訪問元素在原多維數(shù)組中的下標值。令M代表指向原多維數(shù)組的引用,wm代表向量w中的第m個元素值,in代表下標向量i的第n個值,則M所指向的多維數(shù)組中的一個元素可以通過如下表達式進行訪問:
  M[i0][i1]...[id]=A[w0*i0+w1*i1+...+wd-1*id-1+id]
2.2 調整過程
  首先建立一個Opreation結構鏈表OpList,用來記錄對字節(jié)碼進行調整的位置和具體操作。Operation 結構定義如下:
  Structure Operation{
  filed1 index;//本操作所處的字節(jié)碼字節(jié)地址
  filed2 operation content;//具體操作定義
  }
  分三部分掃描字節(jié)碼文件,將每一次調整操作的位置和操作內容記錄在OpList中。掃描結束之后,根據(jù)OpList中的內容修改字節(jié)碼文件。
  (1)處理常量池。將多維數(shù)組類名定義字符串修改為1維數(shù)組類名定義形式。算法如下:
  For each tag in constantpool Do
  If(tag is CONSTANT_Utf8_info) and″[( [ )+″appears in tag.length*2 bytes Then
????? //如果出現(xiàn)連續(xù)多個′[′的常量說明,則為對多維數(shù)組的說明,作相應處理
???? //將constantpool index和new Operation儲存到OpList;記錄change″[( [ )*″to ″[″的操作;
  End If
  End For
  (2)處理類方法內部多維數(shù)組初始化和調用過程。對于初始化操作,首先計算數(shù)組容量,生成相同容量和類型的一維數(shù)組初始化代碼,代替多維數(shù)組初始化代碼;對多維數(shù)組元素的引用,首先根據(jù)2.1節(jié)所示調整規(guī)則重新計算數(shù)組元素下標,然后調整本次引用所處的外層循環(huán),并修改相關代碼屬性,包括length、ine_number_table_
  length、max_locals和code_length等。算法如下:
  For each command in one method section Do
   If 是多維數(shù)組初始化命令 Then
     計算數(shù)組容量,生成容量計算指令;
     生成相應的1維數(shù)組初始化指令;
   End If
   If 訪問多維數(shù)組元素 Then
   計算對應的一維數(shù)組下標,生成計算指令;
   修改外層循環(huán)代碼;
   End If
   生成包含操作位置和內容的Operation結構,并插入OpList;
  End For
  If 修改了本方法代碼 Then
   記錄屬性變化(length、line_number_table_length、max_locals和code_length等);
  End If
  (3)根據(jù)記錄的調整操作對字節(jié)碼文件進行修改。算法如下:
  int startIndex=0;
  For each opration in OpList do
   復制srcFile中startIndex至operation.index字節(jié)到newFile中;
   根據(jù)opration.content生成調整代碼,并寫入到newFile中;
   startIndex=operation.index;
  End For
2.3 應用舉例
  為使說明簡單明了,以程序1為例說明整個調整過程。程序1展示了按列逐個訪問2維矩陣元素的代碼。
  首先處理字節(jié)碼常量池部分。用一個一維數(shù)組定義取代原有的多維數(shù)組定義。處理前后字節(jié)碼如代碼片斷1和代碼片斷2所示。
  程序1
  int[][]x=new int[100][100];
  int tmp=0;
  for(int i=0;i<100;i++){
   for(int j=0;j<100;j++){
     tmp+-x[j][i];
   }
  }
  代碼片斷1:
  01 00 01 78         const#6=Asciz x;
  01 00 03 5B 5B 49     const#7=Asciz [[I;
  0C 00 06 00 07       const#16=NameAndType #6:#7;
  代碼片斷2:
  01 00 01 78        const#6=Asciz x;
  01 00 02 5B 49       const#7=Asciz [I;
  0C 00 06 00 07       const#16=NameAndType #6:#7;
  然后處理數(shù)組初始化。使用1維數(shù)組初始化過程取代原多維數(shù)組初始化。包括數(shù)組容量計算、去除冗余代碼、修改相關函數(shù)和代碼屬性。處理前后字節(jié)碼如代碼片斷3和代碼片斷4。
  代碼片斷3:
  10 64 bipush 100
  10 64 bipush 100
  c5 00 02 02 multianewarray #2,2;
  b5 00 03 putfield #3;
  代碼片斷4:
  11 27 10 sipush 10000
  bc 0a newarray int
  b5 00 02 putfield #3;
  最后處理多維數(shù)組實例的引用。在方法內部,對多維數(shù)組的引用,只需修改其下標計算過程和由此引起的循環(huán)指標變化。代碼片斷5和代碼片斷6分別列出了程序1所示代碼中兩層for循環(huán)的字節(jié)碼。
  代碼片斷5:
  10 64        bipush 100
  a2 00 2d       if_icmpge 45
  03          iconst_0
  3d          istore_2
  1c          iload_2
  10 64        bipush 100
  a2 00 27       if_icmpge 39
  2a          aload_0
  59 dup
  代碼片斷6:
  10 64         bipush 100    3e      istore_3
  02 00 35       if_icmpge 53   ld      iload_3
  1c          iload_2      10 64     bipush 100
  10 64         bipush 100    a2 00 2f   if_icmpge 47
  64          isub       84 01 64   iinc 1,100
  3c          istore_1     2a      aload_0
  03          iconst_0     59      dup
  經(jīng)處理,字節(jié)碼大小和整體結構沒有發(fā)生變化,且提高了運算效率。
3 實驗及結果分析
  本節(jié)的所有結果都是基于K虛擬機(KVM)得出的。表1列出了所用的幾個測試基準及相關參數(shù)。這些基準測試廣泛應用于與Java數(shù)值計算相關的性能測試中,具有一定的權威性。為使其在KVM上正確運行,首先對原基準測試程序進行簡單調整,然后使用SUN公司提供的J2ME Wireless Toolkit 2.2進行編譯,得到初始字節(jié)碼,再使用字節(jié)碼靜態(tài)調整工具對這些字節(jié)碼進行處理得到最后的執(zhí)行代碼,最后在KVM上分別運行。測試結果" title="測試結果">測試結果如表2所示。


  結果表明,通過使用本文所提出的Java字節(jié)碼靜態(tài)調整策略,在不改變原程序運行環(huán)境的情況下,明顯提高了基于多維數(shù)組的Java程序執(zhí)行效率。
  本文提出了一種通過靜態(tài)修改Java字節(jié)碼中的多維數(shù)組運算指令和相關指令以及屬性的方法,來提高基于多維數(shù)組運算的J2ME應用程序" title="應用程序">應用程序的運行效率。該方法不占用額外的內存,不需要Java虛擬機和其他類庫支持。基準測試結果表明,該方法明顯提高了程序效率,比較適用于J2ME應用程序。
參考文獻
1 F Catthoor,S Wuytack,E E Greef et al.Custom memory management methodology-exploration of memory organization for embedded multimedia system design kluwer.June 1998
2 Mikel Lujan,John R Gurd,T L Freeman et al.Elimination of java array bounds checks in the presence of indirection. Technical Report CSPP-13,Department of computer science, university of manchester,F(xiàn)ebruary 2002
3 J E Moreira,S P Midki_,M Gupta et al.The Ninja project.Communications of the ACM,2001;44(10)
4 F Li,P Agrawal,G Eberhardt et al.Improving memory performance of embedded Java applications by dynamic layout modifications.In:18th International Parallel and Distributed Processing Symposium(IPDPS′04)-Workshop 5,2004:159
5 R Bodik,R Gupta,V Sarkar.ABCD:Eliminating array bounds checks on demand.In:Proceedings of the ACM Conference on Programming Language Design and Implementation,2000:321

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。

相關內容