《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > Java 垃圾回收新算法芻探
Java 垃圾回收新算法芻探
來源:微型機與應(yīng)用2011年第2期
張鵬飛1, 錢 敏2
(1. 中國礦業(yè)大學 計算機科學與技術(shù)學院, 江蘇 徐州 221116; 2. 中國礦業(yè)大學 管理
摘要: 由Java語言與C/C++對象在內(nèi)存管理方式的不同,引出了Java語言的優(yōu)勢技術(shù)——垃圾處理技術(shù)。通過對GC工作原理的闡述及對一些傳統(tǒng)的垃圾收集器的分析,提出了一種新的垃圾處理算法,一定程度上改善和提高了Java垃圾處理的性能。
關(guān)鍵詞: JAVA GC 垃圾回收 收集器
Abstract:
Key words :

摘   要:Java語言與C/C++對象在內(nèi)存管理方式的不同,引出了Java語言的優(yōu)勢技術(shù)——垃圾處理技術(shù)。通過對GC工作原理的闡述及對一些傳統(tǒng)的垃圾收集器的分析,提出了一種新的垃圾處理算法,一定程度上改善和提高了Java垃圾處理的性能。
關(guān)鍵詞: Java; GC; 垃圾回收; 收集器

    Java從誕生以來以其在網(wǎng)絡(luò)應(yīng)用開發(fā)上獨特的魅力以及“一次開發(fā),隨處運行”的可移植性引起了人們極大的興趣。Java與以往的高級語言如C/C++相比,在開發(fā)方面具有很大的優(yōu)勢,其中以對象內(nèi)存管理機制中的垃圾處理機制(GC)最為突出。
1 C/C++與Java對象內(nèi)存管理差別
    C/C++將內(nèi)存劃分成四部分:數(shù)據(jù)區(qū)、代碼區(qū)、棧區(qū)、堆區(qū)。Java則把內(nèi)存劃分成三部分即代碼區(qū)、棧區(qū)、堆區(qū),代碼區(qū)主要用于存放程序的代碼,棧區(qū)主要用于存放局部變量、內(nèi)部變量等中間性變量,堆區(qū)主要用來存放對象。
    C/C++中的對象內(nèi)存管理是通過語句new()/delete()或malloc()/free()進行申請和釋放的。用new()或malloc()申請內(nèi)存后,若不使用delete()或free()進行釋放,則所申請的內(nèi)存一直被占用,即使不使用也不能自動釋放,必須人為釋放,導致編程工作很繁瑣。
    Java中的對象內(nèi)存管理則改進了對內(nèi)存的釋放過程,使用new()或其他方法申請的內(nèi)存在不使用時,可以自動進行垃圾處理,釋放內(nèi)存,從而節(jié)省內(nèi)存,使內(nèi)存的使用更加高效、合理。
    Java中可以通過三種方法來銷毀對象實現(xiàn)內(nèi)存釋放,這三種方法被稱為Java銷毀對象的三把利劍:垃圾回收器;finalize方法;利用System.gc方法強制啟動垃圾回收器。
    垃圾回收是一種動態(tài)存儲管理技術(shù),它自動地釋放不再被程序引用的對象,按照特定的垃圾收集算法實現(xiàn)資源自動回收的功能系統(tǒng),會自動進行GC策略。
2 GC概述
    Java垃圾處理主要是針對堆的管理,對堆中不使用的空間進行回收處理。判斷一個對象的內(nèi)存空間是否無用的標準是:如果該對象不能再被程序中任何一個“活動的部分”所引用,此時該對象的內(nèi)存空間已經(jīng)無用。所謂“活動的部分”,是指程序中某部分參與程序的調(diào)用,正在執(zhí)行過程中,尚未執(zhí)行完畢。
    具體以下兩例予以說明:
 實例1:
 int [][]matrix=new int [2][3];
 matrix=null;
 此例中,第一句是用new語句在堆中為數(shù)組申請了一個空間,然后用matrix來引用此空間的對象(這里數(shù)組可以理解為對象),此時這個內(nèi)存空間就是有用的。第二句是給matrix賦空值,matrix則不再引用此數(shù)組。此時,這個空間就是無用的。
 實例2:
 int [][] m1=new int[2][3];
 int [][] m2=new int[2][3];
 m1=m2;
 此例中,第一句是用new語句在堆中為數(shù)組申請了一個空間,用m1引用這個數(shù)組。第二句是用new語句在堆中為數(shù)組申請了一個空間,用m2引用這個數(shù)組。第三句是改變引用對象,把m2的引用賦給m1,則此時m1也引用m2引用的對象數(shù)組,因此,m1原來引用的數(shù)組無人引用,成為垃圾。
3 傳統(tǒng)收集器簡介
    Java依托于垃圾收集GC機制,可以自動回收垃圾即釋放堆空間,讓其他對象可以使用此部分空間。而采用了某種 GC 算法的收集器(Collector)稱之為某某垃圾收集器(Garbage Collector)。目前 Java中采用的垃圾收集器一般包括:引用計數(shù)法(Reference Counting Collector)、 Tracing算法(Tracing Collector)、Compacting算法(Compacting Collector)、Coping算法(Coping Collector)、Generation算法(Generational Collector)、Adaptive算法(Adaptive Collector)。
3.1 引用計數(shù)法
    引用計數(shù)法是唯一沒有使用根集的垃圾回收的方法,該算法使用引用計數(shù)器來區(qū)分存活對象和不再使用的對象。一般來說,堆中的每個對象對應(yīng)一個引用計數(shù)器。當每一次創(chuàng)建一個對象并賦給一個變量時,引用計數(shù)器置為1。當對象被賦給任意變量時,引用計數(shù)器每次加1,當對象出了作用域后(該對象丟棄不再使用),引用計數(shù)器減1,一旦引用計數(shù)器為0,對象就滿足了垃圾收集的條件。
    基于引用計數(shù)器的垃圾收集器運行較快,不會長時間中斷程序執(zhí)行,必須適宜地實時運行的程序。但引用計數(shù)器增加了程序執(zhí)行的開銷,因為每次對象賦給新的變量,計數(shù)器加1,而每次現(xiàn)有對象出了作用域,計數(shù)器減1。
3.2 Tracing算法
    Tracing算法是為了解決引用計數(shù)法的問題而提出,它使用了根集的概念。基于Tracing算法的垃圾收集器從根集開始掃描,識別出哪些對象可達,哪些對象不可達,并用某種方式標記可達對象,例如對每個可達對象設(shè)置一個或多個位。在掃描識別過程中,基于Tracing算法的垃圾收集也稱為標記和清除(mark-and-sweep)垃圾收集器。
3.3 Compacting算法
    為了解決堆碎片問題,基于tracing的垃圾回收吸收了Compacting算法的思想,在清除的過程中,算法將所有對象移到堆的一端,堆的另一端就變成了一個相鄰的空閑內(nèi)存區(qū),收集器會對它移動的所有對象的所有引用進行更新,使得這些引用在新的位置能識別原來 的對象。在基于Compacting算法的收集器的實現(xiàn)中,一般增加句柄和句柄表。
3.4 Coping算法
    Coping算法的提出是為了克服句柄的開銷和解決堆碎片的垃圾回收。它開始時把堆分成一個對象面和多個空閑面, 程序從對象面為對象分配空間,當對象滿了,基于Coping算法的垃圾收集就從根集中掃描活動對象,并將每個活動對象復(fù)制到空閑面(使得活動對象所占的內(nèi)存之間沒有空閑洞),這樣空閑面變成了對象面,原來的對象面變成了空閑面,程序會在新的對象面中分配內(nèi)存。
    一種典型的基于Coping算法的垃圾回收是stop-and-copy算法,它將堆分成對象面和空閑區(qū)域面,在對象面與空閑區(qū)域面的切換過程中,程序暫停執(zhí)行。
3.5 Generation算法
     stop-and-copy垃圾收集器的一個缺陷是收集器必須復(fù)制所有的活動對象,這增加了程序等待時間,這是Coping算法低效的原因。在程序設(shè)計中有這樣的規(guī)律:多數(shù)對象存在的時間比較短,少數(shù)的存在時間比較長。因此,Generation算法將堆分成兩個或多個,每個子堆作為對象的一代(Generation)。由于多數(shù)對象存在的時間比較短,隨著程序丟棄不使用的對象,垃圾收集器將從最年輕的子堆中收集這些對象。在分代式的垃圾收集器運行后,上次運行存活下來的對象移到下一最高代的子堆中,由于老一代的子堆不會經(jīng)常被回收,因而節(jié)省了時間。
3.6 Adaptive算法
    在特定的情況下,一些垃圾收集算法會優(yōu)于其他算法?;贏daptive算法的垃圾收集器就是監(jiān)控當前堆的使用情況,并將選擇適當算法的垃圾收集器。
4 GC新算法概述
  基于上述對幾種收集器算法優(yōu)缺點的對比分析,提出一種既可以滿足程序?qū)崟r性的要求,同時也能避免內(nèi)存泄漏的較完全的垃圾處理算法。
4.1算法描述
4.1.1內(nèi)存劃分

    (1)把一個堆內(nèi)存劃分成兩大塊,一塊是活躍區(qū),占堆大小的2/3,活躍區(qū)劃分成大小相同的8個塊,并且為每個塊設(shè)置一個計數(shù)器int cnt[x](x取1~8),用來記錄每塊內(nèi)存中動態(tài)分配的被引用對象總數(shù)。另一塊是保留區(qū),占堆大小的1/3,設(shè)置兩個常數(shù)min和max,分別用來表示保留區(qū)的初始大小和最大可增加到的大小。(min的值小于堆大小的1/3,max的值可以自行設(shè)置但最大值不超過堆大小的1/3)。
    (2)為堆中的每個對象設(shè)置一個標記位(標記位放在一個專用數(shù)組cnt[x](x取1~8)中)以表示其是否被引用,在對象被引用時計數(shù)器就開始動態(tài)地統(tǒng)計計數(shù),記錄本塊中被引用的對象個數(shù)。
    (3)通過比較計數(shù)器值的大小來判斷應(yīng)該掃描哪個塊,而不是利用搜索所有對象的方法。具體結(jié)構(gòu)如圖1。

4.1.2具體算法
    (1)程序開始運行,對象動態(tài)地申請堆區(qū),這時,每個塊的計數(shù)器啟動,根據(jù)引用對象的標記位情況來改變計數(shù)器的值,為1則計數(shù)器加1,8個計數(shù)器值放在數(shù)組里,并比較8個計數(shù)器值的大小,選取最大的計數(shù)器所在塊,進行掃描。
    (2)掃描出的垃圾轉(zhuǎn)移到刪除區(qū),等待被刪除。
    (3)繼續(xù)比較計數(shù)器值,但已經(jīng)進行掃描的塊不參加此后的比較,待刪除的垃圾占的空間達到min值時,垃圾器開始對活躍區(qū)壓縮內(nèi)存碎片,并且在刪除區(qū)同時開始進行垃圾刪除申請。
    (4)當刪除區(qū)的空間達到了max值時,刪除區(qū)的垃圾還沒有被刪除,這時停止活躍區(qū)的掃描,等待刪除區(qū)進行垃圾刪除。
4.2 實例分析
  看下面一段程序:
  int [][] m1=new int[2][3];
  int [][] m2=new int[2][3];
  m1=m2;
    此例中,第一句是用new語句在堆中為數(shù)組申請了一個空間,然后用matrix引用此空間的對象(這里數(shù)組可以理解為對象),此時這個內(nèi)存空間就是有用的。第二句是給matrix賦空值,matrix則不再引用此數(shù)組。此時,這個空間就是無用的。
 對于原來的算法,m1引用的數(shù)組在堆中是隨機存放的,若要查找垃圾,則會遍歷整個堆內(nèi)存,先標記,然后再清理垃圾。設(shè)耗費時間為Ta。
 m1引用的數(shù)組在堆中是隨機存放的,所以假設(shè)其放在活躍區(qū)中的cnt[x]區(qū)(x取值為0~7之一),下面分兩種情況來考慮:
    (1)最好的情況,m1原來引用的數(shù)組放在cnt1中為數(shù)組cnt[x]中最大的數(shù),則查找到這個垃圾的時間為: T8+cnt[x]。

    由此可以節(jié)省7Ta/16的時間。此新算法可以大大減少垃圾處理所需的時間。
    Java語言對垃圾的處理是利用Java的垃圾處理器自動進行的,JVM雖然沒有明確程序員必須了解垃圾處理器的過程和實質(zhì),但是,一個優(yōu)秀的Java程序員應(yīng)該掌握和熟悉垃圾處理器的工作機制,充分利用好內(nèi)存空間,減少不必要的空間浪費,從而使程序更好地運行。

參考文獻
[1] 鄧洋春,梁昔明. Java無用單元回收方式與性能分析[J].現(xiàn)代計算機(專業(yè)版), 2009(01):114-116.
[2] JONES R, LINES R.垃圾收集[M].謝之易,譯.北京:人民郵電出版社,2004.
[3] 賈曉霞,吳際,金茂忠,等.Java程序內(nèi)存泄漏綜述[J].計算機應(yīng)用研究,2006,23(09):1-3.
[4] SIERRA K. Java 2學習指南[ISBN]978-7-115-11803-5.2004(1).
[5] 歐陽辰,周欣.垃圾收集器與Java編程.http://www.ibm.com/developerworks/cn/java/l-JavaMemory
Leak2/2002.11.16.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。