《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 網(wǎng)格環(huán)境下二叉樹后序遍歷的一種并行算法
網(wǎng)格環(huán)境下二叉樹后序遍歷的一種并行算法
張 飛1,2,華 安1,2,曾國(guó)蓀1,2
1.同濟(jì)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)系,上海200092;2.國(guó)家高性能計(jì)算機(jī)工程技術(shù)中心同濟(jì)分中心,上海
摘要: 本文運(yùn)用網(wǎng)格環(huán)境下的并行計(jì)算模型G-PRAM來研究二叉樹的后序遍歷問題,提出了二叉樹后序遍歷的一種并行算法,并給出示例和說明。
Abstract:
Key words :

摘   要: 本文運(yùn)用網(wǎng)格環(huán)境下的并行計(jì)算模型G-PRAM來研究二叉樹后序遍歷問題,提出了二叉樹后序遍歷的一種并行算法,并給出示例和說明。
關(guān)鍵詞: 網(wǎng)格環(huán)境  二叉樹  后序遍歷  并行算法

  二叉樹[1]是一種重要的數(shù)據(jù)結(jié)構(gòu),它是n(n≥0)個(gè)結(jié)點(diǎn)的有限集。它或者是空集(n=0),或者由一個(gè)根結(jié)點(diǎn)和兩棵互不相交的分別稱為這個(gè)根的左、右子樹的二叉樹組成。二叉樹的遍歷可以分為三種:一種是先序遍歷,即先訪問二叉樹的根結(jié)點(diǎn),然后先序遍歷左子樹,最后先序遍歷右子樹;第二種是中序遍歷,即先中序遍歷左子樹,再訪問二叉樹的根結(jié)點(diǎn),最后中序遍歷右子樹;第三種是后序遍歷,即先后序遍歷左子樹,再后序遍歷右子樹,最后訪問二叉樹的根結(jié)點(diǎn)。最常見的實(shí)現(xiàn)按照遍歷過程訪問結(jié)點(diǎn),讓每個(gè)結(jié)點(diǎn)被訪問且僅被訪問一次,這種方式稱為串行算法。但是,可以換個(gè)角度來研究二叉樹的遍歷問題,即從串行算法中以二叉樹的結(jié)點(diǎn)為重點(diǎn)考察對(duì)象轉(zhuǎn)變?yōu)橹攸c(diǎn)研究二叉樹的邊的遍歷問題[2][4]。當(dāng)進(jìn)行二叉樹的一次遍歷時(shí)實(shí)際也遍歷了二叉樹的所有邊,而且每條邊遍歷了兩次。一次是從雙親結(jié)點(diǎn)到子結(jié)點(diǎn),另一次則是從子結(jié)點(diǎn)到雙親結(jié)點(diǎn)。如果將每條邊變成兩條有向邊,一條有向邊對(duì)應(yīng)向下的遍歷,另一條有向邊對(duì)應(yīng)向上的遍歷,則遍歷二叉樹的結(jié)點(diǎn)問題變成了一個(gè)遍歷二叉樹的邊的問題。
  因?yàn)榫W(wǎng)格環(huán)境具有一般的并行環(huán)境所不具有的強(qiáng)處理能力,所以可以給每條邊分配一個(gè)獨(dú)立的處理單元(單處理器的網(wǎng)格節(jié)點(diǎn)或者多處理器網(wǎng)格節(jié)點(diǎn)的一個(gè)處理器)進(jìn)行處理,利用多個(gè)處理單元同時(shí)對(duì)所有的邊進(jìn)行處理,從而并行實(shí)現(xiàn)網(wǎng)格環(huán)境下的二叉樹后序遍歷。
1  網(wǎng)格環(huán)境下的G-PRAM模型
  由Fortune和Wyllie形式化的PRAM[5]模型是一個(gè)理想化的并行計(jì)算模型,被廣泛用來評(píng)估并行算法的理論性能。PRAM的思想是假設(shè)一個(gè)共享存儲(chǔ)多處理機(jī)系統(tǒng)是由一個(gè)具有無限存儲(chǔ)容量的共享存儲(chǔ)器以及可對(duì)它進(jìn)行訪問的許多處理機(jī)所組成的系統(tǒng)。并行算法的設(shè)計(jì)者可以把處理器的能力看成是無限的。一個(gè)PRAM由一個(gè)控制單元、全局內(nèi)存和一組處理器集合組成。每個(gè)處理器有其自己的私有內(nèi)存,所有處理器執(zhí)行相同的指令,但每個(gè)處理器處理的數(shù)據(jù)不同。PRAM模型有四種,不同之處主要在于它們處理讀寫沖突的方式有差異,包括:互斥讀互斥寫(Exclusive Read,Exclusive Write,EREW PRAM),并行讀互斥寫(Concurrent Read,Exclusive Write,CREW PRAM),互斥讀并行寫(Exclusive Read,Concurrent Write,ERCW PRAM),并行讀并行寫(Concurrent Read,Concurrent Write,CRCW PRAM)。網(wǎng)格環(huán)境往往由相當(dāng)多的網(wǎng)格結(jié)點(diǎn)組成,這些結(jié)點(diǎn)有的是多處理器的高性能計(jì)算結(jié)點(diǎn),有的是高容量的數(shù)據(jù)結(jié)點(diǎn),并且往往有一個(gè)性能不錯(cuò)且容量也很大的控制結(jié)點(diǎn)。因此提出相應(yīng)的G-PRAM模型。G-PRAM可以看作是一般PRAM的現(xiàn)實(shí)化。
  定義1 一個(gè)G-PRAM由網(wǎng)格環(huán)境下的一個(gè)控制結(jié)點(diǎn)、一個(gè)全局?jǐn)?shù)據(jù)結(jié)點(diǎn)和一組計(jì)算結(jié)點(diǎn)集合組成。每個(gè)網(wǎng)格計(jì)算結(jié)點(diǎn)有其自己的私有內(nèi)存,所有網(wǎng)格計(jì)算結(jié)點(diǎn)的各個(gè)處理器執(zhí)行相同的指令,但每個(gè)處理器處理的數(shù)據(jù)不一樣。相應(yīng)的G-PRAM也有4種方式:EREW G-PRAM、CREW G-PRAM、ERCW G-PRAM、CRCW G-PRAM。
2  并行實(shí)現(xiàn)二叉樹的后序遍歷
2.1 算法過程說明
  這里的算法采用并行讀互斥寫(CREW G-PRAM),算法在實(shí)現(xiàn)中對(duì)每個(gè)二叉樹結(jié)點(diǎn)保存結(jié)點(diǎn)的雙親、左孩子和右孩子,利用這三個(gè)參數(shù)來描述一個(gè)二叉樹結(jié)點(diǎn)在二叉樹中的相對(duì)位置。
對(duì)于如圖1所示的二叉樹,其數(shù)據(jù)結(jié)構(gòu)描述如表1所示。

  下面分析本文中的算法步驟。
2.1.1 改造二叉樹并構(gòu)造單鏈表
  首先可以將二叉樹改造成一個(gè)對(duì)應(yīng)的有向圖。方法是將二叉樹的每條無向邊改成一條向下和另一條向上的有向邊,結(jié)點(diǎn)不變。如圖1的二叉樹可以改造成如圖2的有向圖。

  根據(jù)改造后的有向圖構(gòu)造單鏈表的過程就是在該有向圖中尋找后繼邊的過程,按照后序遍歷的思想,所有的處理器同時(shí)處理分配給它的一條邊的后繼邊的問題,最終得到由全部有向邊構(gòu)成的一個(gè)單鏈表。單鏈表的每個(gè)元素對(duì)應(yīng)于改造后的有向圖中的一條有向邊。
  設(shè)分配給處理器P[(i,j)]處理的有向邊是(i,j),即該邊從結(jié)點(diǎn)i指向j,則尋找有向邊(i,j)后繼邊的問題可以根據(jù)有向邊(i,j)的不同類型分別處理。
  (1)PARENT(i)=j,說明邊(i,j)是一條向上邊,即從一個(gè)結(jié)點(diǎn)指向它的雙親結(jié)點(diǎn)。從數(shù)據(jù)結(jié)構(gòu)的概念中可以得到以下結(jié)論,一條向上的邊(i,j)在二叉樹中的相對(duì)位置可以有三種情況:①結(jié)點(diǎn)j有右孩子結(jié)點(diǎn),如圖3(a)所示。則根據(jù)后序遍歷的思想可得邊(i,j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的右孩子結(jié)點(diǎn)構(gòu)成的邊;②結(jié)點(diǎn)i沒有右兄弟結(jié)點(diǎn),而結(jié)點(diǎn)j有雙親結(jié)點(diǎn),如圖3(b)所示。若根據(jù)后序遍歷的思想可得邊(i,j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的雙親結(jié)點(diǎn)(parent)構(gòu)成的邊;③結(jié)點(diǎn)i既沒有兄弟結(jié)點(diǎn),同時(shí)也沒有雙親結(jié)點(diǎn),如圖3(c)所示,說明已經(jīng)回到了根結(jié)點(diǎn)處,邊(i,j)沒有后繼邊。但為了方便起見,假設(shè)存在一條后繼邊,從結(jié)點(diǎn)j到它自身。


  (2)PARENT(i)≠j,也就是邊(i,j)是從雙親結(jié)點(diǎn)到它的孩子的向下的邊。
  同理,從數(shù)據(jù)結(jié)構(gòu)的概念中可以得出這樣的結(jié)論,即一條向下的邊(i,j)在二叉樹中的位置可以有如下情況:①結(jié)點(diǎn)j有左孩子結(jié)點(diǎn)(不管有無右孩子結(jié)點(diǎn)),如圖4(a)所示。根據(jù)后序遍歷的思想可知,邊(i,j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的左孩子結(jié)點(diǎn)構(gòu)成的邊。②結(jié)點(diǎn)j沒有左孩子,但有右孩子,如圖4(b)所示。根據(jù)后序遍歷的思想可得,邊(i,j)的后繼邊是從結(jié)點(diǎn)j指向結(jié)點(diǎn)j的右孩子結(jié)點(diǎn)構(gòu)成的邊。③結(jié)點(diǎn)j沒有孩子結(jié)點(diǎn),即結(jié)點(diǎn)j是葉子結(jié)點(diǎn),如圖4(c)所示。則根據(jù)后序遍歷的思想可得,邊(i,j)的后繼邊是結(jié)點(diǎn)j指向結(jié)點(diǎn)i的向上邊。

2.1.2 給單鏈表中的每個(gè)元素賦權(quán)值0或1
  此過程也是所有的處理器同時(shí)對(duì)分配給它的一個(gè)元素賦權(quán)值(前面構(gòu)造的單鏈表中的元素)。根據(jù)后序遍歷的思想,對(duì)于二叉樹的一個(gè)結(jié)點(diǎn)i(根結(jié)點(diǎn)例外,必須作不同處理),如果一條向下遍歷的邊(i,j)從結(jié)點(diǎn)i出發(fā),則說明正在尋找從該結(jié)點(diǎn)i出發(fā)的后繼邊,結(jié)點(diǎn)i沒有被訪問;如果一條向上遍歷的邊(i,j)從結(jié)點(diǎn)i出發(fā),則說明剛訪問完結(jié)點(diǎn)i。將單鏈表中對(duì)應(yīng)向上邊的元素賦權(quán)值1(表示遍歷向上邊時(shí)增加了一個(gè)被訪問結(jié)點(diǎn)),對(duì)應(yīng)向下邊的元素賦權(quán)值0(表示遍歷向下邊時(shí)未增加被訪問結(jié)點(diǎn)),對(duì)應(yīng)根結(jié)點(diǎn)的環(huán)形邊元素也賦權(quán)值0(特殊處理)。
2.1.3 計(jì)算單鏈表中各元素的位序
  單鏈表中每個(gè)元素需要分配一個(gè)處理器去計(jì)算其位序。一棵有N個(gè)結(jié)點(diǎn)的二叉樹具有(N-1)條無向邊。由于我們將每條無向邊轉(zhuǎn)換成一條向上邊和一條向下邊,所以它共有2(N-1)條邊,這意味著單鏈表中有2(N-1)個(gè)元素。所以,需要2(N-1)個(gè)處理器來計(jì)算單鏈表中元素的位序。利用計(jì)算單鏈表位序的后綴和算法可以算出單鏈表中每個(gè)元素的位序[6]。
2.1.4 求權(quán)值為1的元素的相應(yīng)結(jié)點(diǎn)的遍歷順序號(hào)
  由于權(quán)值為1(向上的邊)的元素所代表的邊都是向上的邊(不妨設(shè)該邊為(i,j)),即結(jié)點(diǎn)i在邊(i,j)遍歷時(shí)被訪問,而結(jié)點(diǎn)j還未被訪問。因此,用單鏈表中權(quán)值為1的元素的位序表示它所代表的邊(i,j)中結(jié)點(diǎn)i的位序,從而可以得到二叉樹中全部結(jié)點(diǎn)的位序。結(jié)點(diǎn)的位序是結(jié)點(diǎn)被訪問的先后順序的逆序。只要用結(jié)點(diǎn)個(gè)數(shù)N減去每個(gè)結(jié)點(diǎn)的位序就可以得到每個(gè)結(jié)點(diǎn)的后序遍歷順序號(hào)。與前幾步一樣,這里也是一個(gè)處理器計(jì)算一個(gè)結(jié)點(diǎn)的順序號(hào),多個(gè)處理器并行工作,最后,得到一棵二叉樹的后序遍歷的結(jié)點(diǎn)順序。
2.2 算法示意代碼
  算法描述如下:
  int n;    //二叉樹的結(jié)點(diǎn)個(gè)數(shù)
  int parent[n];   //父結(jié)點(diǎn)數(shù)組
  int lchild[n];   //左孩子結(jié)點(diǎn)數(shù)組
  int rchild[n];   //右孩子結(jié)點(diǎn)數(shù)組
  int succ[(n,n)];  //后繼邊數(shù)組
  int position[(n,n)];  //鏈表元素的位序數(shù)組
  int postnode[n];  //結(jié)點(diǎn)順序號(hào)數(shù)組
  PostOrder(bitree *t)
        //P[(i,j)]是處理對(duì)應(yīng)邊(i,j)的一個(gè)處理器,共2(n-1)個(gè)
  {
  forall P[(i,j)] do  //構(gòu)造單鏈表
  {
      if(lchild[j]==i)
      { if(rchild[j]!=null)
           succ[(i,j)]=(j,j.rchild);
     else     if(parent[j]!=null)
         succ[(i,j)]=(j,,j.parent);
       else{
         succ[(i,j)]=(j,j);
         postnode[j]=0;//j是根結(jié)點(diǎn)
   }//else
  }//if
  else       if(rchild[j]==i)
         {   if(j.parent!=null)
              succ[(i,j)]=(j,j.parent);
         else{
              succ[(i,j)]=(j,j);
              postnode[j]=0;//j是根結(jié)點(diǎn)
         }//else
         }//if
     else     if(parent[j]==i)
         {   if(lchild[j]!=null)
              succ[(i,j)]=(j,j.lchild);
        else if(rchild[j]!=null)
               succ[(i,j)]=(j,j.rchild);
           else succ[(i,j)]=(j,i);
         }//if
           //給單鏈表中的每個(gè)元素賦權(quán)值
  if(parent[i]==j)
     position[(i,j)]=1;
  else
        position[(i,j)]=0;
                                   //計(jì)算單鏈表中元素的位序
        where 0≤k<log(n-1)+1 do
        { position[(i,j)]=position[(i,j)]+position[succ[(i,j)]];
       succ[(i,j)]=succ[succ[(i,j)]];
     }//for
      if(parent[i]==j)     //求結(jié)點(diǎn)的后序遍歷順序號(hào)
      postnode[i]=postion[(i,j)];
       }//forall
  }
3  結(jié)束語(yǔ)
  以圖1所示的二叉樹為例,按照上述算法構(gòu)造的單鏈表(帶權(quán)值)如圖5所示。表2為二叉樹單鏈表的位序。


  從表2中選出權(quán)值為1的邊(D,B)、(B,A)、(E,C)、(G,F(xiàn))、(F,C)、(C,A),所以結(jié)點(diǎn)D、B、E、G、F、C、A的位序就是6、5、4、3、2、1、0。即后序遍歷順序號(hào)是:1、2、3、4、5、6、7,可得出后序遍歷的順序是D、B、E、G、F、C、A。


  一棵有N個(gè)結(jié)點(diǎn)的二叉樹具有(N-1)條無向邊。由于要將每條無向邊轉(zhuǎn)換成一條向上邊和一條向下邊,所以它共有2(N-1)條有向邊。因此,該算法需要2(N-1)個(gè)網(wǎng)格處理單元(處理器),而網(wǎng)格計(jì)算技術(shù)的發(fā)展為并行算法的實(shí)現(xiàn)提供了環(huán)境的支持。在本算法中求單鏈表中元素的位序的計(jì)算時(shí)間復(fù)雜度為O(logN),而算法的其余部分的計(jì)算時(shí)間是常數(shù),所以算法的復(fù)雜度為O(logN)。
參考文獻(xiàn)
1   嚴(yán)蔚敏,吳偉民.數(shù)據(jù)結(jié)構(gòu)(C語(yǔ)言版).北京:清華大學(xué)出版社,1997
2   Tarjan R E,Vishkin U.An efficient parallel biconnectivity algorithm.SIAM Journal of Computer,1985;1(14)
3   Foster I.The Grid:A New Infrastructure for 21st Century  Science.Physics Today,2002;55(2)
4   熊家軍,岳大為,李肯立.基于SIMD-SM模型的樹的后根遍歷并行算法.計(jì)算機(jī)工程與應(yīng)用,2002;38(06)
5   Wilkinson B,Allen M.Parallel programming: techniques and applications using networked workstation and parallel  computers.Prentice Hall Inc,1999
6   Karp R M,Ramachandran V.Parallel Algorithms for Shared-Memory Machines.Handbook of Theoretical Computer Science,vol A,MIT Press,1990

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。