《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > D2D網絡中基于博弈論的時隙分享合作策略研究
D2D網絡中基于博弈論的時隙分享合作策略研究
2018年電子技術應用第6期
張 闖1,邵 坦2,王慧武1
1.哈爾濱電工儀表研究所有限公司,黑龍江 哈爾濱150028;2.河南許繼儀表有限公司,河南 許昌461000
摘要: 為了使D2D網絡中從屬于不同用戶的終端進行合作通信,提出了一種基于博弈論的時隙分享合作策略。首先,使互為中繼的終端通過分享時隙的方式建立合作;其次,采用博弈論中的納什談判方法對終端時隙分享問題進行分析,并通過拉格朗日乘數法求得終端以多大時隙中繼彼此數據,解決了終端如何合作的問題;最后,給出了終端合作的截止條件,解決了終端何時合作的問題。仿真實驗表明,與直傳方式相比,終端采用合作傳輸策略能夠有效地提升能量效率。
中圖分類號: TN915.9;TP393.01
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.174033
中文引用格式: 張闖,邵坦,王慧武. D2D網絡中基于博弈論的時隙分享合作策略研究[J].電子技術應用,2018,44(6):80-84.
英文引用格式: Zhang Chuang,Shao Tan,Wang Huiwu. A time slot sharing cooperation strategy based on game theory in D2D networks[J]. Application of Electronic Technique,2018,44(6):80-84.
A time slot sharing cooperation strategy based on game theory in D2D networks
Zhang Chuang1,Shao Tan2,Wang Huiwu1
1.Harbin Research Institute of Electrical Instruments Co.,Ltd.,Harbin 150028,China; 2.Henan XJ Instrument Co.,Ltd.,Xuchang 461000,China
Abstract: In order to promote the devices belonging to different users to participate in cooperative communication in D2D networks, a time slot sharing cooperation strategy based on game theory is proposed. At first, the cooperative communication between devices which help each other to relay data is established based on sharing time slots. Secondly, the time slot sharing problem is analyzed by using Nash bargaining method of game theory. Meanwhile, the length of time slot which is used to relay the other devices is obtained by adopting Lagrange multiplier method. Thus, the problem that the devices how to cooperate is solved. Finally, the cut-off conditions of devices cooperation is derived, and the problem that devices when to cooperate is solved. Simulation results show that,compared with the direct transmission mode, the proposed strategy can improve energy efficiency of the devices effectively.
Key words : D2D networks;time slot sharing;game theory;Nash bargaining

0 引言

    終端直通(Device to Device,D2D)技術通過距離較近的兩個設備之間直接進行數據傳輸,能夠帶來信道增益、跳數增益、復用增益等好處,從而達到減輕網絡業(yè)務負載、降低移動終端能耗、提升移動終端電池壽命以及提升系統(tǒng)頻譜效率的目的[1-2]。因此,D2D通信技術被廣泛認為是5G通信系統(tǒng)的關鍵技術之一[3]。

    目前,關于D2D通信技術的研究主要集中在D2D通信鄰居節(jié)點發(fā)現(xiàn)機制、D2D通信會話建立、D2D通信干擾協(xié)調及D2D通信傳輸模式選擇等方面[4-5]。但這些研究大多是在終端自愿合作的前提下進行的,當終端從屬于不同的用戶,用戶為了節(jié)省終端的通信資源往往表現(xiàn)出“自私”的特性而不進行合作。為了促使網絡中的“自私”節(jié)點進行合作,激勵“自私”節(jié)點合作的機制研究受到了廣泛關注。文獻[6]針對一個節(jié)點互為中繼的網絡模型,提出了一種基于交換帶寬資源的激勵合作機制,作者通過合作博弈理論解決了兩個節(jié)點相互合作時以多大帶寬中繼對方數據問題。文獻[7]在文獻[6]的基礎上,提出了一種新的基于Kalai-Smorodinsky談判解的激勵合作方法。文獻[8]采用合作博弈理論解決了兩個對等用戶采用交換功率資源進行合作時,以多大功率轉發(fā)彼此數據的問題。文獻[9]針對一個雙向協(xié)作通信網絡,提出了一種基于Stackelberg博弈的共享功率資源的合作算法。文獻[10]采用博弈理論解決了在兩種不同網絡模型下“自私”節(jié)點的時隙和功率共享問題。

    在上述文獻中,文獻[6-7]通過交換帶寬資源在節(jié)點之間建立合作關系,但現(xiàn)在通信系統(tǒng)中頻率資源已非常稀缺,因此,本文采用時隙分享的方式在終端之間建立合作。文獻[8-10]未考慮數據傳輸中的能量效率問題。通過以上分析,本文在D2D網絡中提出一種新的基于時隙分享的合作策略,解決了終端以多少時隙中繼對方數據的問題,并最終達到提升終端能量效率的目的。

1 系統(tǒng)模型

    圖1為一對稱D2D協(xié)作通信系統(tǒng)。系統(tǒng)中,終端T1傳輸數據至D3,終端T2傳輸數據至D4。如果系統(tǒng)為蜂窩無線網絡,T1和T2代表手機或移動終端,D3=D4代表基站;如果系統(tǒng)為無線局域網,D3≠D4對應終端之間的一個Ad hoc設置,D3=D4=D則代表以D3(或D4)作為接入節(jié)點的接入網設置。本文假設D3=D4為AP,終端T1和終端T2為屬于用戶1和用戶2的終端設備。圖1中,所有節(jié)點均采用時分多址(Time Division Multiple Access,TDMA)方式分享信道,且終端的可用帶寬為W Hz。終端采用全向天線進行數據的接收和發(fā)送,終端發(fā)送的信息可以被終端接收,反之亦然。

tx1-t1.gif

    系統(tǒng)中,互為中繼的終端節(jié)點采用放大轉發(fā)(Amplify and Forward,AF)方式中繼數據,并假設每幀的時長小于信道相干時間。在每幀的傳輸過程中信道增益不變,gi,j(i,j=1,2表示終端)、gi,D、gj,D分別為終端i到終端j、終端i到接入點D和終端j到接入點D的信道增益,當接入點采用最大比合并(Maximal Ratio Combining,MRC)對接收信號進行處理時,終端i通過中繼到接入點的等效信噪比為[11]

tx1-gs1.gif

2 效用函數

2.1 效用函數的定義

    本文采用SARAYDAR C U等人提出的能量效率函數作為效用函數來衡量終端的收益,其表達式為[12]

    tx1-gs2.gif

其中,pi(i=1,2表示第i個終端)表示發(fā)射功率,Ti(pi)表示單位時間內成功傳輸的有效信息量,有效吞吐量Ti(pi)表示為:

tx1-gs3-9.gif

2.2 終端效用

    假設D2D網絡中位置相近且屬于不同用戶的兩個終端建立合作關系,圖2給出了合作終端的幀結構。其中,終端傳輸的每幀時長為T s,每幀中的符號周期為T0 s。因此,終端在一幀中傳輸的TDMA符號(時隙)數量N=T/T0。在D2D協(xié)作通信系統(tǒng)中,終端T1和終端T2互為中繼,終端T1用T12 s中繼終端T2的數據,用(T-T12)s傳輸自己的數據;終端T2用T21 s中繼終端T1的數據,用(T-T21)s傳輸自己的數據。對于終端T1來說,有時長為T21的數據會被終端T2中繼,在接入點處利用最大比合并與自己直接發(fā)送的那部分數據合并,獲得協(xié)作分集。而剩余的時長為(T-T12-T21)的信息只會被直接發(fā)送,從而無法獲得協(xié)作分集。同樣,終端T2產生的數據經歷相似的過程到達接入點。

tx1-t2.gif

    通過式(2)對效用函數的定義,如果終端T1的發(fā)射功率為p1,則終端T1的效用函數可表示為:

tx1-gs10-14.gif

3 基于博弈論的時隙分享合作策略

    上文所描述時隙分享問題的納什談判解表示方式為[14]

tx1-gs15-20.gif

    過求解上式,可得T12和T21為:

tx1-gs21-26.gif

    如果協(xié)作帶寬分配滿足上述條件,則終端T1和終端T2進行合作,否則終端T1和終端T2采用直傳策略,即T12=0,T21=0。

4 實驗結果及分析

    仿真模型由一個接入點和兩個終端組成,如圖3所示。假設接入點在原點的位置上,終端T1在X軸方向移動,其坐標為(d1,0);終端T2在y=50的直線上運動,其坐標為(d2,50)。圖3中,d1D為終端T1到接入點的距離;d2D為終端T2到接入點的距離;d12為終端T1到終端T2的距離。仿真中的其他參數設置為:每幀的時長T=5 ms,每幀中的數據I為80 bit,其中有用信息為L=64 bit,假設終端T1和終端T2的帶寬均W=1 MHz,噪聲功率N0W=5×10-15 W,終端T1和終端T2的發(fā)射功率均為0.1 W,調制方式為M-QAM,其誤碼率如式(7)所示。

tx1-t3.gif

    圖4給出了終端T1和終端T2談判能力隨γ2D變化的情況。仿真實驗中,d1D=800 m,終端T2在y=50直線上從(0,50)處開始向右移動。從圖4中可以看出,當終端T2距離接入點較近時,其與接入點之間的信噪比γ2D大于終端T1與接入點之間的信噪比γ1D,故此時終端T2到接入點的信道條件好于終端T1到接入點的信道條件,終端T2在談判中具有優(yōu)勢地位,因此,其具有更大的談判能力;反之,則終端T1的談判能力大于終端T2的談判能力。

tx1-t4.gif

    圖5給出了DCUGP隨γ2D變化的情況。當γ2D>12.63 dB時,DCUGP為零,這是因為隨著終端T2到接入點的距離變近,信噪比γ2D變大,終端T2到接入點的信道條件變好,對終端T2來說沒必要采取合作。當γ2D<-0.27 dB時,終端效用增益乘積也為零,這是因為隨著終端T2到接入點的距離變遠,終端T2到接入點的信道條件變差,合作傳輸效率變低,對終端T1來說沒有必要合作。而當-0.27 dB≤γ2D≤12.63 dB時,終端效用增益乘積大于零,說明合作給終端T1和終端T2都帶來了好處,在此情況下,終端T1和終端T2采取合作傳輸策略,本文所提策略起到了激勵合作的作用。

tx1-t5.gif

    圖6比較了終端采用合作策略的效用和U1(p1)+U2(p2)與直傳的效用和tx1-t5-x1.gif由圖6可以看出,當-0.27 dB≤γ2D≤12.63 dB時,終端采用合作策略的效用和與直傳相比有了明顯提升;當γ2D<-0.27 dB或γ2D>12.63 dB時,由于終端T1和終端T2不合作,因此合作時的效用和與直傳時的效用和相等。

tx1-t6.gif

    圖7給出了終端協(xié)作帶寬分配隨信噪比γ2D變化情況。由圖7可以看出,當γ2D<7.39 dB時γ1D2D,此時T21>T12,說明終端T2到接入點的信道條件劣于終端T1到接入點的信道條件,因此終端T2需要提供更多的帶寬換取終端T1的合作;當γ2D=7.39 dB時,此時T21=T12,說明終端T2到接入點與終端T1到接入點具有相同的信道條件,因此終端T1與終端T2具有相同的協(xié)作帶寬分配;當7.39 dB<γ2D≤12.63 dB時,此時T21<T12,說明終端T2到接入點的信道條件優(yōu)于終端T1到接入點的信道條件,因此終端T1需要提供比終端T2更多的帶寬以換取終端T2的合作;而當γ2D<-0.27 dB或γ2D>12.63 dB時,終端T1和終端T2采用直傳方式進行傳輸,T21=T12=0。

tx1-t7.gif

5 結論

    為促使D2D網絡中從屬于不同用戶的終端進行合作通信,采用合作博弈理論中的納什談判方法,使互為中繼的兩個終端通過分享時隙的方式進行合作。首先,通過適當選取效用函數以提升終端通信的能量效率,解決了終端合作的動機問題;其次,采用拉格朗日乘數法求解了終端以多大時隙中繼彼此數據,解決了終端如何合作的問題。最后,給出了終端合作的截止條件,解決了終端何時合作的問題。

參考文獻

[1] 馮大權.D2D通信無線資源分配研究[D].成都:電子科技大學,2015.

[2] KLAUS D,MIKA R,CARL W,et al.Device-to-device communication as an underlay to LTE-Advanced networks[J].IEEE Communications Magazine,2009,47(12):42-49.

[3] 錢志鴻,王雪.面向5G通信網的D2D技術綜述[J].通信學報,2017,37(7):1-12.

[4] QIAO J,SHEN X S,JON W M,et al.Enabling device-to-device communications in millimeter-wave 5G cellular networks[J].IEEE Communications Magazine,2015,53(1):209-215.

[5] FENG D Q,LU L,YI Y W,et al.Device-to-device communications in cellular networks[J].IEEE Communications Magazine,2014,52(4):49-55.

[6] ZHANG Z,SHI J,CHEN H H,et al.A cooperation strategy based on Nash bargaining solution in cooperative relay networks[J].IEEE Transactions on Vehicular Technology,2008,57(4):2570-2577.

[7] ZHANG C,ZHAO H L.A novel fair cooperation strategy based on Kalai-Smorodinsky bargaining solution for selfish cooperative relay networks[C].Proceedings of IEEE 17th International Conference on Intelligent Transportation Systems.Qingdao:IEEE,2014:2107-2112.

[8] ZHANG G,ZHANG H,ZHAO L,et al.Fair resource sharing for cooperative relay networks using Nash bargaining solutions[J].IEEE Communication Letters,2009,13(6):381-383.

[9] JANZAMIN M,PAKRAVAN M,SEDGHI H.A gametheoretic approach for power allocation in bidirectional cooperative communication[C].Proceedings of IEEE Wireless Communications and Networking Conference.Sydney:IEEE,2010:1-6.

[10] ZHANG G,YANG K,LIU P,et al.Joint channel bandwidth and power allocation game for selfish cooperative relaying networks[J].IEEE Transactions on Vehicular Technology,2012,61(9):4142-4156.

[11] KRIKIDIS I,THOMPSON J,MCLAUGHLIN S,et al.Amplify-and-forward with partial relay selection[J].IEEE Communications Letters,2008,12(4):235-238.

[12] SARAYDAR C U,MANDAYAM N B,GOODMAN D J.Pricing and power control in a multicell wireless data network[J].IEEE Journal on Selected Areas in Communications,2001,19(10):1883-1892.

[13] GOLDSMITH A.Wireless communication[M].London:Cambridge University Press,2005.

[14] NASH J.The bargaining problem[J].Econometrica,1950,28(2):155-162.



作者信息:

張  闖1,邵  坦2,王慧武1

(1.哈爾濱電工儀表研究所有限公司,黑龍江 哈爾濱150028;2.河南許繼儀表有限公司,河南 許昌461000)

此內容為AET網站原創(chuàng),未經授權禁止轉載。