《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 基于一種大數(shù)據(jù)應(yīng)用架構(gòu)的消費者行為分析
基于一種大數(shù)據(jù)應(yīng)用架構(gòu)的消費者行為分析
2014年微型機與應(yīng)用第20期
湯仁民1,王代強2
1.貴州大學(xué) 電子信息學(xué)院,貴州 貴陽 550025; 2.貴州大學(xué) 人民武裝學(xué)院,貴州 貴陽 550025
摘要: 研究了一種大數(shù)據(jù)的應(yīng)用程序框架,通過使用拓撲數(shù)據(jù)結(jié)構(gòu)、共生技術(shù)分析和馬爾科夫鏈理論來分析消費者的購買行為。首先將與消費者相關(guān)的數(shù)據(jù)轉(zhuǎn)換成一種拓撲數(shù)據(jù)結(jié)構(gòu);然后使用拓撲關(guān)系、一種共生矩陣對消費者行為進行分析,推斷出馬爾柯夫鏈模型。仿真結(jié)果證實了該理論框架的有效性。
Abstract:
Key words :

  摘  要: 研究了一種大數(shù)據(jù)的應(yīng)用程序框架,通過使用拓撲數(shù)據(jù)結(jié)構(gòu)、共生技術(shù)分析和馬爾科夫鏈理論來分析消費者的購買行為。首先將與消費者相關(guān)的數(shù)據(jù)轉(zhuǎn)換成一種拓撲數(shù)據(jù)結(jié)構(gòu);然后使用拓撲關(guān)系、一種共生矩陣對消費者行為進行分析,推斷出馬爾柯夫鏈模型。仿真結(jié)果證實了該理論框架的有效性。

  關(guān)鍵詞: 大數(shù)據(jù);消費者行為;拓撲數(shù)據(jù)結(jié)構(gòu);馬爾科夫鏈

0 引言

  隨著云技術(shù)的應(yīng)用和普及,利用“數(shù)據(jù)”對消費者細分變得更為容易,在此“數(shù)據(jù)”之下形成的“精準”傳播正日益成為廠商的得力助手。大數(shù)據(jù)在經(jīng)濟分析、災(zāi)害預(yù)報、產(chǎn)品和服務(wù)跟蹤、消費行為洞察甚至在了解股市走向等方面大有用武之地,在發(fā)達國家已經(jīng)開始普及應(yīng)用,在中國也得到越來越多的運用。

  在消費領(lǐng)域,通過數(shù)以百萬計的網(wǎng)絡(luò)傳感器和視頻監(jiān)控系統(tǒng),人們能搜索到關(guān)于消費者和供應(yīng)商的大量數(shù)據(jù)[1];各種媒體和社交網(wǎng)絡(luò)平臺中關(guān)于消費者的數(shù)據(jù)更是呈現(xiàn)指數(shù)式增長;用戶在各種社交網(wǎng)絡(luò)平臺中所生成的未經(jīng)編輯的信息,包括結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),讓人眼花繚亂。把這些海量數(shù)據(jù)統(tǒng)一稱作大數(shù)據(jù)。一般情況下,大數(shù)據(jù)具有批量、多品種、快速度三種特性[2-3]。

  另一方面,消費者行為分析是對消費者、產(chǎn)品商、運營商之間對諸如購買、節(jié)約、商標選擇等方面的關(guān)注[4]。此外,如今的消費者稱號不再是指過去單一的消費者行為,對他們的定義不再僅是買家,更是一種會引導(dǎo)電商零售企業(yè)營銷方式變遷的模式。為了分析消費者行為,獲取更多的信息是有必要的。在這個方面,對數(shù)據(jù)驅(qū)動決策作出,處理大數(shù)據(jù)已經(jīng)成為了中心角色[5]。在大數(shù)據(jù)平臺中所搜集的數(shù)據(jù)的性質(zhì)是各不相同的,為了分析這些數(shù)據(jù),僅數(shù)據(jù)的數(shù)量和性質(zhì)而言就是一個艱巨的挑戰(zhàn)[6]。本文用圖1所示的框架結(jié)構(gòu),通過數(shù)學(xué)拓撲以及與馬爾科夫鏈相結(jié)合的共生分析理論來分析這些海量數(shù)據(jù)以及如何能夠獲取有用的信息。

001.jpg

1 消費者行為分析的大數(shù)據(jù)框架

  應(yīng)用于消費者行為分析的大數(shù)據(jù)框架圖由三個功能層組成,分別是數(shù)據(jù)組織層、分析建模層、預(yù)測推理層[7-8]。在數(shù)據(jù)組織層,收集到的數(shù)據(jù)在一個動力系統(tǒng)中被組織,以至于該數(shù)據(jù)能夠被看作是一個時間序列。具體而言,假設(shè)隨機變量分別為:

  Xt:在時間t時的數(shù)據(jù)量。

  Yt:出現(xiàn)在時間間隔為[t,t+1]的新數(shù)據(jù)。

  Zt:出現(xiàn)在時間間隔為[t,t+1]的劣化數(shù)據(jù)。

  該數(shù)據(jù)流可以在一個隨機方程中建模為:

  1.png

  可以通過線性回歸馬爾科夫鏈在式(2)中獲得Xt:

  E[Yt+1|Yt]=(1-ρ)E(Y)+ρYt(2)

  通過式(1)乘以Yt+1,再取其期望,同時使t→∞,這樣能夠獲得式(3):

 ?。?-ρ)E(XY)=(1-ρ)E(X)E(Y)+ρE(Y2)-ρE(Y)(3)

  在式(1)中代入E(XY)的值,通過式(4)獲得大數(shù)據(jù)的平均量:

  4.png

  對于代表當前特別關(guān)注的變量Xt,通過方程(4)將會得出時間序列數(shù)據(jù)。經(jīng)產(chǎn)生的時間序列數(shù)據(jù),構(gòu)造出拓撲數(shù)據(jù)結(jié)構(gòu),這樣大數(shù)據(jù)能夠被存儲為所構(gòu)造的拓撲數(shù)據(jù)而不失其一般性,該優(yōu)勢是對大存儲器的需求顯著減少。同時,重要的信息能夠通過使用離散集而獲得,可以利用拓撲結(jié)構(gòu)對該種消費行為進行研究。拓撲數(shù)據(jù)結(jié)構(gòu)的基本概念是認識其數(shù)據(jù)的形狀或模式,用于發(fā)現(xiàn)數(shù)據(jù),識別其有意義的數(shù)據(jù)子集,這樣的拓撲數(shù)據(jù)結(jié)構(gòu)由滿足包含、相交和封閉性的采樣數(shù)據(jù)的子集集合而成。以下三種關(guān)鍵性的拓撲性質(zhì)使得從大數(shù)據(jù)中可能提取出具有一定價值的數(shù)據(jù):(1)無坐標性;(2)提取不同形狀下的一種客體模式的能力;(3)不失其重要特性的壓縮形狀。

  適用于上述三種特性的共生矩陣被處于分析建模層中的數(shù)據(jù)結(jié)構(gòu)所建立。按行歸一化的共生矩陣、馬爾科夫轉(zhuǎn)移概率都能被估計,同時形成了一步轉(zhuǎn)移概率矩陣P。然后平穩(wěn)分布π以及隨時間變化分布的Pt能夠通過(5)式獲得。最后這些可能性在預(yù)測推理層被用于獲取所需的特定信息。

  π=πPPt+1=Pt·P(5)

2 實驗結(jié)果



  為了說明該架構(gòu),對合成的消費者購買行為數(shù)據(jù)進行模擬。把購買消費品的時間序列數(shù)據(jù)收集起來并在表1中顯示出來,該數(shù)據(jù)包含了4種消費品和10個時間點。包含消費品的整個數(shù)據(jù)集是Xt={a,b,c,d},拓撲T被定義為Xt的子集集合,這樣T包含一個空集和整個集,T中的兩個集合并一定被包含在T中,且T中任何兩個集合的交叉點也必須被包含在T中,這樣包含的拓撲關(guān)系被用于建立處于拓撲T中數(shù)據(jù)集之間的共生矩陣。相應(yīng)的共生矩陣如表2所示。通過共生矩陣行歸一化能夠得到一步轉(zhuǎn)移概率矩陣P。當t=2,3,4,…時,通過計算Pt能夠獲得t步轉(zhuǎn)移概率。在一般情況下,平衡狀態(tài)在t的一個有限值內(nèi)達到。因此,當t=1,2,3,…時,通過繪制相應(yīng)的t步概率獲得該種趨勢圖。最后,必要的信息能夠通過圖2所示的消費者趨勢圖推導(dǎo)出。在圖2中,水平線表示時間點,垂直線表示購買成對商品的模式。其中大數(shù)據(jù)分析最重要的方面之一便是通過解碼圖2中被編碼的定量信息和定性信息以顯示其結(jié)構(gòu)和模式。通過圖2的解釋線圖能夠觀察到,在其他配對線趨勢圖之間,配對線趨勢圖(a,b)是最可能的結(jié)合,其次是配對線趨勢圖(a,d)。接下來發(fā)現(xiàn)的是包括物品b的線是處于頂部的一些線,這意味著物品b是最受歡迎的物品,這樣的結(jié)果與原始數(shù)據(jù)一致。結(jié)合了物品d但是沒有包括物品b的線是最低的,這解釋為物品d是最不受歡迎的。

002.jpg

3 結(jié)論

  本文結(jié)合消費者行為的非結(jié)構(gòu)化數(shù)據(jù),呈現(xiàn)了一種大數(shù)據(jù)應(yīng)用程序框架。這是大數(shù)據(jù)分析的早期階段,在消費領(lǐng)域,通過使用真實的生活數(shù)據(jù),分析消費品的購買情況,在網(wǎng)絡(luò)平臺上將會產(chǎn)生大量的數(shù)據(jù)源,通過這些數(shù)據(jù)精準了解消費者心理對企業(yè)的功能和作用,特別是對營銷來說更具有特別重大和實際的意義。

參考文獻

  [1] 吳響,張立,趙強,等.基于體域網(wǎng)的遠程健康監(jiān)護系統(tǒng)設(shè)計[J].電子技術(shù)應(yīng)用,2014,40(3):19-21.

  [2] 黃升民,楊雪睿.碎片化背景下消費行為的新變化與發(fā)展趨勢[J].廣告大觀(理論版),2006(2):4-9.

  [3] 竇炳琳,李澍淞,張世永.基于結(jié)構(gòu)的社會網(wǎng)絡(luò)分析[J].計算機學(xué)報,2012,35(4):99-111.

  [4] 大數(shù)據(jù)成為信息科技新關(guān)注點[J].硅谷,2012(13):I0012.

  [5] 楊華磊.高頻數(shù)據(jù)對傳統(tǒng)經(jīng)濟學(xué)研究范式的沖擊[EB/OL].[2013-01-27].blog.sciencenet.cn/blog-456786-656901.html.

  [6] 涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012.

  [7] Zhang Yihua, BLANTON M. Efficient dynamic provable possession of remote data via update trees[J]. Rearch in Computer Security(ESORICS′09), 2012(3):42-45.

  [8] Lin Jun, Yang Guangyu. Analyzing customer behavior Predicting-what happens next[DB]. Publisher: Across Technology, 2010(2):53-56.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。