《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于一種大數(shù)據(jù)應(yīng)用架構(gòu)的消費(fèi)者行為分析
基于一種大數(shù)據(jù)應(yīng)用架構(gòu)的消費(fèi)者行為分析
2014年微型機(jī)與應(yīng)用第20期
湯仁民1,王代強(qiáng)2
1.貴州大學(xué) 電子信息學(xué)院,貴州 貴陽 550025; 2.貴州大學(xué) 人民武裝學(xué)院,貴州 貴陽 550025
摘要: 研究了一種大數(shù)據(jù)的應(yīng)用程序框架,通過使用拓?fù)鋽?shù)據(jù)結(jié)構(gòu)、共生技術(shù)分析和馬爾科夫鏈理論來分析消費(fèi)者的購(gòu)買行為。首先將與消費(fèi)者相關(guān)的數(shù)據(jù)轉(zhuǎn)換成一種拓?fù)鋽?shù)據(jù)結(jié)構(gòu);然后使用拓?fù)潢P(guān)系、一種共生矩陣對(duì)消費(fèi)者行為進(jìn)行分析,推斷出馬爾柯夫鏈模型。仿真結(jié)果證實(shí)了該理論框架的有效性。
Abstract:
Key words :

  摘  要: 研究了一種大數(shù)據(jù)的應(yīng)用程序框架,通過使用拓?fù)鋽?shù)據(jù)結(jié)構(gòu)、共生技術(shù)分析和馬爾科夫鏈理論來分析消費(fèi)者的購(gòu)買行為。首先將與消費(fèi)者相關(guān)的數(shù)據(jù)轉(zhuǎn)換成一種拓?fù)鋽?shù)據(jù)結(jié)構(gòu);然后使用拓?fù)潢P(guān)系、一種共生矩陣對(duì)消費(fèi)者行為進(jìn)行分析,推斷出馬爾柯夫鏈模型。仿真結(jié)果證實(shí)了該理論框架的有效性。

  關(guān)鍵詞: 大數(shù)據(jù);消費(fèi)者行為;拓?fù)鋽?shù)據(jù)結(jié)構(gòu);馬爾科夫鏈

0 引言

  隨著云技術(shù)的應(yīng)用和普及,利用“數(shù)據(jù)”對(duì)消費(fèi)者細(xì)分變得更為容易,在此“數(shù)據(jù)”之下形成的“精準(zhǔn)”傳播正日益成為廠商的得力助手。大數(shù)據(jù)在經(jīng)濟(jì)分析、災(zāi)害預(yù)報(bào)、產(chǎn)品和服務(wù)跟蹤、消費(fèi)行為洞察甚至在了解股市走向等方面大有用武之地,在發(fā)達(dá)國(guó)家已經(jīng)開始普及應(yīng)用,在中國(guó)也得到越來越多的運(yùn)用。

  在消費(fèi)領(lǐng)域,通過數(shù)以百萬計(jì)的網(wǎng)絡(luò)傳感器和視頻監(jiān)控系統(tǒng),人們能搜索到關(guān)于消費(fèi)者和供應(yīng)商的大量數(shù)據(jù)[1];各種媒體和社交網(wǎng)絡(luò)平臺(tái)中關(guān)于消費(fèi)者的數(shù)據(jù)更是呈現(xiàn)指數(shù)式增長(zhǎng);用戶在各種社交網(wǎng)絡(luò)平臺(tái)中所生成的未經(jīng)編輯的信息,包括結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),讓人眼花繚亂。把這些海量數(shù)據(jù)統(tǒng)一稱作大數(shù)據(jù)。一般情況下,大數(shù)據(jù)具有批量、多品種、快速度三種特性[2-3]。

  另一方面,消費(fèi)者行為分析是對(duì)消費(fèi)者、產(chǎn)品商、運(yùn)營(yíng)商之間對(duì)諸如購(gòu)買、節(jié)約、商標(biāo)選擇等方面的關(guān)注[4]。此外,如今的消費(fèi)者稱號(hào)不再是指過去單一的消費(fèi)者行為,對(duì)他們的定義不再僅是買家,更是一種會(huì)引導(dǎo)電商零售企業(yè)營(yíng)銷方式變遷的模式。為了分析消費(fèi)者行為,獲取更多的信息是有必要的。在這個(gè)方面,對(duì)數(shù)據(jù)驅(qū)動(dòng)決策作出,處理大數(shù)據(jù)已經(jīng)成為了中心角色[5]。在大數(shù)據(jù)平臺(tái)中所搜集的數(shù)據(jù)的性質(zhì)是各不相同的,為了分析這些數(shù)據(jù),僅數(shù)據(jù)的數(shù)量和性質(zhì)而言就是一個(gè)艱巨的挑戰(zhàn)[6]。本文用圖1所示的框架結(jié)構(gòu),通過數(shù)學(xué)拓?fù)湟约芭c馬爾科夫鏈相結(jié)合的共生分析理論來分析這些海量數(shù)據(jù)以及如何能夠獲取有用的信息。

001.jpg

1 消費(fèi)者行為分析的大數(shù)據(jù)框架

  應(yīng)用于消費(fèi)者行為分析的大數(shù)據(jù)框架圖由三個(gè)功能層組成,分別是數(shù)據(jù)組織層、分析建模層、預(yù)測(cè)推理層[7-8]。在數(shù)據(jù)組織層,收集到的數(shù)據(jù)在一個(gè)動(dòng)力系統(tǒng)中被組織,以至于該數(shù)據(jù)能夠被看作是一個(gè)時(shí)間序列。具體而言,假設(shè)隨機(jī)變量分別為:

  Xt:在時(shí)間t時(shí)的數(shù)據(jù)量。

  Yt:出現(xiàn)在時(shí)間間隔為[t,t+1]的新數(shù)據(jù)。

  Zt:出現(xiàn)在時(shí)間間隔為[t,t+1]的劣化數(shù)據(jù)。

  該數(shù)據(jù)流可以在一個(gè)隨機(jī)方程中建模為:

  1.png

  可以通過線性回歸馬爾科夫鏈在式(2)中獲得Xt:

  E[Yt+1|Yt]=(1-ρ)E(Y)+ρYt(2)

  通過式(1)乘以Yt+1,再取其期望,同時(shí)使t→∞,這樣能夠獲得式(3):

 ?。?-ρ)E(XY)=(1-ρ)E(X)E(Y)+ρE(Y2)-ρE(Y)(3)

  在式(1)中代入E(XY)的值,通過式(4)獲得大數(shù)據(jù)的平均量:

  4.png

  對(duì)于代表當(dāng)前特別關(guān)注的變量Xt,通過方程(4)將會(huì)得出時(shí)間序列數(shù)據(jù)。經(jīng)產(chǎn)生的時(shí)間序列數(shù)據(jù),構(gòu)造出拓?fù)鋽?shù)據(jù)結(jié)構(gòu),這樣大數(shù)據(jù)能夠被存儲(chǔ)為所構(gòu)造的拓?fù)鋽?shù)據(jù)而不失其一般性,該優(yōu)勢(shì)是對(duì)大存儲(chǔ)器的需求顯著減少。同時(shí),重要的信息能夠通過使用離散集而獲得,可以利用拓?fù)浣Y(jié)構(gòu)對(duì)該種消費(fèi)行為進(jìn)行研究。拓?fù)鋽?shù)據(jù)結(jié)構(gòu)的基本概念是認(rèn)識(shí)其數(shù)據(jù)的形狀或模式,用于發(fā)現(xiàn)數(shù)據(jù),識(shí)別其有意義的數(shù)據(jù)子集,這樣的拓?fù)鋽?shù)據(jù)結(jié)構(gòu)由滿足包含、相交和封閉性的采樣數(shù)據(jù)的子集集合而成。以下三種關(guān)鍵性的拓?fù)湫再|(zhì)使得從大數(shù)據(jù)中可能提取出具有一定價(jià)值的數(shù)據(jù):(1)無坐標(biāo)性;(2)提取不同形狀下的一種客體模式的能力;(3)不失其重要特性的壓縮形狀。

  適用于上述三種特性的共生矩陣被處于分析建模層中的數(shù)據(jù)結(jié)構(gòu)所建立。按行歸一化的共生矩陣、馬爾科夫轉(zhuǎn)移概率都能被估計(jì),同時(shí)形成了一步轉(zhuǎn)移概率矩陣P。然后平穩(wěn)分布π以及隨時(shí)間變化分布的Pt能夠通過(5)式獲得。最后這些可能性在預(yù)測(cè)推理層被用于獲取所需的特定信息。

  π=πPPt+1=Pt·P(5)

2 實(shí)驗(yàn)結(jié)果



  為了說明該架構(gòu),對(duì)合成的消費(fèi)者購(gòu)買行為數(shù)據(jù)進(jìn)行模擬。把購(gòu)買消費(fèi)品的時(shí)間序列數(shù)據(jù)收集起來并在表1中顯示出來,該數(shù)據(jù)包含了4種消費(fèi)品和10個(gè)時(shí)間點(diǎn)。包含消費(fèi)品的整個(gè)數(shù)據(jù)集是Xt={a,b,c,d},拓?fù)銽被定義為Xt的子集集合,這樣T包含一個(gè)空集和整個(gè)集,T中的兩個(gè)集合并一定被包含在T中,且T中任何兩個(gè)集合的交叉點(diǎn)也必須被包含在T中,這樣包含的拓?fù)潢P(guān)系被用于建立處于拓?fù)銽中數(shù)據(jù)集之間的共生矩陣。相應(yīng)的共生矩陣如表2所示。通過共生矩陣行歸一化能夠得到一步轉(zhuǎn)移概率矩陣P。當(dāng)t=2,3,4,…時(shí),通過計(jì)算Pt能夠獲得t步轉(zhuǎn)移概率。在一般情況下,平衡狀態(tài)在t的一個(gè)有限值內(nèi)達(dá)到。因此,當(dāng)t=1,2,3,…時(shí),通過繪制相應(yīng)的t步概率獲得該種趨勢(shì)圖。最后,必要的信息能夠通過圖2所示的消費(fèi)者趨勢(shì)圖推導(dǎo)出。在圖2中,水平線表示時(shí)間點(diǎn),垂直線表示購(gòu)買成對(duì)商品的模式。其中大數(shù)據(jù)分析最重要的方面之一便是通過解碼圖2中被編碼的定量信息和定性信息以顯示其結(jié)構(gòu)和模式。通過圖2的解釋線圖能夠觀察到,在其他配對(duì)線趨勢(shì)圖之間,配對(duì)線趨勢(shì)圖(a,b)是最可能的結(jié)合,其次是配對(duì)線趨勢(shì)圖(a,d)。接下來發(fā)現(xiàn)的是包括物品b的線是處于頂部的一些線,這意味著物品b是最受歡迎的物品,這樣的結(jié)果與原始數(shù)據(jù)一致。結(jié)合了物品d但是沒有包括物品b的線是最低的,這解釋為物品d是最不受歡迎的。

002.jpg

3 結(jié)論

  本文結(jié)合消費(fèi)者行為的非結(jié)構(gòu)化數(shù)據(jù),呈現(xiàn)了一種大數(shù)據(jù)應(yīng)用程序框架。這是大數(shù)據(jù)分析的早期階段,在消費(fèi)領(lǐng)域,通過使用真實(shí)的生活數(shù)據(jù),分析消費(fèi)品的購(gòu)買情況,在網(wǎng)絡(luò)平臺(tái)上將會(huì)產(chǎn)生大量的數(shù)據(jù)源,通過這些數(shù)據(jù)精準(zhǔn)了解消費(fèi)者心理對(duì)企業(yè)的功能和作用,特別是對(duì)營(yíng)銷來說更具有特別重大和實(shí)際的意義。

參考文獻(xiàn)

  [1] 吳響,張立,趙強(qiáng),等.基于體域網(wǎng)的遠(yuǎn)程健康監(jiān)護(hù)系統(tǒng)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2014,40(3):19-21.

  [2] 黃升民,楊雪睿.碎片化背景下消費(fèi)行為的新變化與發(fā)展趨勢(shì)[J].廣告大觀(理論版),2006(2):4-9.

  [3] 竇炳琳,李澍淞,張世永.基于結(jié)構(gòu)的社會(huì)網(wǎng)絡(luò)分析[J].計(jì)算機(jī)學(xué)報(bào),2012,35(4):99-111.

  [4] 大數(shù)據(jù)成為信息科技新關(guān)注點(diǎn)[J].硅谷,2012(13):I0012.

  [5] 楊華磊.高頻數(shù)據(jù)對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)研究范式的沖擊[EB/OL].[2013-01-27].blog.sciencenet.cn/blog-456786-656901.html.

  [6] 涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012.

  [7] Zhang Yihua, BLANTON M. Efficient dynamic provable possession of remote data via update trees[J]. Rearch in Computer Security(ESORICS′09), 2012(3):42-45.

  [8] Lin Jun, Yang Guangyu. Analyzing customer behavior Predicting-what happens next[DB]. Publisher: Across Technology, 2010(2):53-56.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。