摘 要: 隨著智能手機(jī)的興起,合理有效地使用手機(jī)已成為社會(huì)共性需求。不同的用戶具有不同的信息消費(fèi)行為特征,其需求動(dòng)向也常常發(fā)生變化。描述了手機(jī)客戶行為分析與用戶特征標(biāo)簽刻畫的方法,通過對(duì)客戶使用特定業(yè)務(wù)的行為、互聯(lián)網(wǎng)訪問行為、指令位置信息、終端使用情況、行業(yè)關(guān)注等有效信息的收集并運(yùn)用合適的數(shù)學(xué)模型進(jìn)行分析,能獲取客戶的各種偏好程度,進(jìn)而對(duì)客戶進(jìn)行特征分類,為企業(yè)、政府等機(jī)構(gòu)的相關(guān)決策及應(yīng)用提供依據(jù)。
關(guān)鍵詞: 訪問行為;函數(shù)模型;偏好分析;特征標(biāo)簽
0 引言
當(dāng)前手機(jī)已經(jīng)普及,企業(yè)如果能夠充分利用收集到的客戶基本信息和消費(fèi)行為信息,跟蹤并分析不同客戶的需求及其對(duì)新產(chǎn)品的接受程度,就能采取相應(yīng)的措施完善客戶使用體驗(yàn)并提升企業(yè)收益。
目前國(guó)內(nèi)外對(duì)移動(dòng)互聯(lián)網(wǎng)中用戶的研究一直比較關(guān)注,國(guó)內(nèi)的研究側(cè)重于用戶偏好現(xiàn)象分析,國(guó)外的研究則側(cè)重于用戶滿意度、接受行為建模與仿真研究,主要以TAM模型作為基礎(chǔ),整合創(chuàng)新擴(kuò)散等其他理論[1]。已有多種新型用戶偏好提取算法被提出,如傳統(tǒng)用戶偏好提取技術(shù)與馬爾可夫決策過程建模方法相結(jié)合的用戶偏好評(píng)估模型[2]、文本挖掘算法[3-4]等。
本文重點(diǎn)討論用戶特征標(biāo)簽的刻畫方法。通過建立適當(dāng)?shù)哪P?,在收集到客戶的使用特定業(yè)務(wù)行為、互聯(lián)網(wǎng)訪問行為等有效信息之后,對(duì)客戶在不同時(shí)間段的行為變化與頻次進(jìn)行綜合分析,就能為客戶打上特征標(biāo)簽,并應(yīng)用于企業(yè)決策。
1 用戶行為評(píng)價(jià)模型
在分析用戶的偏好程度時(shí),既要關(guān)注用戶對(duì)某類產(chǎn)品的使用次數(shù),也要關(guān)注其近期使用該產(chǎn)品的連續(xù)性,結(jié)合這兩個(gè)因素進(jìn)行綜合評(píng)分。
1.1 次數(shù)評(píng)分法
次數(shù)評(píng)分法即對(duì)用戶在某段時(shí)間內(nèi)對(duì)業(yè)務(wù)的使用次數(shù)進(jìn)行評(píng)分。由于用戶對(duì)不同業(yè)務(wù)的使用頻次不同,直接用使用次數(shù)進(jìn)行評(píng)價(jià),在不同的業(yè)務(wù)之間可比性不強(qiáng)。因此,可以將次數(shù)統(tǒng)一映射為0~100之間的分值來統(tǒng)一評(píng)價(jià)。如何合理地評(píng)分是關(guān)鍵,需要選擇合理的函數(shù),本文設(shè)計(jì)了以下幾種評(píng)價(jià)函數(shù)。
次數(shù)評(píng)分法有兩個(gè)主要原則:第一,用戶使用某種產(chǎn)品的次數(shù)越多則評(píng)分越高;第二,由于很多用戶每月只使用數(shù)次,那么函數(shù)曲線應(yīng)為上凸的。
常見的次數(shù)評(píng)分法有根號(hào)法、反正切法、指數(shù)法等,具體使用哪種方法應(yīng)根據(jù)具體情況來確定。
?。?)根號(hào)法
設(shè)計(jì)一個(gè)函數(shù),將用戶的使用次數(shù)映射到區(qū)間[0,100]上的一個(gè)數(shù)值即分?jǐn)?shù)。由于實(shí)際使用次數(shù)的非均勻性,同時(shí)對(duì)少數(shù)使用次數(shù)很多的用戶不需單獨(dú)進(jìn)行分類,因此該映射函數(shù)可定義為:
其函數(shù)曲線如圖1所示。這種模型保證了y隨x單調(diào)遞增,并且函數(shù)曲線上凸,隨著x的增大曲線變得平緩,因?yàn)楫?dāng)使用次數(shù)足夠多時(shí)該用戶已經(jīng)擁有較高的評(píng)分,說明為活躍用戶,則其分值的變化率應(yīng)越來越小,接近于0。當(dāng)x=0時(shí)(用戶撥打次數(shù)為0)評(píng)分為0,當(dāng)x=100時(shí)分值最大為100。
由于y最大為100,那么當(dāng)x超出100時(shí)仍取分值y=100。這種函數(shù)模型適用于x的值分布范圍較?。ㄗ詈迷?~100之間)的情況。
?。?)反正切法
假設(shè)次數(shù)為x,評(píng)分公式為:
y=100×arctan(x/10)/π/2
=200×arctan(x/10)/π
函數(shù)圖像如圖2所示。其中x/10是為了在x屬于[0,50]范圍內(nèi)的函數(shù)曲線不至于太過平緩。這種函數(shù)也是單調(diào)遞增的,并且隨著x的增大曲線變得平緩,當(dāng)x=0時(shí)y=0,當(dāng)x趨于正無窮時(shí)y取最大值100。這種模型適用于x的分布范圍較廣(0~+∞)的情況。
?。?)指數(shù)法
假設(shè)次數(shù)為x,評(píng)分公式為:
y=100(1-a-x/b)
這里a的大小可以適當(dāng)調(diào)整,一般可設(shè)定在1.1~2之間,本文取1.5;b根據(jù)基數(shù)大小取適當(dāng)值,本文取10。如圖3所示,y隨x單調(diào)遞增,并且曲線逐漸變得平緩,當(dāng)x=0時(shí)y=0,當(dāng)x趨于正無窮時(shí)y取最大值100。這種模型適用于x分布范圍較廣的情況(0~+∞),注意到反正切法的模型中當(dāng)x較小時(shí)y的變化率非常大,而指數(shù)法中y隨x的變化相對(duì)慢一些。
1.2 連續(xù)性評(píng)分法
評(píng)價(jià)假定:如果一個(gè)用戶在近幾個(gè)月內(nèi)都使用某項(xiàng)業(yè)務(wù),那么可以判斷該用戶為此項(xiàng)用戶的忠實(shí)用戶;如果僅在前期偶爾使用過,近期均未用過,則屬于該業(yè)務(wù)流失用戶。
基于此假設(shè),可以對(duì)用戶在近3個(gè)月內(nèi)使用某項(xiàng)業(yè)務(wù)的情況進(jìn)行連續(xù)性評(píng)分。設(shè)當(dāng)前月份為m,則m-2、m-1、m 3個(gè)月份使用連續(xù)評(píng)價(jià)規(guī)則可按表1進(jìn)行定義。
?。ū碇星?列的“1”表示在本月使用過該項(xiàng)業(yè)務(wù),“0”表示未使用過)
1.3基于分?jǐn)?shù)的用戶分類
基于評(píng)分模型得到的分?jǐn)?shù),可對(duì)用戶進(jìn)行分類,一種可能的分類方法如表2所示。
1.4 各類偏好地址綜合統(tǒng)計(jì)
借助從運(yùn)營(yíng)商獲得的數(shù)據(jù)可以統(tǒng)計(jì)出各類偏好地址(把得到分?jǐn)?shù)不小于75即中度愛好程度以上的地址認(rèn)定為用戶的偏好地址)的用戶數(shù)量,從而判斷各類網(wǎng)站的受歡迎程度。
2 網(wǎng)站主題評(píng)價(jià)
2.1 基于寬帶上網(wǎng)的網(wǎng)站主題評(píng)分
依據(jù)手機(jī)用戶利用寬帶上網(wǎng)對(duì)網(wǎng)站主題的訪問用戶數(shù)對(duì)網(wǎng)站主題進(jìn)行評(píng)分。評(píng)分方法可以采用指數(shù)法,a取1.5,根據(jù)用戶數(shù)的規(guī)模,b取2 000。
2.2 基于手機(jī)上網(wǎng)的網(wǎng)站主題評(píng)分
依據(jù)手機(jī)直接上網(wǎng)用戶對(duì)網(wǎng)站主題的訪問用戶數(shù)對(duì)網(wǎng)站主題進(jìn)行評(píng)分。評(píng)分方法與基于寬帶上網(wǎng)用戶的評(píng)分方法相同。
3 數(shù)據(jù)統(tǒng)計(jì)分析及特征標(biāo)簽刻畫
根據(jù)某運(yùn)營(yíng)商一個(gè)月的數(shù)據(jù),利用前文所定義的分析模型,可對(duì)用戶、網(wǎng)站主題進(jìn)行以下特征刻畫。
3.1 上網(wǎng)方式偏好程度
統(tǒng)計(jì)得到的數(shù)據(jù)及其評(píng)價(jià)如表3所示。
3.2 手機(jī)換購(gòu)用戶預(yù)測(cè)
根據(jù)對(duì)相關(guān)主題網(wǎng)站的訪問統(tǒng)計(jì),依據(jù)最近一周訪問量來分析手機(jī)換購(gòu)用戶。
由于是對(duì)最近一周的用戶數(shù)據(jù)集中分析,那么不宜采用打分的方法對(duì)用戶分層??梢钥紤]使用定閾值的方法。如最近7天有3天以上訪問天數(shù),且平均訪問同類偏好地址2次以上的用戶,當(dāng)其在上月的偏好月表中不存在,則判斷其為有手機(jī)換購(gòu)意向的用戶。以某一星期數(shù)據(jù)為例,統(tǒng)計(jì)總用戶數(shù)104 227,有換購(gòu)意向的用戶數(shù)達(dá)318,表4列出了統(tǒng)計(jì)分布表(只列出用戶數(shù)大于20的分布情況,天數(shù)是針對(duì)某特定主題,總天數(shù)是針對(duì)所有主題)。
3.3 手機(jī)愛好者判定
對(duì)手機(jī)用戶一段時(shí)間內(nèi)的訪問次數(shù)、訪問天數(shù),分別根據(jù)前面的模型進(jìn)行評(píng)分,得到一個(gè)總分:
得分=(天數(shù)得分+次數(shù)得分)/2,其中定義天數(shù)得分=100×(1-2-訪問天數(shù)/1.106 8),次數(shù)得分=100×(1-2-訪問天數(shù)/1.106 8)。
根據(jù)某運(yùn)營(yíng)商一周的統(tǒng)計(jì)數(shù)據(jù),對(duì)用戶是否為體育迷進(jìn)行分析,得到表5所示結(jié)果。
3.4 各類偏好地址綜合統(tǒng)計(jì)
3.4.1 移動(dòng)寬帶上網(wǎng)偏好統(tǒng)計(jì)
參照從運(yùn)營(yíng)商獲得的某個(gè)月數(shù)據(jù),找出曾經(jīng)訪問過各類偏好地址的寬帶用戶191 613個(gè),其中“3G達(dá)人”、“iphone4s”、“iphone相關(guān)網(wǎng)站”、“手機(jī)綜合”、“手機(jī)軟件下載”的訪問用戶數(shù)量較大(高于10 000),列出用戶數(shù)大于1 000的偏好分布如表6所示。
為了找出用戶訪問頻率較高的地址而不僅僅是用戶數(shù)量大的地址,再統(tǒng)計(jì)出有5天和5天以上訪問頻率的用戶1 583個(gè),分布如表7所示。
3.4.2 手機(jī)直接上網(wǎng)偏好統(tǒng)計(jì)
根據(jù)運(yùn)營(yíng)商提供的月數(shù)據(jù)可以找出訪問各類地址的手機(jī)直接上網(wǎng)用戶193 148個(gè),其中訪問次數(shù)最多的為13,列出用戶數(shù)大于1 000的偏好地址分布如表8所示。由統(tǒng)計(jì)結(jié)果可以看出,分布頻率較大的是“360手機(jī)衛(wèi)士”、“Android天氣通”、“天翼閱讀”、“安卓市場(chǎng)”、“手機(jī)酷狗”。
4 結(jié)論
移動(dòng)互聯(lián)網(wǎng)逐漸成為大眾生活必不可少的部分,移動(dòng)互聯(lián)網(wǎng)服務(wù)已成為網(wǎng)絡(luò)服務(wù)發(fā)展的主流方向。為了提升客戶的使用體驗(yàn)并為企業(yè)贏得更多的用戶,本文介紹了通過固網(wǎng)用戶的互聯(lián)網(wǎng)訪問行為以及手機(jī)用戶的訪問行為進(jìn)行偏好分析并準(zhǔn)確定位“手機(jī)發(fā)燒友用戶”的方法,提供了3種常用的評(píng)分模型,描述了寬帶上網(wǎng)、手機(jī)上網(wǎng)數(shù)據(jù)分析的步驟和分析用戶特征的策略,以某運(yùn)營(yíng)商提供的數(shù)據(jù)為例找出了比較受歡迎的用戶偏好地址。企業(yè)可以以此進(jìn)行用戶特征標(biāo)簽的刻畫并將其應(yīng)用于營(yíng)銷服務(wù)活動(dòng),從而提升服務(wù)質(zhì)量。
參考文獻(xiàn)
[1] 徐瀟.移動(dòng)軟件產(chǎn)品的用戶接受研究——以蘇寧彩票Android手機(jī)軟件為例[D].南京:南京理工大學(xué),2014.
[2] 黃海清,張平,張曦文.用戶偏好提取算法[J].無線電工程,2006,36(13):16-19.
[3] 吳雙.客戶需求信息管理與用戶偏好分析[J].科技致富向?qū)В?013,25(17):409-431.
[4] 張歡.網(wǎng)絡(luò)用戶偏好分析方法的研究[D].北京:北京交通大學(xué),2010.