《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于協(xié)作過(guò)濾算法的電子商務(wù)個(gè)性化推薦系統(tǒng)的研究
基于協(xié)作過(guò)濾算法的電子商務(wù)個(gè)性化推薦系統(tǒng)的研究
2014年微型機(jī)與應(yīng)用第15期
馬小龍
上海財(cái)經(jīng)大學(xué) 信息管理與工程學(xué)院
摘要: 針對(duì)目前電子商務(wù)個(gè)性化推薦研究的不足,提出準(zhǔn)確全面地獲取用戶獨(dú)特興趣愛(ài)好、滿足用戶差異化需求的推薦服務(wù),同時(shí)構(gòu)建了具體的個(gè)性化推薦系統(tǒng)模型,給出了基于協(xié)作過(guò)濾算法的電子商務(wù)個(gè)性化推薦的流程、系統(tǒng)設(shè)計(jì)和系統(tǒng)實(shí)現(xiàn),從而有利于推動(dòng)電子商務(wù)的發(fā)展
Abstract:
Key words :

  摘  要: 針對(duì)目前電子商務(wù)個(gè)性化推薦研究的不足,提出準(zhǔn)確全面地獲取用戶獨(dú)特興趣愛(ài)好、滿足用戶差異化需求的推薦服務(wù),同時(shí)構(gòu)建了具體的個(gè)性化推薦系統(tǒng)模型,給出了基于協(xié)作過(guò)濾算法的電子商務(wù)個(gè)性化推薦的流程、系統(tǒng)設(shè)計(jì)和系統(tǒng)實(shí)現(xiàn),從而有利于推動(dòng)電子商務(wù)的發(fā)展。

  關(guān)鍵詞: 個(gè)性化推薦;用戶興趣模型;協(xié)作過(guò)濾

  電子商務(wù)的迅速發(fā)展革命性地改變了人們的生產(chǎn)和生活方式,對(duì)于個(gè)人可以做到足不出戶就獲得所需要的商品和服務(wù),對(duì)于企業(yè)則轉(zhuǎn)變了傳統(tǒng)經(jīng)營(yíng)模式,通過(guò)網(wǎng)站為用戶提供一個(gè)直接、迅速而且不受商品陳列空間限制的龐大的商品購(gòu)物平臺(tái)[1]。然而在享受互聯(lián)網(wǎng)技術(shù)推動(dòng)電子商務(wù)發(fā)展的便利的同時(shí),用戶也發(fā)現(xiàn)自己處于了“信息爆炸而知識(shí)貧乏”的困境之中,也就是網(wǎng)站提供的品類繁雜的商品和用戶相對(duì)單一的購(gòu)物需求之間的矛盾[2]。

  因此電子商務(wù)網(wǎng)站希望通過(guò)應(yīng)用個(gè)性化推薦技術(shù)較準(zhǔn)確地預(yù)測(cè)用戶的購(gòu)物需求,并給用戶提供高質(zhì)量的推薦服務(wù),以此來(lái)挖掘更多的潛在用戶,盡可能地將網(wǎng)站的瀏覽者轉(zhuǎn)化為購(gòu)買者,增強(qiáng)網(wǎng)站的關(guān)聯(lián)銷售能力,提高用戶購(gòu)物的滿意度,最終達(dá)到提高網(wǎng)站競(jìng)爭(zhēng)力,提高網(wǎng)站經(jīng)營(yíng)效益的目的。本文就如何針對(duì)不同用戶提供差異化的服務(wù)做了研究并予以實(shí)現(xiàn)[3]。

  電子商務(wù)個(gè)性化推薦系統(tǒng)以電子商務(wù)購(gòu)物網(wǎng)站為依托,根據(jù)已知的用戶信息(比如個(gè)人注冊(cè)信息、歷史訪問(wèn)記錄、評(píng)分記錄和訂單),利用推薦技術(shù)和算法,分析用戶的消費(fèi)偏好,為不同的用戶有針對(duì)性地推薦符合興趣的商品。個(gè)性化推薦技術(shù)作為推薦系統(tǒng)的核心,是其重要的組成部分。其基本思想是:首先找與他自身興趣比較相似的用戶,然后將這些用戶感興趣的消費(fèi)內(nèi)容推薦給目標(biāo)用戶。其最大的優(yōu)點(diǎn)是對(duì)推薦對(duì)象沒(méi)有特殊的要求,能處理非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)結(jié)構(gòu),如音頻、視頻等,也無(wú)需向基于內(nèi)容的推薦那樣去考慮推薦對(duì)象的內(nèi)容及關(guān)鍵字的抽取等。但也存在著數(shù)據(jù)稀疏、冷啟動(dòng)等缺點(diǎn)。

1 系統(tǒng)總體設(shè)計(jì)

  1.1 總體設(shè)計(jì)思想

  基于協(xié)作過(guò)濾的個(gè)性化推薦系統(tǒng)是電子商務(wù)網(wǎng)站模擬了店鋪營(yíng)業(yè)員對(duì)用戶的推薦行為,盡可能準(zhǔn)確地獲取用戶的個(gè)性消費(fèi)愛(ài)好,給不同用戶提供差異化的推薦服務(wù)。首先,需要建立一種合理的個(gè)性化推薦體系,在該體系的指導(dǎo)下,分析用戶的購(gòu)物行為進(jìn)而獲取用戶的興趣愛(ài)好數(shù)據(jù),構(gòu)建用戶興趣愛(ài)好模型,并使用個(gè)性化推薦算法計(jì)算目標(biāo)用戶對(duì)每一個(gè)項(xiàng)目的期望值[4]?;诘贸龅挠脩羝谕?,個(gè)性化推薦系統(tǒng)就可以對(duì)不同的目標(biāo)用戶提供一種差異化的推薦服務(wù)。個(gè)性化推薦模型如圖1所示。

001.jpg

  通過(guò)以上模型可知,在本系統(tǒng)中主要涉及到3個(gè)角色,分別是客戶端子系統(tǒng)、管理端子系統(tǒng)和個(gè)性化推薦子系統(tǒng)。而在作為核心部分的個(gè)性化推薦子系統(tǒng)中,以用戶興趣愛(ài)好數(shù)據(jù)作為輸入?yún)?shù),使用協(xié)作過(guò)濾算法計(jì)算目標(biāo)用戶對(duì)項(xiàng)目的預(yù)測(cè)值[5]。

  1.2 系統(tǒng)框架

  個(gè)性化推薦系統(tǒng)基于用戶提交的興趣愛(ài)好信息和在購(gòu)物網(wǎng)站的瀏覽歷史信息提供個(gè)性化推薦服務(wù)和購(gòu)買建議,其總體結(jié)構(gòu)分為前臺(tái)客戶端管理、后臺(tái)管理和個(gè)性化推薦3個(gè)模塊。

2 系統(tǒng)應(yīng)用

  2.1 客戶端子模塊

  在個(gè)性化推薦系統(tǒng)中,用戶作為最終的服務(wù)對(duì)象,參與了整個(gè)系統(tǒng)的服務(wù)過(guò)程。在本模塊中,用戶可以實(shí)現(xiàn)買賣交易,注冊(cè)成為本站的會(huì)員享受系統(tǒng)提供的個(gè)性化推薦服務(wù),也可以對(duì)商品和店鋪根據(jù)提供的服務(wù)做出客觀評(píng)價(jià)。此外,用戶可以申請(qǐng)?jiān)诒鞠到y(tǒng)開(kāi)啟自己的網(wǎng)上店鋪。

  客戶端子系統(tǒng)的另一個(gè)重要功能就是根據(jù)用戶在本站的行為收集用戶的興趣愛(ài)好數(shù)據(jù),并將其量化以建立用戶興趣模型,作為個(gè)性化推薦系統(tǒng)向用戶提供推薦服務(wù)的有力依據(jù),保證推薦的高質(zhì)量和精準(zhǔn)性。

  2.2 管理端子模塊

  為了確保系統(tǒng)的正常運(yùn)行,電子商務(wù)個(gè)性化推薦系統(tǒng)需要具有一個(gè)后臺(tái)管理子系統(tǒng)對(duì)整個(gè)系統(tǒng)進(jìn)行配置管理。主要功能模塊包括:訂單管理、會(huì)員管理、權(quán)限管理、管理員登錄、系統(tǒng)配置管理、商品管理、店鋪管理、廣告管理、信息管理和個(gè)性化推薦模塊管理。

  為了增加個(gè)性化推薦系統(tǒng)的推薦質(zhì)量,加強(qiáng)推薦的彈性范圍,系統(tǒng)還允許管理員在個(gè)性化推薦模塊管理及時(shí)修改算法閾值,從而更進(jìn)一步提供系統(tǒng)的靈活性和擴(kuò)展性。

  2.3 個(gè)性化推薦模塊

  個(gè)性化推薦模塊遵循入-處理-輸出IPO(Input-Process-Output)模式[6],作為系統(tǒng)的核心部分,主要由數(shù)據(jù)表述、發(fā)現(xiàn)最近鄰居和產(chǎn)生推薦數(shù)據(jù)集[7]3個(gè)階段組成,其基本架構(gòu)如圖2所示。

002.jpg

  (1)數(shù)據(jù)表述階段

  數(shù)據(jù)表述階段最重要的是建立用戶興趣模型。用戶興趣模型建立的第一步是獲取用戶興趣數(shù)據(jù),目前主要有兩種方法。一種是顯式獲取,即用戶主動(dòng)參與電子商務(wù)網(wǎng)站的反饋活動(dòng),要求用戶中斷正常的瀏覽行為對(duì)資源項(xiàng)目進(jìn)行評(píng)分,這是獲取用戶興趣最佳的方式,不足之處是,顯式獲取需要為用戶帶來(lái)了額外的負(fù)擔(dān),匆忙中填寫(xiě)的反饋信息很大程度上并不能客觀地反映用戶偏好。另一種是隱式獲取,主要是以Web使用挖掘、人工智能和知識(shí)發(fā)現(xiàn)等理論為基礎(chǔ),利用JavaScript、AJAX等應(yīng)用技術(shù)分析用戶的瀏覽行為,獲取用戶興趣偏好并轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的過(guò)程,它的優(yōu)勢(shì)主要在于整個(gè)過(guò)程不需要用戶的主動(dòng)參與,不會(huì)中斷用戶正常的瀏覽行為,也不會(huì)給用戶帶來(lái)額外負(fù)擔(dān),能夠得到比顯示反饋更豐富的用戶偏好信息。因此,這里采用“以顯式獲取用戶興趣愛(ài)好為主,隱式獲取為輔,顯式和隱式相結(jié)合”的混合用戶興趣獲取方式[8],避免了中文分詞帶來(lái)的誤差和關(guān)鍵字抽取。將混合方式獲得的用戶興趣數(shù)據(jù)先進(jìn)行降噪處理,降低噪聲對(duì)用戶興趣數(shù)據(jù)的干擾,比如在獲取用戶在某個(gè)頁(yè)面上停留的時(shí)間信息時(shí),可能由于瀏覽者中途離開(kāi)而導(dǎo)致數(shù)據(jù)失效等。為了方便存儲(chǔ)和計(jì)算,對(duì)用戶興趣數(shù)據(jù)經(jīng)過(guò)降噪處理,轉(zhuǎn)換成相應(yīng)的用戶對(duì)資源項(xiàng)目的評(píng)分,從而構(gòu)建了用戶興趣模型。

  本文借鑒MovieLens系統(tǒng)的用戶評(píng)分規(guī)則[1],設(shè)定用戶顯式評(píng)分是一個(gè)0~5之間的數(shù)字,以0.5作為間隔共分為11個(gè)檔次,表示用戶對(duì)商品的個(gè)性化偏好程度,其轉(zhuǎn)換規(guī)則如下。

 ?、儆脩魎購(gòu)買了某商品k但未評(píng)分,則Ru,k=3.0。

 ?、谟脩魎對(duì)商品k的評(píng)分為score,則Ru,k=score。

 ?、塾脩酎c(diǎn)擊商品k的次數(shù)n與給定的除“0”外的10個(gè)分?jǐn)?shù)檔對(duì)應(yīng),則Ru,k=n×0.5,若Ru,k>5.0則Ru,k=5.0。

  ④獲取時(shí)間與推測(cè)隱式評(píng)分對(duì)應(yīng)關(guān)系如下:

  Ru,k=1  (5≤t<10)2  (5≤t<10)3  (5≤t<10)4  (5≤t<10)5  (5≤t<10)

  ⑤其他情況下,Ru,k=0。

  在一個(gè)典型的基于協(xié)作過(guò)濾技術(shù)的個(gè)性化推薦系統(tǒng)中,用戶興趣模型通常被表示為一個(gè)m×n的用戶-項(xiàng)目評(píng)估矩陣R,m是用戶數(shù),n是項(xiàng)數(shù),rij是第i個(gè)用戶對(duì)第j個(gè)項(xiàng)目的評(píng)估數(shù)值,其具體值由顯式和隱式用戶興趣獲取的數(shù)據(jù)轉(zhuǎn)換得來(lái)[6]。用戶-項(xiàng)目評(píng)估矩陣R如表1所示。

004.jpg

 ?。?)發(fā)現(xiàn)最近鄰居集階段

  用戶興趣模型建立后,系統(tǒng)根據(jù)用戶興趣模型計(jì)算每一位用戶的用戶相似度,通過(guò)度量目標(biāo)用戶與所有候選鄰居間的相似度,產(chǎn)生基于協(xié)作過(guò)濾的top-n鄰居用戶集,然后根據(jù)這個(gè)鄰居用戶集,結(jié)合協(xié)作過(guò)濾推薦算法,對(duì)用戶作出個(gè)性化推薦服務(wù)和購(gòu)買建議。其中協(xié)作過(guò)濾推薦的示意圖如圖3所示。

003.jpg

  協(xié)作過(guò)濾算法是目前使用最多、應(yīng)用最成熟的推薦技術(shù)。它的應(yīng)用前提是:假設(shè)存在具有相似興趣偏好的用戶群,每個(gè)用戶都有與其興趣偏好相似的鄰居用戶。預(yù)測(cè)用戶對(duì)某一項(xiàng)目的偏好是根據(jù)鄰居用戶的偏好程度計(jì)算的,也就是以屬性或興趣相近的用戶建議作為個(gè)性化推薦的基礎(chǔ)。協(xié)作過(guò)濾算法最大的優(yōu)勢(shì)在于不需要分析對(duì)象的特征屬性,所以對(duì)推薦沒(méi)有特殊要求,能處理非結(jié)構(gòu)化的復(fù)雜對(duì)象,如音頻、視頻等[8]。

  基于協(xié)作過(guò)濾推薦的上述優(yōu)點(diǎn),本文也采用協(xié)作過(guò)濾算法產(chǎn)生推薦。協(xié)作過(guò)濾算法有基于用戶(User-based)協(xié)作過(guò)濾算法和基于項(xiàng)目(Item-based)協(xié)作過(guò)濾兩種[9]。這里分別采用基于用戶協(xié)作過(guò)濾算法和基于項(xiàng)目協(xié)作過(guò)濾算法兩種方式產(chǎn)生推薦。采用余弦相似性算法計(jì)算用戶相似度,它既可以用于基于用戶的協(xié)作過(guò)濾中,也可以用于基于項(xiàng)目的協(xié)作過(guò)濾系統(tǒng)中。此方法是將用戶評(píng)分看作n維向量項(xiàng)目空間上的向量,如果用戶對(duì)項(xiàng)目沒(méi)有進(jìn)行評(píng)分,則將評(píng)分設(shè)置為默認(rèn)值0,用戶間的相似性通過(guò)向量間的余弦?jiàn)A角來(lái)度量。余弦值越大表示用戶的相似程度越高。設(shè)用戶i和用戶j在n維向量空間上的評(píng)分分別表示為向量和,則用戶i和用戶j之間的相似性sim(i,j)為:

  1.png

  采用余弦性算法的用戶相似度處理過(guò)程如下:

  輸入:用戶i和用戶j關(guān)于所有項(xiàng)目的評(píng)分

  輸出:用戶i和用戶j的相似度

  算法步驟:

  第一步:判斷用戶i和用戶j的合法性。

  第二步:初始化sum(x2)、sum(y2)、sum(xy)分別為0,n為項(xiàng)目個(gè)數(shù)。

  第三步:計(jì)算sum(x2)、sum(y2)、sum(xy)的值:

  for 每一條項(xiàng)目記錄

  do

  x=i1;y=j1;

  if x,y都不為空

  sum(x,y)+=x*y;

  sum(x2)+=x*x;

  sum(y2)+=y*y;

  end if

  end do

  return sum(x,y)/(sqrt(sum(x2))*sqrt(sum(y2)));

  將以上使用余弦相似性算法得到用戶X和用戶Y的相似度進(jìn)行降序排序,取前k個(gè)用戶做為目標(biāo)用戶的k鄰居用戶群。

 ?。?)產(chǎn)生推薦數(shù)據(jù)集階段

  在得到最近鄰居用戶集數(shù)據(jù)后,接下來(lái)根據(jù)計(jì)算出來(lái)的最近鄰居集預(yù)測(cè)評(píng)分并給目標(biāo)用戶產(chǎn)生推薦結(jié)果。設(shè)目標(biāo)用戶u的最近鄰居集合用Tu表示,則目標(biāo)用戶u對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分Pu,i可以通過(guò)用戶u對(duì)最近鄰居集Tu中項(xiàng)目的評(píng)分得到,其中Pu,i的計(jì)算方法如下:

  2.png

  上式中sim(u,n)表示用戶u與n之間的相似程度,Rn,i表示用戶n對(duì)項(xiàng)目i的評(píng)分,u和n分別表示用戶u和用戶n對(duì)項(xiàng)目的平均評(píng)分。通過(guò)上述方法計(jì)算用戶對(duì)所有未評(píng)分的項(xiàng)目的評(píng)分,然后選擇其中預(yù)測(cè)評(píng)分最高的前若干項(xiàng)(top-n)作為推薦結(jié)果給當(dāng)前用戶[10],通過(guò)這樣的基于用戶興趣相似度的推薦,網(wǎng)站就可以在恰當(dāng)?shù)臅r(shí)間向不同的用戶推薦合適的商品。

  基于項(xiàng)目的協(xié)作過(guò)濾推薦算法和基于用戶的協(xié)作過(guò)濾推薦算法基本一致,且由于資源項(xiàng)目的相對(duì)靜態(tài)性,因此它的計(jì)算相對(duì)簡(jiǎn)單。這里不再描述。

  基于協(xié)作過(guò)濾算法的電子商務(wù)個(gè)性化推薦系統(tǒng)改進(jìn)了傳統(tǒng)的基于文本的推薦技術(shù),擴(kuò)大了推薦范圍,提高了推薦質(zhì)量,單渠道用戶興趣獲取模式變成了多渠道用戶興趣獲取模式,既避免了顯式用戶興趣獲取時(shí)帶來(lái)的不良用戶體驗(yàn),也消除了單純顯式獲取用戶興趣數(shù)據(jù)導(dǎo)致的數(shù)據(jù)稀疏性問(wèn)題。

  參考文獻(xiàn)

  [1] Chong Jiang. Research of an e-commerce personalized recommendation system[D]. Changsha: Central South University, 2009.

  [2] Ting Wen. Research of mining personalized service based on Web content and Log[D]. Dalian: Dalian University of Technology, 2007.

  [3] Zhao Liang, Hu Naijing, Zhang Shouzhi. Design of personalized recommendation algorithm[J]. Computer Research and Development, 2002:78-84.

  [4] Li Dandan. Research of an e-commerce personalized recommendation based on hybrid algorithm[D]. Tianjing: Tianjing Finance University, 2008.

  [5] Jie Yang. Appliation and research of an personalized recommendation system[D]. Beijing: University of Science and Technoloy of China, 2009.

  [6] Wei Lu. Application of an e-commerce personalized recommendation system based on collaborative filtering algorithm[D].Beijing: Beijing University of Posts and Telecommunications, 2007.

  [7] MASSA P, AVESANI P. Trust-aware collaborative filtering for recommender systems[C]. Proceedings of International Conference on Cooperative Information Systems, 2004:240-249.

  [8] BADRUL SARWAR, GEORGE KARYPIS, JOSEPH KONSTAN, et al. Item-Based collaborative filtering recommendation Algorithms[C]. Proceedings of the Tenth International Conference on World Wide Web, 2003:285-295.

  [9] CHEN Y L, CHENG L C. A novel collaborative filtering approach for recommending ranked items[J]. Expert System with Applications, 2008,34(4):2396-2405.

  [10] ADOMAVICIUS G, TUZHILIN A. Towad the next generation of recommender systems:A survey of-the state-of-the—art and possible extensions[J]. IEEE Transaction on Knowledge and Data Engineering, 2005, 17(6):734-749.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。