摘 要: 針對為流媒體學習系統(tǒng)提供個性化點播服務(wù)的問題,通過研究學習系統(tǒng)自適應(yīng)性實施的相關(guān)文獻,給出一個基于樸素貝葉斯分類的自適應(yīng)流媒體點播系統(tǒng)的實現(xiàn)模型。為了提高分類診斷性能,適合流媒體學習特性,重點討論為不同知識點類型賦予不同權(quán)重的基于概率加權(quán)的貝葉斯分類算法和加入時序的貝葉斯分類算法。實驗結(jié)果表明,算法設(shè)計合理、科學。
關(guān)鍵詞: 流媒體點播;自適應(yīng)性;個性化服務(wù);樸素貝葉斯分類
隨著基于Web的現(xiàn)代遠程教育的發(fā)展,模擬教師的智能,按學習者的學習行為和學習狀態(tài)動態(tài)導航學習內(nèi)容,提供個性化教學服務(wù),已成為開發(fā)遠程教育系統(tǒng)的需求。
目前,國內(nèi)外研究人員已開展了學習系統(tǒng)的自適應(yīng)性研究,并取得了一定的成果。系統(tǒng)自適應(yīng)性的關(guān)鍵是實現(xiàn)對學習者學習情況的診斷和資源推薦,通常采用分析學習者的學習特征與資源特征間關(guān)系的方式。Brusilovsky[1]開發(fā)的自適應(yīng)學習系統(tǒng),根據(jù)學習者的學習能力進行學習情況診斷和資源推薦。CHEN C M等[2]開發(fā)的自適應(yīng)學習系統(tǒng),根據(jù)學習者能力和學習資料的難度推薦資源。WANG H C等[3]開發(fā)的自適應(yīng)學習系統(tǒng),根據(jù)學習者特征和學習資源特征的最大相似度匹配策略進行學習者情況的診斷和資源推薦。知識是分層次的,以知識點來推進整個學習過程,更符合認知規(guī)律。但上述系統(tǒng)未考慮某一知識點對整個單元知識體系的影響,忽略了從流媒體對象的角度考察學習者交互式請求的學習特征,不能充分反映學習者的學習適應(yīng)性。此外,由客觀題測試得到的測試結(jié)果并不能充分反映學習者的學習情況。因此,本文從學習者學習特征、知識點類別和測試結(jié)果出發(fā),預(yù)測學習者的學習情況和知識水平,并根據(jù)學習者的學習情況與學習者的知識水平最大匹配策略推薦學習資源。
1 學習者流媒體點播自適應(yīng)性診斷
對于學習者學習某一單元的流媒體課件后是否能進入下一單元的預(yù)測屬于數(shù)據(jù)挖掘和人工智能的范疇。
1.1 自適應(yīng)點播實現(xiàn)過程
自適應(yīng)點播系統(tǒng)模型如圖1所示。系統(tǒng)定期或觸發(fā)式地檢查服務(wù)器日志,從服務(wù)器向用戶流化數(shù)據(jù)時產(chǎn)生的流化日志條目和用戶對流化到緩存的數(shù)據(jù)進行訪問時產(chǎn)生的播放日志條目中了解用戶訪問流媒體課件的情況,如用戶的IP地址、訪問ID、訪問的視頻名稱、起始時間、觀看視頻的時間以及前跳、暫停、后跳交互請求等[4]。經(jīng)過一個單元的學習后,得到一張學習過程記錄表,其形式如表1所示。系統(tǒng)根據(jù)學習特征自動診斷學習者學習情況,即內(nèi)容容易、內(nèi)容較難、內(nèi)容難。
學習者學習一個單元后進入單元測試,并自動生成單元成績測試表,如表2所示。系統(tǒng)根據(jù)各類知識點成績預(yù)測學習者擁有該單元的知識水平,即水平高、水平一般、水平較低、水平極低。
系統(tǒng)自適應(yīng)地設(shè)置視頻點播導航及相關(guān)資源的調(diào)整策略如下:
R1:IF學習者感覺學習內(nèi)容難and(學習者當前的知識水平極低or低)THEN點播導航為前驅(qū)視頻單元及提供相應(yīng)學習資源鏈接。
R2:IF學習者感覺學習內(nèi)容難and(學習者當前的知識水平一般or高)THEN導航為當前單元練習測試及提供相應(yīng)學習資源鏈接。
R3:IF(學習者感覺學習內(nèi)容較難or容易)and(學習者當前的知識水平極低)THEN點播導航為當前視頻單元及提供相應(yīng)學習資源鏈接。
R4:IF(學習者感覺學習內(nèi)容較難or容易)and(學習者當前的知識水平較低)THEN導航為當前單元練習測試及提供相應(yīng)學習資源鏈接。
R5:IF(學習者感覺學習內(nèi)容較難or容易)and(學習者當前的知識水平一般or高)THEN點播導航為后繼視頻單元及提供相應(yīng)學習資源鏈接。
1.2 樸素貝葉斯分類器
對學習者學習情況和知識水平分類診斷需要進行數(shù)據(jù)挖掘。常用的分類預(yù)測方法很多,貝葉斯分類法因簡單易行、分類效果較好而被廣泛應(yīng)用。
由于Wkj≥1,所以用式(3)比式(2)更能突顯重要屬性對分類的影響?;诟怕始訖?quán)的樸素貝葉斯分類算法如下:
(1)數(shù)據(jù)預(yù)處理,從成績表中選取訓練樣本和測試樣本。
(2)掃描訓練集生成統(tǒng)計表,統(tǒng)計具備某種知識水平時各類知識點的不同分數(shù)段的樣本數(shù),以及各類知識點的不同分數(shù)段的樣本數(shù)。
(3)概率參數(shù)學習,生成概率表。
(4)權(quán)值參數(shù)學習,計算屬性Xk的權(quán)Wkj。
(5)生成加權(quán)貝葉斯分類器,按式(3)生成概率表及權(quán)值列表。
(6)調(diào)用概率表及權(quán)值列表得分類結(jié)果。
2 實驗結(jié)果及分析
為了驗證算法的有效性,基于校園局域網(wǎng)環(huán)境,對23名學習者學習網(wǎng)絡(luò)基礎(chǔ)、C#程序設(shè)計兩門課程流媒體課件的部分數(shù)據(jù),用樸素貝葉斯分類法NB、概率加權(quán)的貝葉斯分類法PWNB、加入時序的貝葉斯分類法TNB進行測試,結(jié)果如表3所示。結(jié)果表明,上述貝葉斯分類器預(yù)測學習者的學習情況和知識水平的算法簡單有效,根據(jù)學習者的學習情況與學習者的知識水平最大匹配策略推薦資源的方法可行。
以上討論了學習系統(tǒng)中自適應(yīng)流媒體點播系統(tǒng)的實現(xiàn)過程及學習者學習情況、知識水平的診斷流程,設(shè)計了一個自適應(yīng)流媒體點播系統(tǒng)模型,重點討論了貝葉斯分類算法,并應(yīng)用于實際教學。通過學習者學習過程中反饋的數(shù)據(jù),評估系統(tǒng)及算法設(shè)計的合理性、科學性。
參考文獻
[1] BRUSILOVSKY P. Layered evaluation of adaptive learning systems[J]. Int. J. Cont. Engineering Education and Life Long Learning, 2004,14(4):402-421.
[2] CHEN C M, LEE H M, CHEN Y H. Personalized E-learning System Using Item Response Theory[J]. Computers & Education, 2005, 44(3):237-155.
[3] WANG H C, LI T Y, CHANG C Y. A Web-based tutoring system with styles-matching strategy for spatial geometric transformation[J]. Interacting with Computers, 2006, 18(3):331-355.
[4] Huseyin Koyun. Logging model for windows media services[EB/OL]. http://www.microsoft.com/ardcles/LoggingModel.Aspx September.2007.
[5] YAGER R R. An extension of the naive Bayesian classifier[J]. Information Sciences,2006,176(5):577-588.
[6] HALL M. A decision tree- based attribute weighting filter for Na?觙ve Bayes[J]. Knowledge- Based Systems,2007,20(1):120-126.
[7] 令狐紅英,陳梅,王翰虎,等.基于互信息可信度的貝葉斯網(wǎng)絡(luò)入侵檢測研究[J].計算機工程與設(shè)計,2009,30(14):3288-3290.
[8] 吳今培.模糊診斷理論及其應(yīng)用[M].北京:科學出版社,1995.