摘 要: 將課程教學(xué)資源融合到學(xué)生模型構(gòu)建中,描述了包括領(lǐng)域知識拓?fù)浣Y(jié)構(gòu)的建立、條件概率表學(xué)習(xí)算法的推理的詳細(xì)過程,最終得到了學(xué)生模型中關(guān)于章節(jié)知識項的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖,并通過一個實驗系統(tǒng)對個性化教學(xué)系統(tǒng)中學(xué)生模型建構(gòu)的整個框架的可行性進(jìn)行了驗證。
關(guān)鍵詞: 個性化教學(xué);貝葉斯網(wǎng)絡(luò);學(xué)生模型;建模
個性化教育是現(xiàn)代遠(yuǎn)程教育最重要的特點之一,其中計算機(jī)網(wǎng)絡(luò)特有的信息、數(shù)據(jù)庫管理技術(shù)和雙向交互功能,為個性化教學(xué)提供了有效的實現(xiàn)途徑與條件。在個性化教學(xué)系統(tǒng)中,學(xué)生模型是學(xué)生的認(rèn)知狀態(tài)表示。它的作用是為系統(tǒng)提供關(guān)于學(xué)生對知識的掌握情況的信息,以便能夠?qū)W(xué)生進(jìn)行正確的評價和預(yù)測,從而提供個性化的學(xué)習(xí)內(nèi)容。因此,如何建立一個準(zhǔn)確、高效的學(xué)生模型是整個系統(tǒng)的核心。分析和表示學(xué)生模型的過程稱為學(xué)生建模[1-2]。
1 有關(guān)貝葉斯網(wǎng)絡(luò)理論知識
貝葉斯網(wǎng)絡(luò)(Bayesian Networks)也稱為信度網(wǎng)、因果網(wǎng),主要用于表示變量之間的依賴關(guān)系,并為任何全聯(lián)合概率分布提供一種簡明的規(guī)范。貝葉斯網(wǎng)表達(dá)了各個節(jié)點間的條件獨立關(guān)系,可以直觀地從貝葉斯網(wǎng)中得出屬性間的條件獨立以及依賴關(guān)系;另外可以認(rèn)為貝葉斯網(wǎng)以另一種形式表示出了事件的聯(lián)合概率分布,根據(jù)貝葉斯網(wǎng)的網(wǎng)絡(luò)結(jié)構(gòu)以及條件概率表(CPT)可以快速得到每個基本事件(所有屬性值的一個組合)的概率。貝葉斯學(xué)習(xí)理論利用先驗知識和樣本數(shù)據(jù)來獲得對未知樣本的估計,而概率(包括聯(lián)合概率和條件概率)是先驗信息和樣本數(shù)據(jù)信息在貝葉斯學(xué)習(xí)理論當(dāng)中的表現(xiàn)形式。
2 學(xué)生模型中教學(xué)資源信息的建模
貝葉斯網(wǎng)絡(luò)的建模目的是對所包含的定性知識和定量知識進(jìn)行結(jié)構(gòu)描述,定性部分由網(wǎng)絡(luò)結(jié)構(gòu)來描述,定量部分由條件概率分布函數(shù)來表示。從原始數(shù)據(jù)中構(gòu)造貝葉斯網(wǎng)絡(luò)模型,實質(zhì)也是對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘:先找出最符合原始數(shù)據(jù)定性的網(wǎng)絡(luò)圖關(guān)系,然后根據(jù)網(wǎng)絡(luò)圖中的因果關(guān)系,計算節(jié)點間的條件概率。構(gòu)造貝葉斯網(wǎng)絡(luò)可以分為4個階段:(1)定義域變量;(2)確定網(wǎng)絡(luò)結(jié)構(gòu);(3)確定條件概率分布函數(shù);(4)運用到實際系統(tǒng)中,并根據(jù)系統(tǒng)產(chǎn)生的數(shù)據(jù)優(yōu)化貝葉斯網(wǎng)絡(luò)。
在學(xué)生模型中教學(xué)資源信息的建模初期要考慮整個教學(xué)資源信息的網(wǎng)絡(luò)結(jié)構(gòu),然后再考慮局部的知識結(jié)構(gòu):知識點的前驅(qū)、后繼關(guān)系,知識點之間的相互影響程度,知識點的狀態(tài),以及與知識點相關(guān)的測試(包括識記、理解、應(yīng)用、分析、綜合等狀態(tài)),只有經(jīng)過測試,才能實現(xiàn)個性化教學(xué)。整個過程為將來個性化的評估做準(zhǔn)備,根據(jù)評估結(jié)果實現(xiàn)貝葉斯網(wǎng)絡(luò)的局部更新,也即學(xué)生知識狀態(tài)的更新,貝葉斯網(wǎng)絡(luò)根據(jù)更新過的學(xué)生狀態(tài),個性化地把內(nèi)容呈現(xiàn)給學(xué)生[3]。
2.1 學(xué)生模型中整體教學(xué)資源的知識結(jié)構(gòu)
本文把教學(xué)資源分為6個層次:課程知識、主知識項(按章劃分)、一級知識項(按節(jié)劃分)、二級知識項(也稱復(fù)合知識項)、基本概念知識項、與上述知識相關(guān)的測試。層與層之間只有繼承關(guān)系,同層內(nèi)的知識可以是前驅(qū)和后繼的關(guān)系,也可以是平行和關(guān)聯(lián)等關(guān)系??梢哉J(rèn)為前驅(qū)和后繼關(guān)系是關(guān)聯(lián)的一種特殊形式。
2.2 學(xué)生模型中局部教學(xué)資源的知識結(jié)構(gòu)
2.2.1 定義域變量和確定網(wǎng)絡(luò)結(jié)構(gòu)
學(xué)生模型的建模就是要針對學(xué)生所學(xué)課程掌握的知識結(jié)構(gòu)進(jìn)行建模,從而根據(jù)學(xué)生的知識狀況給出學(xué)生學(xué)習(xí)狀況的評價。
以《Delphi程序設(shè)計教程》為例,按照課程的章節(jié)安排列出課程的知識結(jié)構(gòu),為了簡化,只選取部分知識內(nèi)容做出說明,整體結(jié)構(gòu)可依次類推。比如在基本程序控制結(jié)構(gòu)這一章,一級知識項(章)為:基本程序控制結(jié)構(gòu);二級知識項(節(jié))有:順序結(jié)構(gòu)、循環(huán)結(jié)構(gòu)、選擇結(jié)構(gòu);復(fù)合概念有:While循環(huán)、For循環(huán)、Repeat循環(huán);基本概念有:關(guān)系運算符、賦值語句、變量、數(shù)據(jù)類型。需要在貝葉斯網(wǎng)絡(luò)中加入測試項作為輸入節(jié)點,也可稱之為觀測節(jié)點。每個節(jié)點代表一個測試該知識點的測試項。
節(jié)點的狀態(tài)表示學(xué)生對該知識項的掌握程度,例如可以用4個等級來表示學(xué)生對知識項的掌握程度,A:表示學(xué)生對特定知識項已完全熟練掌握; B:表示學(xué)生對知識項基本掌握,但是仍有一些問題;C:表示學(xué)生處在初級階段,有許多問題;D:表示學(xué)生對該知識項完全不了解。每一等級對應(yīng)一個條件概率值(值的加權(quán)和為1),該值是基于對用戶的觀測值得到的用戶對知識項的掌握程度。在系統(tǒng)設(shè)計過程中,為了簡化,設(shè)置節(jié)點的狀態(tài)為True(掌握)、False(未掌握)。
2.2.2 條件概率估計
經(jīng)過上面的分析,接下來將討論如何獲得知識項之間的影響程度的條件概率表。
在貝葉斯網(wǎng)絡(luò)構(gòu)建中所有節(jié)點都要給定條件概率,對于沒有父節(jié)點的節(jié)點,需要給定其先驗概率,條件概率可以通過樣本學(xué)習(xí)和通過專家估計獲得[4]。
(1)設(shè)計分析
在由數(shù)據(jù)類型(A)、關(guān)系運算符(B)、變量(C)、While循環(huán)(D)教學(xué)資源構(gòu)成的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中,每個節(jié)點有兩個離散的狀態(tài):True和False,如果需要,節(jié)點也可以包括更多的狀態(tài)。設(shè)計網(wǎng)絡(luò)時,必須指定每個節(jié)點的條件概率表,需要獲得P(A)、P(C)、P(B)、P(D/C)、P(D/B)。
(2)樣本收集
經(jīng)驗數(shù)據(jù)來自于某校某班學(xué)生學(xué)習(xí)“基本程序控制結(jié)構(gòu)”這一章節(jié)后,經(jīng)過測試,對其測試結(jié)果進(jìn)行分析并獲得學(xué)習(xí)知識項之間的相互影響程度,這樣就確定了利用貝葉斯網(wǎng)絡(luò)所建學(xué)生模型中網(wǎng)絡(luò)拓?fù)渲R項之間的條件概率函數(shù)。
將學(xué)生的得分情況分為100~90、90~80、80~70、70~60、60以下5個分?jǐn)?shù)段。認(rèn)為如果學(xué)生答對涉及到該知識項的題目,那么他對該知識項的知識狀態(tài)為True(掌握);反之,如果答錯,則認(rèn)為他對該知識項的知識狀態(tài)為False(未掌握)。
(3)學(xué)習(xí)條件概率表[5-6]
算法的設(shè)計思想是:首先按照網(wǎng)絡(luò)構(gòu)建中節(jié)點的拓?fù)漤樞颍鶕?jù)每個分?jǐn)?shù)段隨機(jī)抽取n份考試的試卷用于對網(wǎng)絡(luò)中各節(jié)點的狀態(tài)進(jìn)行賦值,當(dāng)所有節(jié)點都被賦值一遍后就得到該網(wǎng)絡(luò)中的一次采樣樣本,依此重復(fù),得到10 n個樣本,即一個樣本序列;然后對該樣本序列按相關(guān)列進(jìn)行聯(lián)合統(tǒng)計可得到網(wǎng)絡(luò)近似推理結(jié)果。由于隨機(jī)采樣時考慮了節(jié)點的先驗信息,所以當(dāng)樣本數(shù)n取很大時,這些采樣樣本的邊緣統(tǒng)計量和條件統(tǒng)計量就可以趨近于事件的真實發(fā)生概率和條件發(fā)生概率。
對所有節(jié)點都采樣了m遍,得到m組樣本,即樣本序列S,然后對樣本序列S按列進(jìn)行單獨統(tǒng)計,得到節(jié)點的全概率;對多列進(jìn)行聯(lián)合統(tǒng)計,得到節(jié)點間的聯(lián)合概率和條件概率。
所謂聯(lián)合統(tǒng)計,就是把證據(jù)節(jié)點和推理目標(biāo)節(jié)點的采樣樣本聯(lián)合起來進(jìn)行統(tǒng)計,就得到了給定證據(jù)后目標(biāo)節(jié)點發(fā)生的條件概率和聯(lián)合概率。對網(wǎng)絡(luò)中的所有節(jié)點按拓?fù)漤樞虿蓸觤次,得到樣本序列S,對樣本序列進(jìn)行適當(dāng)?shù)慕y(tǒng)計,可以得到網(wǎng)絡(luò)的近似推理結(jié)果。
節(jié)點Ni(i=1,…,n)發(fā)生的全概率就是單獨對該列進(jìn)行統(tǒng)計的結(jié)果。例如,要知道學(xué)生對于“變量”(C)已經(jīng)True的情況的概率P(C=True),只要把對是T的那些樣本挑選出來,然后統(tǒng)計一下T的個數(shù),除以總的采樣次數(shù)m,就可以近似為C這一知識項學(xué)生已經(jīng)True(掌握)的概率,即:
節(jié)點Ni(i=1,…,n)發(fā)生的條件概率就是把那些條件節(jié)點和該節(jié)點所在的相關(guān)列聯(lián)合起來進(jìn)行統(tǒng)計。例如,計算節(jié)點“D”在節(jié)點“B”已經(jīng)True(掌握)情況下發(fā)生T狀態(tài)(D也為True)的概率,也即求P(D=True|B=True),可以這樣進(jìn)行:首先,把在“B”中是T的那些樣本挑選出來,形成新的樣本序列So,其組數(shù)為no;其次,把樣本序列So中在“D”中是T的那些樣本挑選出來,然后統(tǒng)計T的個數(shù),除以no,就可以近似為“D”在“B”取狀態(tài)為True的情況下發(fā)生False狀態(tài)的概率:
類似地,幾個節(jié)點的聯(lián)合概率則是把同時滿足這些節(jié)點狀態(tài)的樣本挑出來,得到的樣本組數(shù)除以總的樣本組數(shù)m即可。
單獨的節(jié)點狀態(tài)概率,可以使用條件概率規(guī)則,并沿著邊進(jìn)行傳播。
網(wǎng)絡(luò)設(shè)計完成后,條件概率表進(jìn)行了指定,網(wǎng)絡(luò)進(jìn)行了傳播。
通過上面的分析,從定性方面完成了學(xué)生所學(xué)知識項的邏輯關(guān)系,并且通過經(jīng)驗數(shù)據(jù)獲得了關(guān)于這些知識項之間存在影響程度的定量數(shù)據(jù),最終構(gòu)建成的個性化教學(xué)中關(guān)于《Delphi程序設(shè)計教程》課程中章節(jié)知識項的學(xué)生模型的框架如圖1所示。
2.2.3 學(xué)生模型原型系統(tǒng)的實現(xiàn)
根據(jù)上面理論方面的分析,已經(jīng)構(gòu)建了個性化教學(xué)系統(tǒng)中學(xué)生模型的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖,為了證明整個系統(tǒng)框架的可行性,需要把前面的理論構(gòu)建與具體的技術(shù)相結(jié)合以實現(xiàn)可用的系統(tǒng)。
該系統(tǒng)設(shè)計中運用不同的顏色來標(biāo)記知識項掌握的4種情況:綠色表示已掌握;紅色表示已學(xué)習(xí)但未掌握;黃色表示未學(xué)習(xí),適合學(xué)習(xí);灰色表示不適合學(xué)習(xí)。當(dāng)貝葉斯網(wǎng)絡(luò)獲得證據(jù)信息后標(biāo)記的顏色狀態(tài)會發(fā)生變化。基于貝葉斯網(wǎng)絡(luò)先驗概率,知識項全部標(biāo)記為黃色,如圖2所示,新注冊用戶登錄系統(tǒng)時可在黃色節(jié)點中點擊選擇最初學(xué)習(xí)節(jié)點,學(xué)習(xí)后對相應(yīng)知識項進(jìn)行測試,根據(jù)系統(tǒng)導(dǎo)航,若測試合格則按引導(dǎo)進(jìn)行下一知識項的學(xué)習(xí),未通過系統(tǒng)會提示返回上一個節(jié)點重新學(xué)習(xí)。
從這個系統(tǒng)中可以看到:基于貝葉斯網(wǎng)絡(luò)的個性化教學(xué)系統(tǒng)既有交互性,又體現(xiàn)了個性化,通過系統(tǒng)的導(dǎo)航功能(不同顏色的應(yīng)用)可以幫助進(jìn)行學(xué)習(xí)的指導(dǎo),當(dāng)學(xué)生想學(xué)某一概念時系統(tǒng)會把它的前驅(qū)知識點以序列形式呈現(xiàn)給學(xué)生,不同學(xué)生要求不一樣,系統(tǒng)提供的導(dǎo)航也不一樣,真正體現(xiàn)了個性化教學(xué)。
隨著網(wǎng)絡(luò)教學(xué)平臺的不斷涌現(xiàn),個性化教學(xué)系統(tǒng)的研究和開發(fā)成為遠(yuǎn)程教育中的關(guān)鍵問題和熱點。而在個性化教學(xué)系統(tǒng)中的學(xué)生模型是其中的重要組成部分,在遠(yuǎn)程教育領(lǐng)域起著重要的作用。因此,研究如何設(shè)計和利用學(xué)生模型來實現(xiàn)遠(yuǎn)程教育中的個性化教學(xué)有著重要的意義。
參考文獻(xiàn)
[1] 劉桓,曹紅菊.自適應(yīng)學(xué)習(xí)系統(tǒng)的研究與設(shè)計[J].教育技術(shù)導(dǎo)刊,2006,(3):39-40.
[2] 余勝泉.適應(yīng)性學(xué)習(xí)——遠(yuǎn)程教育的發(fā)展趨勢.開放教育研究,2000,6(3):70-76.
[3] 冀俊忠,劉椿年.貝葉斯網(wǎng)及概率推理在智能教學(xué)中的應(yīng)用[J].北京工業(yè)大學(xué)學(xué)報,2002,9(28):353-358.
[4] 翼俊忠,劉椿午,沙志強(qiáng).貝葉斯模型的學(xué)習(xí)、推理和應(yīng)用[J].計算機(jī)工程與應(yīng)用,2003,7(5):145-147.
[5] 胡兆勇,屈梁生.貝葉斯網(wǎng)絡(luò)推理的一種仿真算法[J].系統(tǒng)仿真學(xué)報,2004,26(2):286-288.
[6] 劉偉娜,霍利民,張立國.貝葉斯網(wǎng)絡(luò)精確推理算法的研究[J].網(wǎng)絡(luò)與通信,2006,22(9):92-94.