引用格式:徐睿,劉金,馮志,等. 基于知識圖譜與本體驅(qū)動的數(shù)據(jù)建模框架[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(8):39-45.
引言
數(shù)據(jù)建模作為數(shù)據(jù)治理的核心任務(wù),通常采用實(shí)體-關(guān)系模型,通過定義實(shí)體、屬性和關(guān)系等抽象結(jié)構(gòu)來描述數(shù)據(jù)的語義,再映射為具體的數(shù)據(jù)庫表、字段及約束,從而實(shí)現(xiàn)數(shù)據(jù)的存儲與管理。然而,隨著數(shù)據(jù)量的迅猛增長以及業(yè)務(wù)需求的日益復(fù)雜,傳統(tǒng)的關(guān)系型數(shù)據(jù)建模方法逐漸暴露出諸多局限性。例如,傳統(tǒng)方法依賴于靜態(tài)的表結(jié)構(gòu)和字段定義,難以有效處理多維度、動態(tài)變化的數(shù)據(jù)關(guān)系,也很難適應(yīng)異構(gòu)數(shù)據(jù)源的集成需求。隨著大數(shù)據(jù)、人工智能和知識圖譜等新興技術(shù)的快速發(fā)展,數(shù)據(jù)建模的范式也在發(fā)生深刻變化。
在這一背景下,知識圖譜和動態(tài)本體技術(shù)可以在數(shù)據(jù)治理領(lǐng)域發(fā)揮重要作用。知識圖譜通過圖結(jié)構(gòu)表示實(shí)體及其關(guān)系,并能夠通過語義推理揭示數(shù)據(jù)之間的深層次聯(lián)系。本體則為知識圖譜提供了一個(gè)規(guī)范的語義框架,幫助明確各類實(shí)體及其屬性的定義及相互關(guān)系。知識圖譜和動態(tài)本體的結(jié)合,不僅提供了更靈活的建模手段,還能夠促進(jìn)跨系統(tǒng)的數(shù)據(jù)集成,提升數(shù)據(jù)的語義理解與質(zhì)量控制。
這一映射過程不僅是技術(shù)創(chuàng)新,也體現(xiàn)了對人類認(rèn)知與理解世界方式的模擬。認(rèn)知科學(xué)認(rèn)為人類通過抽象符號、分類和關(guān)系表達(dá)知識,本體與知識圖譜正是構(gòu)建這種抽象模型的工具。在智能化趨勢下,知識圖譜作為模擬人類認(rèn)知的“圖式語言”,幫助機(jī)器理解、推理與學(xué)習(xí)數(shù)據(jù),例如結(jié)合圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network,GNN)進(jìn)行推理與分析[1]。在網(wǎng)絡(luò)安全領(lǐng)域,知識圖譜能夠通過路徑推理識別攻擊者的潛在利用路徑(如漏洞→系統(tǒng)→攻擊者),或通過關(guān)系映射發(fā)現(xiàn)未修復(fù)漏洞的關(guān)聯(lián)防御措施。
在此基礎(chǔ)上,考慮到當(dāng)前大部分業(yè)務(wù)系統(tǒng)的數(shù)據(jù)仍主要存儲于結(jié)構(gòu)化數(shù)據(jù)庫中,而知識圖譜直接應(yīng)用于業(yè)務(wù)系統(tǒng)的落地尚存在較大挑戰(zhàn),因此本文提出一種基于知識圖譜和本體驅(qū)動的數(shù)據(jù)建模框架。通過將知識圖譜中的實(shí)體、屬性和關(guān)系有效映射到數(shù)據(jù)庫表結(jié)構(gòu),實(shí)現(xiàn)從語義建模到結(jié)構(gòu)化數(shù)據(jù)存儲的高效轉(zhuǎn)化;并結(jié)合威脅情報(bào)自動抽取、跨系統(tǒng)數(shù)據(jù)融合等業(yè)務(wù)應(yīng)用場景驗(yàn)證框架能力。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006649
作者信息:
徐睿1,2,劉金1,2,馮志1,2,張雅勤1,2,董偉1,2
(1.中國信息安全研究院有限公司, 北京102209;
2.華北計(jì)算機(jī)系統(tǒng)工程研究所, 北京100083)