《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 设计应用 > 数据组件:一种面向数据跨域流通可信抽象和封装方法
数据组件:一种面向数据跨域流通可信抽象和封装方法
网络安全与数据治理
林绍福1,李云江1,王宇航2,贾晓丰2
1.北京工业大学计算机学院;2.北京市大数据中心
摘要: 数据作为关键生产要素,具有自由流动、动态组合、跨域融合和使用增值等特征,但在跨域流通、数据孤岛连通与标准化处理等方面仍面临挑战。从软件系统视角提出数据组件抽象模型和封装方法,将数据要素抽象为独立、轻量、可复用的最小单元即数据组件,具备可寻址、可交换、可操作与可管控特性;设计实现数据组件注册和发布机制,以规范化协议支撑数据组件发现与互操作,提供统一描述、封装发布、发现获取、动态组合与可信交互等能力,支撑数据要素跨域可信高效流通。以健康养老数据共享场景为例,设计实现数据组件共享原型系统进行验证,实验表明,相较传统微服务模式,跨域传输成功率提升13%,访问成功率提升11%,检索命中率提升15 %,调度成功率提升20 %。
中圖分類號:TP311.13;TP393.09文獻(xiàn)標(biāo)志碼:ADOI:10.19358/j.issn.2097-1788.2026.04.003
中文引用格式:林紹福,李云江,王宇航,等. 數(shù)據(jù)組件:一種面向數(shù)據(jù)跨域流通可信抽象和封裝方法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2026,45(4):17-26.
英文引用格式:Lin Shaofu,Li Yunjiang,Wang Yuhang, et al. Data components: a trusted abstraction and encapsulation method for cross-domain data flow
[J].Cyber Security and Data Governance,2026,45(4):17-26.
Data components: a trusted abstraction and encapsulation method for cross-domain data flow
Lin Shaofu1,Li Yunjiang1,Wang Yuhang2,Jia Xiaofeng2
1. Faculty of Information Technology, Beijing University of Technology; 2. Beijing Big Data Center
Abstract: Data, as a key production factor, has characteristics such as free flow, dynamic combination, crossdomain integration, and valueadded utilization. However, it still faces challenges in crossdomain circulation, connecting data silos, and standardized processing.This paper proposes a data component abstraction model and encapsulation method from a software system perspective, abstracting data elements into independent, lightweight, and reusable minimum units—data components—possessing addressable, exchangeable, operable, and manageable characteristics. A data component registration and publishing mechanism is designed and implemented, using standardized protocols to support data component discovery and interoperability, providing capabilities such as unified description, encapsulation and publishing, discovery and acquisition, dynamic combination, and trusted interaction, supporting the reliable and efficient crossdomain flow of data elements. Taking a health and elderly care data sharing scenario as an example, a prototype system for data component sharing is designed and implemented for verification. Experimental results show that compared to the traditional microservice model, the cross-domain transmission success rate increases by 13%, the access success rate increases by 11%, the retrieval hit rate increases by 15%, and the scheduling success rate increases by 20%.
Key words : data component; data decoupling; trusted abstraction; standardized encapsulation; interoperability mechanism

引言

互聯(lián)網(wǎng)以開放式體系結(jié)構(gòu)和標(biāo)準(zhǔn)化協(xié)議在物理網(wǎng)絡(luò)之上構(gòu)建了一個由主機(jī)組成的虛擬數(shù)據(jù)傳輸網(wǎng)絡(luò),從而屏蔽了下層物理網(wǎng)絡(luò)的通信細(xì)節(jié),在異構(gòu)的物理網(wǎng)絡(luò)之上形成了全球一體化的網(wǎng)絡(luò)空間。隨著互聯(lián)網(wǎng)的發(fā)展和大數(shù)據(jù)時代的到來,數(shù)據(jù)成為互聯(lián)網(wǎng)中最具價值的核心資源。然而,在現(xiàn)有架構(gòu)中,數(shù)據(jù)高度依賴于具體的應(yīng)用系統(tǒng)和底層平臺,未能實現(xiàn)真正的解耦,導(dǎo)致數(shù)據(jù)在訪問、共享和流通過程中面臨諸多障礙。數(shù)據(jù)不解耦造成的問題主要體現(xiàn)在以下幾個方面:

(1)數(shù)據(jù)高度分散在各類應(yīng)用系統(tǒng)中。在當(dāng)前復(fù)雜的數(shù)據(jù)生態(tài)中,數(shù)據(jù)分散存儲與異構(gòu)化是難以完全消除的客觀存在,傳統(tǒng)的數(shù)據(jù)管理機(jī)制使數(shù)據(jù)在跨系統(tǒng)調(diào)用時存在反復(fù)的格式轉(zhuǎn)換和接口適配,使得數(shù)據(jù)的檢索、流通和訪問使用效率較低。亟需更加優(yōu)化、高效的解決方案通過標(biāo)準(zhǔn)化的封裝與接口機(jī)制,來降低跨系統(tǒng)數(shù)據(jù)訪問與整合的開銷。

(2)數(shù)據(jù)結(jié)構(gòu)、語義和接口標(biāo)準(zhǔn)高度異構(gòu)。在不同應(yīng)用場景下,數(shù)據(jù)格式多樣、語義難以統(tǒng)一、接口規(guī)范缺失,使系統(tǒng)之間的互操作性始終面臨挑戰(zhàn)。當(dāng)前主流的數(shù)據(jù)管理機(jī)制依然存在因異構(gòu)造成的效率瓶頸,需要研究如何有效化解數(shù)據(jù)異構(gòu)性衍生的數(shù)據(jù)互操作效率。

(3)數(shù)據(jù)深度依賴具體的計算任務(wù)和運行環(huán)境。數(shù)據(jù)的這一客觀特性,使得數(shù)據(jù)僅在計算任務(wù)生命周期內(nèi)是有效“存在”和使用的,而原本零散、短暫的數(shù)據(jù)難以被追溯和利用,需要研究如何降低數(shù)據(jù)與計算任務(wù)和運行環(huán)境的依賴性,以實現(xiàn)數(shù)據(jù)跨任務(wù)生命周期、跨系統(tǒng)環(huán)境的有效流轉(zhuǎn)和利用,提高數(shù)據(jù)可追溯性和利用效率。

(4)數(shù)據(jù)緊耦合于封閉系統(tǒng),外部主體難以有效訪問或調(diào)用。在面向?qū)ο?、面向服?wù)等解耦和封裝技術(shù)基礎(chǔ)上,如何更加有效地降低跨系統(tǒng)、跨行業(yè)數(shù)據(jù)復(fù)用的難度,使數(shù)據(jù)更易發(fā)現(xiàn)、獲取和利用,對于充分釋放數(shù)據(jù)要素價值、發(fā)揮賦能作用具有重要意義。

因此,為實現(xiàn)數(shù)據(jù)在互聯(lián)網(wǎng)空間中的高效流通與治理,必須從根本上改變“數(shù)據(jù)附屬于計算”的技術(shù)邏輯,推進(jìn)數(shù)據(jù)的抽象、封裝與解耦。由此,數(shù)據(jù)空間應(yīng)運而生,作為互聯(lián)網(wǎng)架構(gòu)從“以計算為中心”向“以數(shù)據(jù)為中心”演進(jìn)的關(guān)鍵形態(tài),其核心在于將數(shù)據(jù)從計算過程的附屬角色中解放出來,確立其作為一階實體的獨立地位。圍繞這一理念,數(shù)據(jù)不再僅作為計算任務(wù)中的輸入輸出,而是具備自主標(biāo)識、獨立生命周期和標(biāo)準(zhǔn)交互能力的基礎(chǔ)資源。數(shù)據(jù)解耦的推進(jìn)過程具有階段性特征,主要經(jīng)歷了三個發(fā)展階段,每個階段都對應(yīng)著不同的目標(biāo)、抽象方式和技術(shù)機(jī)制。第一次解耦是數(shù)據(jù)與應(yīng)用程序的解耦,其目標(biāo)是屏蔽數(shù)據(jù)訪問的復(fù)雜性,降低應(yīng)用系統(tǒng)的開發(fā)門檻,該階段數(shù)據(jù)基本抽象是ER模型,核心系統(tǒng)形態(tài)有數(shù)據(jù)庫和數(shù)據(jù)倉庫。第二次解耦是數(shù)據(jù)與業(yè)務(wù)系統(tǒng)的解耦,目標(biāo)是屏蔽數(shù)據(jù)匯聚分析的復(fù)雜性,降低企業(yè)級系統(tǒng)的開發(fā)門檻,數(shù)據(jù)基本抽象是“鍵-值對”KV模型,核心系統(tǒng)形態(tài)有數(shù)據(jù)湖。第三次解耦是數(shù)據(jù)與生產(chǎn)和消費主體的解耦,目標(biāo)是屏蔽數(shù)據(jù)流轉(zhuǎn)與使用的復(fù)雜性,降低數(shù)據(jù)要素社會化供給、流通與應(yīng)用的門檻。此次解耦的相關(guān)理論和技術(shù)還在研究發(fā)展中。

基于以上問題以及數(shù)據(jù)解耦的發(fā)展,相關(guān)組織及學(xué)者開展數(shù)據(jù)要素基礎(chǔ)設(shè)施技術(shù)研究,旨在探索出一條安全、高效的國家數(shù)據(jù)流通利用基礎(chǔ)設(shè)施的有效技術(shù)路徑。當(dāng)前正在研究的主要技術(shù)路線見表1。

通過對萬維網(wǎng)[6]和數(shù)字對象架構(gòu)(Digital Objec Architecture,DOA)的分析,面向數(shù)據(jù)要素治理應(yīng)用場景和數(shù)據(jù)加工利用的第三次解耦趨勢,本文以構(gòu)建數(shù)據(jù)要素高效流通的基礎(chǔ)理論模型和技術(shù)機(jī)制為中心,聚焦數(shù)據(jù)組件的理論模型構(gòu)建和技術(shù)實現(xiàn),厘清其作為數(shù)據(jù)要素流通最小單元的基本特征和可尋址、可交換、可操作與可管控等關(guān)鍵特性,開展數(shù)據(jù)組件模型、標(biāo)識機(jī)制、互操作協(xié)議及注冊發(fā)布發(fā)現(xiàn)等核心機(jī)制的研究,旨在建立一套具有規(guī)范性、可擴(kuò)展性和可操作性的技術(shù)框架,實現(xiàn)數(shù)據(jù)組件在多主體、多系統(tǒng)間的發(fā)現(xiàn)、獲取、流轉(zhuǎn)與共享利用,推動數(shù)據(jù)要素在可信環(huán)境下高效、安全、有序地流通。


本文詳細(xì)內(nèi)容請下載:

http://ihrv.cn/resource/share/2000007055


作者信息:

林紹福1,李云江1,王宇航2,賈曉豐2

(1.北京工業(yè)大學(xué)計算機(jī)學(xué)院,北京100124;2.北京市大數(shù)據(jù)中心,北京100193)

2.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。