《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 设计应用 > 基于大语言模型的地理大数据知识图谱构建及安全应用
基于大语言模型的地理大数据知识图谱构建及安全应用
网络安全与数据治理
刘颖1,2,李勇1
1.清华大学电子工程系;2.湖南省长沙市雅礼中学
摘要: 地理知识图谱因其结构化和可解释性等优势,在基于地理知识的复杂任务的推理与认知中具有重要价值。然而,其构建过程通常费时费力且成本高昂,严重制约了实际应用。为解决这一问题,提出了一种基于大语言模型智能体的自动化构建方案,旨在实现高效、低成本的地理知识图谱生成。该方案利用大语言模型的自然语言理解能力和代码生成能力,通过设计针对多源异构地理数据的自动解析与处理流程,并通过引入基于推理的自动反馈与检查机制,显著提升了执行成功率。进一步,讨论了该知识图谱在城市安全领域的应用前景。通过研发能够自主完成地理知识图谱构建的系统,为地理知识图谱的广泛应用提供了数据基础,为城市安全应用提供了技术基础。
中圖分類號:TP309文獻(xiàn)標(biāo)識碼:ADOI:10.19358/j.issn.2097-1788.2025.08.005
引用格式:劉穎,李勇. 基于大語言模型的地理大數(shù)據(jù)知識圖譜構(gòu)建及安全應(yīng)用[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(8):30-38.
Construction of geographical knowledge graphs based on large language models and its security applications
Liu Ying1,2,Li Yong1
1. Department of Electronic Engineering, Tsinghua University;2. Yali Middle School
Abstract: Geographical knowledge graphs are valuable for complex geographic tasks due to their structured and interpretable nature. However, their construction is often time-consuming, labor-intensive, and costly, which limits practical applications. To address this issue, an automated construction approach based on large language model agents is proposed to achieve efficient and low-cost generation of geographical knowledge graphs. This approach leverages the natural language understanding and code generation capabilities of large language models to design automatic parsing and processing workflows for multi-source heterogeneous geographic data. By introducing reasoning-based feedback and verification mechanisms, the execution success rate is significantly improved. Finally, we discuss the potential applications of this knowledge graph in the urban safety area. Ultimately, a system capable of autonomously constructing geographical knowledge graphs is developed, providing a solid data foundation for the wide application of geographic knowledge graphs and a technical foundation for urban safety applications.
Key words : geographical knowledge graph; large language model; automatic construction; code generation

引言

地理知識圖譜通過形式化描述領(lǐng)域中的概念、實體及其關(guān)系,構(gòu)建起結(jié)構(gòu)化的地理知識表達(dá)體系,為復(fù)雜地理任務(wù)中的知識推理與決策支持提供了重要基礎(chǔ)。其在城市規(guī)劃、災(zāi)害應(yīng)急響應(yīng)、交通管理等場景中具有廣泛應(yīng)用價值,能夠支持語義空間分析與系統(tǒng)優(yōu)化,揭示地理現(xiàn)象間的潛在關(guān)聯(lián),為科學(xué)研究和政策制定提供依據(jù)。然而,由于地理知識圖譜的結(jié)構(gòu)復(fù)雜性和數(shù)據(jù)多源性,目前的構(gòu)建方法大多依賴專家知識和手工操作,導(dǎo)致時間成本和人力成本居高不下。同時,不同數(shù)據(jù)來源和應(yīng)用場景下的知識圖譜構(gòu)建過程缺乏通用性和靈活性,難以實現(xiàn)復(fù)用,嚴(yán)重制約了地理知識圖譜的可擴(kuò)展性與實際應(yīng)用效果。

近年來,大語言模型憑借其強(qiáng)大的自然語言能力和推理規(guī)劃能力,為解決上述問題提供了新的思路。本文提出了一種基于大語言模型智能體的地理知識圖譜自動化構(gòu)建方案,旨在降低構(gòu)建成本并提高通用性。該方案利用大語言模型的能力設(shè)計自動解析與處理流程,并通過引入基于推理的反饋機(jī)制提升執(zhí)行成功率。在北京和長沙兩個城市的多源異構(gòu)地理數(shù)據(jù)上的實驗驗證了該方案的有效性,并為城市安全應(yīng)急提供了新方式,為地理知識圖譜的自動構(gòu)建提供了新范式。

本文主要貢獻(xiàn)可總結(jié)為如下三點:

(1)針對現(xiàn)有地理知識圖譜構(gòu)建過程依賴專家規(guī)則、效率低、通用性差等問題,本文首次提出一種融合大語言模型推理與規(guī)劃能力的地理大數(shù)據(jù)知識圖譜自動構(gòu)建新范式,實現(xiàn)從多源異構(gòu)地理數(shù)據(jù)到知識圖譜的端到端自動化生成。

(2)構(gòu)建包含規(guī)劃執(zhí)行單元、記憶單元、自主反思單元在內(nèi)的智能體體系,明確了內(nèi)容理解、實體對齊、關(guān)聯(lián)分析、質(zhì)量驗證等核心任務(wù)模塊,并結(jié)合檢索增強(qiáng)生成(RetrievalAugmented Generation, RAG)與自動化代碼生成實現(xiàn)了可復(fù)用的自動構(gòu)建流程。

(3)在北京和長沙兩地的多源異構(gòu)地理數(shù)據(jù)上開展實驗,結(jié)果表明所提出方法能夠高效生成高質(zhì)量的地理知識圖譜,并在城市安全應(yīng)急等典型應(yīng)用場景中展現(xiàn)出良好的實用性與可擴(kuò)展性。


本文詳細(xì)內(nèi)容請下載:

http://ihrv.cn/resource/share/2000006648


作者信息:

劉穎1,2,李勇1

(1.清華大學(xué)電子工程系,北京100086;

2.湖南省長沙市雅禮中學(xué),湖南長沙410001)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。