引用格式:劉穎,李勇. 基于大語言模型的地理大數(shù)據(jù)知識(shí)圖譜構(gòu)建及安全應(yīng)用[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(8):30-38.
引言
地理知識(shí)圖譜通過形式化描述領(lǐng)域中的概念、實(shí)體及其關(guān)系,構(gòu)建起結(jié)構(gòu)化的地理知識(shí)表達(dá)體系,為復(fù)雜地理任務(wù)中的知識(shí)推理與決策支持提供了重要基礎(chǔ)。其在城市規(guī)劃、災(zāi)害應(yīng)急響應(yīng)、交通管理等場(chǎng)景中具有廣泛應(yīng)用價(jià)值,能夠支持語義空間分析與系統(tǒng)優(yōu)化,揭示地理現(xiàn)象間的潛在關(guān)聯(lián),為科學(xué)研究和政策制定提供依據(jù)。然而,由于地理知識(shí)圖譜的結(jié)構(gòu)復(fù)雜性和數(shù)據(jù)多源性,目前的構(gòu)建方法大多依賴專家知識(shí)和手工操作,導(dǎo)致時(shí)間成本和人力成本居高不下。同時(shí),不同數(shù)據(jù)來源和應(yīng)用場(chǎng)景下的知識(shí)圖譜構(gòu)建過程缺乏通用性和靈活性,難以實(shí)現(xiàn)復(fù)用,嚴(yán)重制約了地理知識(shí)圖譜的可擴(kuò)展性與實(shí)際應(yīng)用效果。
近年來,大語言模型憑借其強(qiáng)大的自然語言能力和推理規(guī)劃能力,為解決上述問題提供了新的思路。本文提出了一種基于大語言模型智能體的地理知識(shí)圖譜自動(dòng)化構(gòu)建方案,旨在降低構(gòu)建成本并提高通用性。該方案利用大語言模型的能力設(shè)計(jì)自動(dòng)解析與處理流程,并通過引入基于推理的反饋機(jī)制提升執(zhí)行成功率。在北京和長(zhǎng)沙兩個(gè)城市的多源異構(gòu)地理數(shù)據(jù)上的實(shí)驗(yàn)驗(yàn)證了該方案的有效性,并為城市安全應(yīng)急提供了新方式,為地理知識(shí)圖譜的自動(dòng)構(gòu)建提供了新范式。
本文主要貢獻(xiàn)可總結(jié)為如下三點(diǎn):
(1)針對(duì)現(xiàn)有地理知識(shí)圖譜構(gòu)建過程依賴專家規(guī)則、效率低、通用性差等問題,本文首次提出一種融合大語言模型推理與規(guī)劃能力的地理大數(shù)據(jù)知識(shí)圖譜自動(dòng)構(gòu)建新范式,實(shí)現(xiàn)從多源異構(gòu)地理數(shù)據(jù)到知識(shí)圖譜的端到端自動(dòng)化生成。
(2)構(gòu)建包含規(guī)劃執(zhí)行單元、記憶單元、自主反思單元在內(nèi)的智能體體系,明確了內(nèi)容理解、實(shí)體對(duì)齊、關(guān)聯(lián)分析、質(zhì)量驗(yàn)證等核心任務(wù)模塊,并結(jié)合檢索增強(qiáng)生成(RetrievalAugmented Generation, RAG)與自動(dòng)化代碼生成實(shí)現(xiàn)了可復(fù)用的自動(dòng)構(gòu)建流程。
(3)在北京和長(zhǎng)沙兩地的多源異構(gòu)地理數(shù)據(jù)上開展實(shí)驗(yàn),結(jié)果表明所提出方法能夠高效生成高質(zhì)量的地理知識(shí)圖譜,并在城市安全應(yīng)急等典型應(yīng)用場(chǎng)景中展現(xiàn)出良好的實(shí)用性與可擴(kuò)展性。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006648
作者信息:
劉穎1,2,李勇1
(1.清華大學(xué)電子工程系,北京100086;
2.湖南省長(zhǎng)沙市雅禮中學(xué),湖南長(zhǎng)沙410001)