123,123

基于多目标优化的医学影像可解释性增强研究

网络安全与数据治理

李海芳1,2,3，唐超3，岳鑫3，张强1,2

1.大连理工大学计算机科学与技术学院； 2.大连理工大学社会计算与认知智能教育部重点实验室； 3.新疆师范大学计算机科学技术学院

摘要： 针对医学影像场景的解释需求，提出一种基于多目标粒子群优化的解释增强方法，通过优化解释生成过程来提升解释质量与临床可读性。该方法在 LIME（局部与模型无关的解释）框架中引入多目标搜索机制，实现了高解释保真性与高区域稀疏性的自适应权衡，并获得了帕累托最优的解释结果。为验证方法有效性，以膝关节X光影像为实验对象，基于公开膝骨关节炎数据集在典型卷积神经网络上进行了实验评估。实验结果显示，保真性最高可提升18%，稀疏性最大可降低22%，展现出更高的聚焦性、稳定性，为基于人工智能的医疗影像可信诊断提供了可行技术路径。

關(guān)鍵詞： 膝骨关节炎医学影像可解释性多目标粒子群优化 LIME 可信赖医疗人工智能

中圖分類號：TP309.7文獻(xiàn)標(biāo)志碼：ADOI:10.19358/j.issn.2097-1788.2026.04.008
中文引用格式：李海芳，唐超，岳鑫，等. 基于多目標(biāo)優(yōu)化的醫(yī)學(xué)影像可解釋性增強(qiáng)研究［J］.網(wǎng)絡(luò)安全與數(shù)據(jù)治理，2026，45（4）：59-67.
英文引用格式：Li Haifang，Tang Chao，Yue Xin, et al. Multiobjective optimization for enhanced explainability in medical imaging models
［J］.Cyber Security and Data Governance，2026，45（4）：59-67.

Multi-objective optimization for enhanced explainability in medical imaging models

Li Haifang1,2,3，Tang Chao3，Yue Xin3，Zhang Qiang1,2

1.School of Computer Science and Technology,Dalian University of Technology； 2. Key Laboratory of Social Computing and Cognitive Intelligence (Dalian University of Technology)，Ministry of Education；3. School of Computer Science and Technology,Xinjiang Normal University

Abstract： To address the need for reliable interpretability in medical imaging, this study proposes a multi-objective particle swarm optimization-enhanced explanation framework that improves explanation quality and clinical readability by optimizing the LIME (Local and Model-Agnostic Explanations) process. The proposed method incorporates a multi-objective search strategy into the LIME pipeline, enabling an adaptive tradeoff between explanatory fidelity and regional sparsity, and producing Pareto-optimal explanation outcomes. Experiments conducted on knee X-ray images from a publicly available knee osteoarthritis dataset using representative convolutional neural networks demonstrate that the method increases fidelity by up to 18% and reduces sparsity by up to 22%, resulting in more focused and stable explanations. These results indicate that the proposed framework offers a feasible and effective pathway toward trustworthy AI-driven medical image interpretation.

Key words : knee osteoarthritis; medical image explainability; multiobjective particle swarm optimization; LIME;trustworthy medical artificial intelligence

引言

隨著深度學(xué)習(xí)模型與計(jì)算資源的快速發(fā)展，數(shù)據(jù)驅(qū)動方法已在視覺與醫(yī)學(xué)影像分析中取得顯著進(jìn)展。然而，由于深度神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)與訓(xùn)練過程中的高度復(fù)雜性，其決策機(jī)制往往呈現(xiàn)“黑箱”特征，使得模型預(yù)測結(jié)果難以被人類理解與復(fù)核。在醫(yī)療影像等高風(fēng)險應(yīng)用場景中，這種不可解釋性會直接影響系統(tǒng)的可信性、可審計(jì)性與臨床可用性，并進(jìn)一步牽涉到人機(jī)協(xié)作流程與責(zé)任歸屬等系統(tǒng)性問題［1-2］。相關(guān)研究指出，可信醫(yī)療AI的解釋機(jī)制不應(yīng)僅停留在單一算法層面的可視化呈現(xiàn)，而需與臨床工作流、交互方式與問責(zé)框架形成閉環(huán)，以支撐真實(shí)場景下的信任建立與可控使用［3］。

在醫(yī)學(xué)影像領(lǐng)域，膝骨關(guān)節(jié)炎（Knee Osteoarthritis, KOA）是較為常見的退行性關(guān)節(jié)疾病，其 X 光影像中的關(guān)節(jié)間隙變窄、軟骨下骨硬化及骨贅形成等特征是臨床分級和診斷的關(guān)鍵依據(jù)。近年來，KOA 的自動診斷與分級任務(wù)的處理廣泛應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)，并在多個公開數(shù)據(jù)集上獲得了較高的識別精度［4］。但多數(shù)方法仍以“預(yù)測輸出”為主，缺乏對模型預(yù)測依據(jù)的清晰解釋，臨床醫(yī)生難以評估模型是否關(guān)注了合理的病灶結(jié)構(gòu)，進(jìn)而限制了其在輔助診斷場景中的應(yīng)用效果。

圍繞可解釋人工智能（Explainable Artificial Intelligence, XAI），現(xiàn)有研究主要可以分為事后解釋與事前可解釋建模兩大類。其中，事后解釋方法通過可視化或歸因分析對黑盒模型的局部決策進(jìn)行近似刻畫，代表性方法包括基于梯度的 GradCAM 與GradCAM++［5-6］、模型無關(guān)的 LIME ［7］與SHAP ［8］，以及積分梯度方法［9］。因無需修改原有模型結(jié)構(gòu)，此類方法在醫(yī)學(xué)影像中應(yīng)用較為廣泛。然而，多項(xiàng)研究表明，顯著圖與歸因結(jié)果對模型參數(shù)、輸入擾動與解釋超參數(shù)等高度敏感，可能產(chǎn)生不穩(wěn)定甚至錯誤的解釋；僅憑“看起來合理”的可視化難以保證解釋的可信性［10-11］，因此需要綜合系統(tǒng)化的量化評估與魯棒性檢驗(yàn)加以規(guī)范［12-13］。

在 KOA X 光影像場景中，上述挑戰(zhàn)更為突出。一方面，關(guān)鍵特征通常呈現(xiàn)局部化、細(xì)粒度分布，傳統(tǒng) LIME 的超像素?cái)_動與默認(rèn)參數(shù)配置往往難以與醫(yī)學(xué)結(jié)構(gòu)精確對齊，容易導(dǎo)致解釋區(qū)域過散、過大或覆蓋無關(guān)特征；另一方面，LIME 以單一局部擬合優(yōu)度作為優(yōu)化目標(biāo)時，可能出現(xiàn)解釋區(qū)域“膨脹”，即通過激活大量非關(guān)鍵區(qū)域來提升擬合度，進(jìn)而削弱解釋的稀疏性與定位能力。這類不穩(wěn)定現(xiàn)象已在多項(xiàng)醫(yī)學(xué)影像解釋可信性評估研究中被觀測到［11］。

從方法論角度看，可信醫(yī)學(xué)影像解釋通常需同時滿足兩個核心屬性：一是高保真性，即解釋結(jié)果應(yīng)忠實(shí)反映模型的局部決策行為；二是高稀疏性，即解釋區(qū)域應(yīng)聚焦于有限且具有臨床意義的關(guān)鍵區(qū)域，以提升可讀性與診斷效率［12-14］。二者之間存在內(nèi)在張力：單純追求擬合精度往往引入冗余高亮，而過度稀疏則可能損失關(guān)鍵區(qū)域信息。為此，本文引入多目標(biāo)優(yōu)化視角，將解釋生成過程從“單點(diǎn)參數(shù)設(shè)定”調(diào)整為“可控權(quán)衡的參數(shù)搜索”。群智能優(yōu)化方法因參數(shù)量少、全局搜索能力強(qiáng)，且對復(fù)雜目標(biāo)具有良好適應(yīng)性，已成為處理多目標(biāo)權(quán)衡問題的經(jīng)典方法［15］。

基于以上背景，本文以 KOA X 光影像解釋為研究對象，提出一種基于多目標(biāo)粒子群優(yōu)化的事后可解釋性增強(qiáng)方法（MOPSOLIME）。該方法在不改變原有診斷模型結(jié)構(gòu)的前提下，將解釋過程形式化為“保真性-稀疏性”的雙目標(biāo)優(yōu)化問題，通過自動搜索 LIME 參數(shù)空間，在兩類目標(biāo)之間實(shí)現(xiàn)可控平衡，進(jìn)而獲得更穩(wěn)定、聚焦且具備臨床可讀性的解釋結(jié)果。本文的主要貢獻(xiàn)包括：

（1）提出一種面向 KOA 醫(yī)學(xué)影像的多目標(biāo)解釋優(yōu)化框架，在固定診斷模型條件下對 LIME 解釋參數(shù)進(jìn)行整體優(yōu)化；

（2）構(gòu)建以局部擬合優(yōu)度與解釋區(qū)域稀疏性為核心的可量化評價指標(biāo)，為解釋質(zhì)量評估與優(yōu)化提供統(tǒng)一標(biāo)準(zhǔn)；

（3）在公開 KOA 數(shù)據(jù)集及多種主流網(wǎng)絡(luò)結(jié)構(gòu)上驗(yàn)證方法有效性，實(shí)驗(yàn)結(jié)果表明該方法在不降低診斷性能的前提下提升了解釋穩(wěn)定性與臨床可讀性。

本文詳細(xì)內(nèi)容請下載：

http://ihrv.cn/resource/share/2000007060

作者信息：

李海芳1,2,3，唐超3，岳鑫3，張強(qiáng)1,2

（1.大連理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院，遼寧大連116024；

2.大連理工大學(xué)社會計(jì)算與認(rèn)知智能教育部重點(diǎn)實(shí)驗(yàn)室，遼寧大連116024；

3.新疆師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院，新疆烏魯木齊830054）

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容