中文引用格式:李海芳,唐超,岳鑫,等. 基于多目標(biāo)優(yōu)化的醫(yī)學(xué)影像可解釋性增強(qiáng)研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2026,45(4):59-67.
英文引用格式:Li Haifang,Tang Chao,Yue Xin, et al. Multiobjective optimization for enhanced explainability in medical imaging models
[J].Cyber Security and Data Governance,2026,45(4):59-67.
引言
隨著深度學(xué)習(xí)模型與計(jì)算資源的快速發(fā)展,數(shù)據(jù)驅(qū)動方法已在視覺與醫(yī)學(xué)影像分析中取得顯著進(jìn)展。然而,由于深度神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)與訓(xùn)練過程中的高度復(fù)雜性,其決策機(jī)制往往呈現(xiàn)“黑箱”特征,使得模型預(yù)測結(jié)果難以被人類理解與復(fù)核。在醫(yī)療影像等高風(fēng)險應(yīng)用場景中,這種不可解釋性會直接影響系統(tǒng)的可信性、可審計(jì)性與臨床可用性,并進(jìn)一步牽涉到人機(jī)協(xié)作流程與責(zé)任歸屬等系統(tǒng)性問題[1-2]。相關(guān)研究指出,可信醫(yī)療AI的解釋機(jī)制不應(yīng)僅停留在單一算法層面的可視化呈現(xiàn),而需與臨床工作流、交互方式與問責(zé)框架形成閉環(huán),以支撐真實(shí)場景下的信任建立與可控使用[3]。
在醫(yī)學(xué)影像領(lǐng)域,膝骨關(guān)節(jié)炎(Knee Osteoarthritis, KOA)是較為常見的退行性關(guān)節(jié)疾病,其 X 光影像中的關(guān)節(jié)間隙變窄、軟骨下骨硬化及骨贅形成等特征是臨床分級和診斷的關(guān)鍵依據(jù)。近年來,KOA 的自動診斷與分級任務(wù)的處理廣泛應(yīng)用卷積神經(jīng)網(wǎng)絡(luò),并在多個公開數(shù)據(jù)集上獲得了較高的識別精度[4]。但多數(shù)方法仍以“預(yù)測輸出”為主,缺乏對模型預(yù)測依據(jù)的清晰解釋,臨床醫(yī)生難以評估模型是否關(guān)注了合理的病灶結(jié)構(gòu),進(jìn)而限制了其在輔助診斷場景中的應(yīng)用效果。
圍繞可解釋人工智能(Explainable Artificial Intelligence, XAI),現(xiàn)有研究主要可以分為事后解釋與事前可解釋建模兩大類。其中,事后解釋方法通過可視化或歸因分析對黑盒模型的局部決策進(jìn)行近似刻畫,代表性方法包括基于梯度的 GradCAM 與GradCAM++[5-6]、模型無關(guān)的 LIME [7]與SHAP [8],以及積分梯度方法[9]。因無需修改原有模型結(jié)構(gòu),此類方法在醫(yī)學(xué)影像中應(yīng)用較為廣泛。然而,多項(xiàng)研究表明,顯著圖與歸因結(jié)果對模型參數(shù)、輸入擾動與解釋超參數(shù)等高度敏感,可能產(chǎn)生不穩(wěn)定甚至錯誤的解釋;僅憑“看起來合理”的可視化難以保證解釋的可信性[10-11],因此需要綜合系統(tǒng)化的量化評估與魯棒性檢驗(yàn)加以規(guī)范[12-13]。
在 KOA X 光影像場景中,上述挑戰(zhàn)更為突出。一方面,關(guān)鍵特征通常呈現(xiàn)局部化、細(xì)粒度分布,傳統(tǒng) LIME 的超像素?cái)_動與默認(rèn)參數(shù)配置往往難以與醫(yī)學(xué)結(jié)構(gòu)精確對齊,容易導(dǎo)致解釋區(qū)域過散、過大或覆蓋無關(guān)特征;另一方面,LIME 以單一局部擬合優(yōu)度作為優(yōu)化目標(biāo)時,可能出現(xiàn)解釋區(qū)域“膨脹”,即通過激活大量非關(guān)鍵區(qū)域來提升擬合度,進(jìn)而削弱解釋的稀疏性與定位能力。這類不穩(wěn)定現(xiàn)象已在多項(xiàng)醫(yī)學(xué)影像解釋可信性評估研究中被觀測到[11]。
從方法論角度看,可信醫(yī)學(xué)影像解釋通常需同時滿足兩個核心屬性:一是高保真性,即解釋結(jié)果應(yīng)忠實(shí)反映模型的局部決策行為;二是高稀疏性,即解釋區(qū)域應(yīng)聚焦于有限且具有臨床意義的關(guān)鍵區(qū)域,以提升可讀性與診斷效率[12-14]。二者之間存在內(nèi)在張力:單純追求擬合精度往往引入冗余高亮,而過度稀疏則可能損失關(guān)鍵區(qū)域信息。為此,本文引入多目標(biāo)優(yōu)化視角,將解釋生成過程從“單點(diǎn)參數(shù)設(shè)定”調(diào)整為“可控權(quán)衡的參數(shù)搜索”。群智能優(yōu)化方法因參數(shù)量少、全局搜索能力強(qiáng),且對復(fù)雜目標(biāo)具有良好適應(yīng)性,已成為處理多目標(biāo)權(quán)衡問題的經(jīng)典方法[15]。
基于以上背景,本文以 KOA X 光影像解釋為研究對象,提出一種基于多目標(biāo)粒子群優(yōu)化的事后可解釋性增強(qiáng)方法(MOPSOLIME)。該方法在不改變原有診斷模型結(jié)構(gòu)的前提下,將解釋過程形式化為“保真性-稀疏性”的雙目標(biāo)優(yōu)化問題,通過自動搜索 LIME 參數(shù)空間,在兩類目標(biāo)之間實(shí)現(xiàn)可控平衡,進(jìn)而獲得更穩(wěn)定、聚焦且具備臨床可讀性的解釋結(jié)果。本文的主要貢獻(xiàn)包括:
(1)提出一種面向 KOA 醫(yī)學(xué)影像的多目標(biāo)解釋優(yōu)化框架,在固定診斷模型條件下對 LIME 解釋參數(shù)進(jìn)行整體優(yōu)化;
(2)構(gòu)建以局部擬合優(yōu)度與解釋區(qū)域稀疏性為核心的可量化評價指標(biāo),為解釋質(zhì)量評估與優(yōu)化提供統(tǒng)一標(biāo)準(zhǔn);
(3)在公開 KOA 數(shù)據(jù)集及多種主流網(wǎng)絡(luò)結(jié)構(gòu)上驗(yàn)證方法有效性,實(shí)驗(yàn)結(jié)果表明該方法在不降低診斷性能的前提下提升了解釋穩(wěn)定性與臨床可讀性。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000007060
作者信息:
李海芳1,2,3,唐超3,岳鑫3,張強(qiáng)1,2
(1.大連理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,遼寧大連116024;
2.大連理工大學(xué)社會計(jì)算與認(rèn)知智能教育部重點(diǎn)實(shí)驗(yàn)室,遼寧大連116024;
3.新疆師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,新疆烏魯木齊830054)

