文獻(xiàn)標(biāo)識碼: A
DOI: 10.20044/j.csdg.2097-1788.2022.03.002
引用格式: 文凱,馬寅,王鵬,等. 基于光量子計(jì)算的信用評分特征篩選研究報(bào)告[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2022,41(3):13-18.
0 引言
目前,量子計(jì)算是未來的計(jì)算發(fā)展趨勢,全球各主要研究機(jī)構(gòu)和公司選用不同的物理方案來制造量子計(jì)算機(jī),主流的技術(shù)路線包括超導(dǎo)量子計(jì)算、光量子計(jì)算等。超導(dǎo)量子計(jì)算系統(tǒng)對環(huán)境要求苛刻,要求在絕對零度附近的超低溫下才能工作;光量子計(jì)算其原理是使用光量子的疊加態(tài)對組合優(yōu)化問題進(jìn)行指數(shù)級求解加速。基于光量子系統(tǒng)的相干伊辛計(jì)算架構(gòu)(Coherent Ising Machine,CIM)[1],具有光量子常溫下編碼操控和其在相干時(shí)間、室溫工作、全聯(lián)接等方面的技術(shù)優(yōu)勢。目前,國內(nèi)北京玻色量子科技有限公司等企業(yè),已完成第一臺全國產(chǎn)光量子計(jì)算原型機(jī)的設(shè)計(jì)制造。
CIM可以充分利用光量子常溫下編碼操控的技術(shù)優(yōu)勢,實(shí)現(xiàn)100~100 000量子比特的量子計(jì)算的有效應(yīng)用和算法優(yōu)越性驗(yàn)證[2],并且可以廣泛地應(yīng)用于生物制藥、交通、人工智能[3-7]等領(lǐng)域。在金融風(fēng)控領(lǐng)域,特別是在信貸業(yè)務(wù)場景下,需要利用客戶多維度的特征,對客戶未來的違約行為做出預(yù)測,從而進(jìn)行風(fēng)險(xiǎn)控制決策。因此好的風(fēng)控評估模型能為銀行風(fēng)控業(yè)務(wù)提供從資產(chǎn)負(fù)債、信用風(fēng)險(xiǎn)、反欺詐、反洗錢等全方位完整的風(fēng)險(xiǎn)控制方案。在建立風(fēng)控模型的過程中,隨著大數(shù)據(jù)時(shí)代的到來,客戶數(shù)據(jù)維度呈指數(shù)型增長,傳統(tǒng)的特征篩選方法需要人工經(jīng)驗(yàn)的參與,對大維度數(shù)據(jù)的處理顯得較為吃力,亟需創(chuàng)新式的解決方案。量子計(jì)算作為超強(qiáng)算力的代表,在此領(lǐng)域擁有極大的潛力。
在信用評分的建模場景中[8],特征選擇在整個(gè)過程起著至關(guān)重要的作用,通過篩選后續(xù)入模的特征從而提高模型的準(zhǔn)確率和效率,并具有更好的泛化能力。尤其是在特征數(shù)較大時(shí),不同特征的選擇將決定最后信用評分模型的整體效果。本文將采用傳統(tǒng)信用評分的建模邏輯,對于特征篩選這一環(huán)節(jié),采用量子計(jì)算的方式進(jìn)行優(yōu)化,從而對整體模型效果進(jìn)行提升(并與傳統(tǒng)方式的特征選擇進(jìn)行對比)。通過建立相應(yīng)的二次無約束二值優(yōu)化(Quadratic Unbounded Binary Optimization,QUBO)[9]模型來實(shí)現(xiàn)特征選擇,該模型理想情況下選擇既獨(dú)立又有影響力的特征。此次研究主要通過量子計(jì)算解決QUBO模型來實(shí)現(xiàn)特征選擇,相比傳統(tǒng)信用評分的特征選擇,在不犧牲準(zhǔn)確率的前提下,量子計(jì)算效率更高而且人工干擾更少,并在特征數(shù)很大時(shí),解決了人工篩選難度大的問題。
本文詳細(xì)內(nèi)容請下載:http://ihrv.cn/resource/share/2000004899。
作者信息:
文 凱1,馬 寅1,王 鵬2,朱德立2
(1.北京玻色量子科技有限公司,北京100016;2.光大科技有限公司,北京100083)