《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于光量子計算的信用評分特征篩選研究報告
基于光量子計算的信用評分特征篩選研究報告
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 3期
文 凱1,馬 寅1,王 鵬2,朱德立2
(1.北京玻色量子科技有限公司,北京100016;2.光大科技有限公司,北京100083)
摘要: 隨著科學(xué)技術(shù)的進(jìn)步,量子計算突破了傳統(tǒng)的算力瓶頸,在各個領(lǐng)域發(fā)揮著越來越重要的作用。在金融領(lǐng)域中,信用評分場景是貸款行業(yè)的重中之重。特征選取是一種十分高效的數(shù)據(jù)預(yù)處理策略。特征選擇可以構(gòu)建更簡單、更容易理解的模型,提高數(shù)據(jù)挖掘性能,從中提取有效的特征,降低數(shù)據(jù)維度,為金融業(yè)提供有效的貸款參考信息。主要討論量子計算在信用評分場景下的應(yīng)用,改進(jìn)了金融數(shù)據(jù)預(yù)處理的方式,創(chuàng)新性地使用量子計算機(jī)來求解特征選擇的QUBO模型,與one-hot轉(zhuǎn)碼相比較,所使用的WOE分箱處理策略可以直接解析出特征,篩選結(jié)果可以進(jìn)行直接對比?;诹孔佑嬎愕奶卣鬟x取與傳統(tǒng)的基于相關(guān)性的特征選取策略相比,差距很小,并且由于量子計算機(jī)的先天優(yōu)勢,此策略速度更快,更具前景。
中圖分類號: TP38
文獻(xiàn)標(biāo)識碼: A
DOI: 10.20044/j.csdg.2097-1788.2022.03.002
引用格式: 文凱,馬寅,王鵬,等. 基于光量子計算的信用評分特征篩選研究報告[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2022,41(3):13-18.
Research report on feature screening of credit scoring based on photonic quantum computing
Wen Kai1,Ma Yin1,Wang Peng2,Zhu Deli2
(1.Beijing Qboson Quantum Technology Co.,Ltd.,Beijing 100016,China; 2.Everbright Technology Co.,Ltd.,Beijing 100040,China)
Abstract: With the progress of science and technology, quantum computing has broken through the traditional bottleneck of computing power and is playing an increasingly important role in various fields. In the financial field, the credit scoring scenario is the top priority of the loan industry. Feature selection can build simpler and easier-to-understand models, improve data mining performance, prepare concise and understandable data to extract effective features and reduce data dimensions, and provide effective loan reference information for the financial industry. This paper mainly discusses the application of quantum computing in the credit scoring scenario, improves the financial data preprocessing method, and creatively uses quantum computer to solve the QUBO model of feature selection. Compared with one-hot encoding, the WOE strategy used in this paper can directly analyze the features, and the screening results can be directly compared. Compared with the traditional feature selection strategy based on correlation, the feature selection strategy based on quantum computing is little difference. Moreover, due to the inherent advantages of quantum computer, this strategy is faster and more promising.
Key words : quantum computing;feature selection;correlation;credit evaluation

0 引言

目前,量子計算是未來的計算發(fā)展趨勢,全球各主要研究機(jī)構(gòu)和公司選用不同的物理方案來制造量子計算機(jī),主流的技術(shù)路線包括超導(dǎo)量子計算、光量子計算等。超導(dǎo)量子計算系統(tǒng)對環(huán)境要求苛刻,要求在絕對零度附近的超低溫下才能工作;光量子計算其原理是使用光量子的疊加態(tài)對組合優(yōu)化問題進(jìn)行指數(shù)級求解加速?;诠饬孔酉到y(tǒng)的相干伊辛計算架構(gòu)(Coherent Ising Machine,CIM)[1],具有光量子常溫下編碼操控和其在相干時間、室溫工作、全聯(lián)接等方面的技術(shù)優(yōu)勢。目前,國內(nèi)北京玻色量子科技有限公司等企業(yè),已完成第一臺全國產(chǎn)光量子計算原型機(jī)的設(shè)計制造。

CIM可以充分利用光量子常溫下編碼操控的技術(shù)優(yōu)勢,實現(xiàn)100~100 000量子比特的量子計算的有效應(yīng)用和算法優(yōu)越性驗證[2],并且可以廣泛地應(yīng)用于生物制藥、交通、人工智能[3-7]等領(lǐng)域。在金融風(fēng)控領(lǐng)域,特別是在信貸業(yè)務(wù)場景下,需要利用客戶多維度的特征,對客戶未來的違約行為做出預(yù)測,從而進(jìn)行風(fēng)險控制決策。因此好的風(fēng)控評估模型能為銀行風(fēng)控業(yè)務(wù)提供從資產(chǎn)負(fù)債、信用風(fēng)險、反欺詐、反洗錢等全方位完整的風(fēng)險控制方案。在建立風(fēng)控模型的過程中,隨著大數(shù)據(jù)時代的到來,客戶數(shù)據(jù)維度呈指數(shù)型增長,傳統(tǒng)的特征篩選方法需要人工經(jīng)驗的參與,對大維度數(shù)據(jù)的處理顯得較為吃力,亟需創(chuàng)新式的解決方案。量子計算作為超強(qiáng)算力的代表,在此領(lǐng)域擁有極大的潛力。

信用評分的建模場景中[8],特征選擇在整個過程起著至關(guān)重要的作用,通過篩選后續(xù)入模的特征從而提高模型的準(zhǔn)確率和效率,并具有更好的泛化能力。尤其是在特征數(shù)較大時,不同特征的選擇將決定最后信用評分模型的整體效果。本文將采用傳統(tǒng)信用評分的建模邏輯,對于特征篩選這一環(huán)節(jié),采用量子計算的方式進(jìn)行優(yōu)化,從而對整體模型效果進(jìn)行提升(并與傳統(tǒng)方式的特征選擇進(jìn)行對比)。通過建立相應(yīng)的二次無約束二值優(yōu)化(Quadratic Unbounded Binary Optimization,QUBO)[9]模型來實現(xiàn)特征選擇,該模型理想情況下選擇既獨(dú)立又有影響力的特征。此次研究主要通過量子計算解決QUBO模型來實現(xiàn)特征選擇,相比傳統(tǒng)信用評分的特征選擇,在不犧牲準(zhǔn)確率的前提下,量子計算效率更高而且人工干擾更少,并在特征數(shù)很大時,解決了人工篩選難度大的問題。




本文詳細(xì)內(nèi)容請下載http://ihrv.cn/resource/share/2000004899。





作者信息:

文  凱1,馬  寅1,王  鵬2,朱德立2

(1.北京玻色量子科技有限公司,北京100016;2.光大科技有限公司,北京100083)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。