英國人工智能(AI)安全研究所近日發(fā)布了發(fā)布了一個新的測試平臺,旨在加強(qiáng)監(jiān)測先進(jìn)AI模型的安全風(fēng)險。
據(jù)介紹,該工具箱名為Inspect,可以用來評估一系列領(lǐng)域的AI模型,包括它們的核心知識、推理能力和自主能力。通過開源許可證發(fā)布,這意味著Inspect可以免費供全球AI社區(qū)使用。
英國去年10月份宣布成立人工智能安全研究所,將研究和測試新型AI模型;今年2月,英國還表示將斥資1億多英鎊啟動9個新的研究中心,并對AI監(jiān)管機(jī)構(gòu)進(jìn)行技術(shù)培訓(xùn)。
在新聞發(fā)布會上,英國人工智能安全研究所表示,Inspect是一個軟件庫,它使測試人員能夠評估單個AI模型的具體能力,然后根據(jù)結(jié)果給出一個分?jǐn)?shù)。
Inspect從周五開始可以使用,這也是由國家支持的機(jī)構(gòu)率先推出的AI安全測試平臺。
在當(dāng)前AI競賽熱潮下,越來越多的AI模型將會在今年上市,這使得推動AI安全發(fā)展比以往任何時候都更加緊迫。
但目前要對AI模型進(jìn)行基準(zhǔn)測試還是比較困難的事情,因為當(dāng)今最復(fù)雜的AI模型基本上都是“黑箱”,其基礎(chǔ)架構(gòu)、訓(xùn)練數(shù)據(jù)和其他關(guān)鍵細(xì)節(jié)通常被創(chuàng)造它們的公司保密,不對外公開。
那么,Inspect是如何應(yīng)對這一挑戰(zhàn)的呢?主要是通過其可擴(kuò)展性,能夠適應(yīng)并接納新的測試技術(shù)。Inspect內(nèi)置組件可以通過使用Python編寫的第三方軟件包來增強(qiáng)或擴(kuò)展。
Inspect由三個基本部分組成:數(shù)據(jù)集、求解器和計分器。數(shù)據(jù)集用于評估測試的樣本集合,求解器是執(zhí)行實際測試工作的組件,評分器的作用是評估求解器的工作成果,最終生成關(guān)于AI模型性能的綜合評價,這種設(shè)計使得Inspect能夠靈活地適應(yīng)不同的測試需求和評估標(biāo)準(zhǔn)。
英國科學(xué)部長米歇爾·多內(nèi)蘭表示,作為英國在AI安全領(lǐng)域持續(xù)領(lǐng)導(dǎo)的一部分,我批準(zhǔn)了開源的Inspect,這顯示了英國在創(chuàng)新和科技發(fā)展方面的獨特才能和創(chuàng)造力,并鞏固了我們作為該領(lǐng)域世界領(lǐng)導(dǎo)者的地位。
人工智能安全研究所主席Ian Hogarth聲稱,成功的AI安全測試合作意味著擁有一個共享的、可訪問的評估方法,我們希望Inspect能成為AI安全研究所、研究組織和學(xué)術(shù)界的基石。