《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 世界數(shù)字技術(shù)院首次發(fā)布大模型安全國際標(biāo)準(zhǔn)

世界數(shù)字技術(shù)院首次發(fā)布大模型安全國際標(biāo)準(zhǔn)

螞蟻集團、OpenAI、科大訊飛等參編
2024-04-18
來源:IT之家

4 月 17 日消息,4 月 15-19 日,第 27 屆聯(lián)合國科技大會在瑞士日內(nèi)瓦召開。其間,世界數(shù)字技術(shù)院(WDTA)于 4 月 16 日發(fā)布了一系列突破性成果,包括《生成式人工智能應(yīng)用安全測試標(biāo)準(zhǔn)》和《大語言模型安全測試方法》兩項國際標(biāo)準(zhǔn)。

1.png

據(jù)中國經(jīng)濟網(wǎng)報道,這兩項國際標(biāo)準(zhǔn)為大模型及生成式 AI 應(yīng)用方面的安全測試標(biāo)準(zhǔn),代表著全球人工智能安全評估和測試進入新的基準(zhǔn)。

這兩項標(biāo)準(zhǔn)由 OpenAI、螞蟻集團科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數(shù)十家單位的多名專家學(xué)者共同編制而成,其中《大語言模型安全測試方法》由螞蟻集團牽頭編制。

《標(biāo)準(zhǔn)》為測試、驗證生成式 AI 應(yīng)用(尤其是使用大語言模型構(gòu)建的應(yīng)用程序)的安全性提供框架,定義了 AI 應(yīng)用程序架構(gòu)每層測試驗證范圍,包括不限于如下方面。

基礎(chǔ)模型選擇

嵌入和矢量數(shù)據(jù)庫

RAG 或檢索增強生成

AI 應(yīng)用運行時的安全

《方法》則為大模型本身安全性評估提供了“全面、嚴(yán)謹(jǐn)且實操性強”的結(jié)構(gòu)性方案,提出了大語言模型的安全風(fēng)險分類、攻擊的分類分級方法以及測試方法。據(jù)報道,《方法》可以解決大語言模型固有的復(fù)雜性,全面測試其抵御敵對攻擊的能力,使開發(fā)人員和組織能夠識別和緩解潛在漏洞,并最終提高使用大語言模型構(gòu)建的人工智能系統(tǒng)的安全性和可靠性。

注:WDTA 系國際非政府組織,于日內(nèi)瓦注冊。該機構(gòu)遵從聯(lián)合國指導(dǎo)框架,致力于在全球范圍內(nèi)推進數(shù)字技術(shù),促進國際合作。AI STR(安全、可信、負責(zé)任)計劃是 WDTA 的核心倡議,旨在確保人工智能系統(tǒng)的安全性、可信性和責(zé)任性。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。