123,123

OpenAI发布GPT-4o模型卡

概述AI安全和风险缓解措施

日期： 2024-08-12

來源：IT之家

關(guān)鍵詞： OpenAI GPT-4o模型卡 AI安全

8 月 10 日消息，OpenAI 公司于 8 月 8 日發(fā)布報(bào)告，概述了 GPT-4o 模型的系統(tǒng)卡（System Card），介紹了包括外部紅隊(duì)（模擬敵人攻擊）、準(zhǔn)備框架（Preparedness Framework）在內(nèi)的諸多細(xì)節(jié)。

OpenAI 表示 GPT-4o 模型的核心就是準(zhǔn)備框架（Preparedness Framework），這是一種評估和降低人工智能系統(tǒng)相關(guān)風(fēng)險(xiǎn)的系統(tǒng)方法。IT之家從報(bào)道中獲悉，該框架主要用于識別網(wǎng)絡(luò)安全、生物威脅、說服和模型自主性等領(lǐng)域的潛在危險(xiǎn)。

除了針對 GPT-4 和 GPT-4V 進(jìn)行的安全評估和緩解措施外，OpenAI 還針對 GPT-4o 的音頻功能開展了更多安全工作。

評估的風(fēng)險(xiǎn)包括揚(yáng)聲器識別、未經(jīng)授權(quán)的語音生成、受版權(quán)保護(hù)內(nèi)容的潛在生成、無根據(jù)推斷以及不允許的內(nèi)容。基于這些評估結(jié)果，OpenAI 在模型和系統(tǒng)層面都實(shí)施了保障措施。

OpenAI 還與 100 多名外部紅隊(duì)人員合作，在向公眾發(fā)布模型之前對其進(jìn)行評估。紅隊(duì)人員將進(jìn)行探索性的能力發(fā)現(xiàn)，評估模型帶來的新的潛在風(fēng)險(xiǎn)，并對緩解措施進(jìn)行壓力測試。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

OpenAI发布GPT-4o模型卡

日期： 2024-08-12

來源：IT之家

相關(guān)內(nèi)容