5 月 30 日消息,快手自研文生圖大模型“可圖”已于近日正式對外開放,其目前支持文生圖和圖生圖兩類功能,可用于 AI 創(chuàng)作圖像以及 AI 形象定制。
用戶可通過“可圖”微信小程序和網(wǎng)頁版使用。據(jù)界面新聞報(bào)道,這也是快手首次將其自研的系列大模型對外開放。報(bào)道援引知情人士消息稱,“可圖”大模型的參數(shù)規(guī)模達(dá)十億級(jí),這些數(shù)據(jù)來自開源社區(qū)、快手內(nèi)部構(gòu)建和自研 AI 技術(shù)合成,覆蓋了常見的千萬級(jí)中文實(shí)體概念,還引入強(qiáng)化學(xué)習(xí)和獎(jiǎng)勵(lì)模型技術(shù)(RLHF),解決了文生圖大模型在長文本和復(fù)雜語義文本輸入下的效果問題。
報(bào)道稱,快手內(nèi)部今年明確了大模型應(yīng)用策略,主要包含理解、互動(dòng)和生成三個(gè)方向,具體的應(yīng)用場景包括全域大模型內(nèi)容理解、AI 互動(dòng)、商業(yè)場景的數(shù)字人與 AIGC 等。
實(shí)測發(fā)現(xiàn),“可圖”提供的功能包括“文生圖”,以及多款動(dòng)漫主題、寫實(shí)人像風(fēng)格,包括本世紀(jì)早期流行的“紅鉆貴族”、近期較為熱門的“粘土世界”風(fēng)格,以及多種不同風(fēng)格的“繪畫”樣式,用戶一次可生成最多 4 張圖片。
據(jù)此前報(bào)道,快手創(chuàng)始人兼 CEO 程一笑曾在今年 3 月放出豪言:有信心在未來半年內(nèi),使大模型的綜合性能達(dá)到 GPT4.0 的水平。同時(shí),他還稱快手文生圖大模型“可圖”綜合性能已超過 Midjourney V5 的水平。