前言導(dǎo)讀
“ChatGPT會(huì)不會(huì)搶走我的飯碗?”時(shí)下最熱門的話題,無(wú)疑是這個(gè)AI聊天機(jī)器人。人工智能上一次這么火,或許還是谷歌Alpha Go打敗柯潔的時(shí)候。
有業(yè)內(nèi)人士認(rèn)為,ChatGPT這一現(xiàn)象級(jí)的產(chǎn)品將開啟人工智能產(chǎn)業(yè)的2.0時(shí)代,引領(lǐng)新的產(chǎn)業(yè)趨勢(shì)。雖然目前市場(chǎng)反應(yīng)火熱,但從產(chǎn)業(yè)角度來看,ChatGPT的商業(yè)化路徑和安全防護(hù)還處于探索初期。
先別擔(dān)心“AI與人是敵是友”的哲學(xué)命題,ChatGPT到底能火多久,或許它自己也沒有答案。
01
巨頭入場(chǎng),個(gè)人“淘金”
幾乎同一時(shí)刻,谷歌和百度宣布同一件事:要做自己的ChatGPT。
日前,谷歌CEO桑達(dá)爾·皮查伊宣布,公司正在推出一項(xiàng)名為Bard的對(duì)話式AI服務(wù),以測(cè)試用戶的反饋,隨后將在未來幾周內(nèi)公開發(fā)布。百度也宣布推出國(guó)產(chǎn)版“ChatGPT”文心一言,一位接近百度相關(guān)人士向懂經(jīng)哥透露,文心一言落地之后,首站將直接接入百度搜索,“一些相關(guān)功能已陸續(xù)在百度搜索內(nèi)上線或內(nèi)測(cè),包括多答案回復(fù)、智能生成等?!?/p>
ChatGPT主創(chuàng)團(tuán)隊(duì)OpenAI背后的微軟更是乘勝追擊,將GPT—3.5升級(jí)版整合進(jìn)必應(yīng)搜索、Edge瀏覽器和Office辦公套件中,宣稱比ChatGPT的功能更強(qiáng)大。
除了搜索巨頭之外,國(guó)內(nèi)不少互聯(lián)網(wǎng)企業(yè)也開始涉足以ChatGPT為代表的AIGC(人工智能自動(dòng)生成內(nèi)容)技術(shù)的垂直領(lǐng)域產(chǎn)品。
據(jù)悉,阿里巴巴達(dá)摩院正在研發(fā)類ChatGPT的對(duì)話機(jī)器人,目前處于內(nèi)測(cè)階段,可能將AI大模型技術(shù)與釘釘深度結(jié)合。360公司在答投資者問時(shí)表示,類似的AIGC技術(shù)目前作為內(nèi)部生產(chǎn)力工具使用,計(jì)劃盡快推出相關(guān)demo版產(chǎn)品。網(wǎng)易有道AI技術(shù)團(tuán)隊(duì)已聚焦AIGC在教育場(chǎng)景的落地研發(fā),正在AI口語(yǔ)老師、中文作文批改等細(xì)分學(xué)習(xí)場(chǎng)景中嘗試探索。
懂經(jīng)哥發(fā)現(xiàn),已有“高階玩家”將原生ChatGPT“嫁接”到國(guó)內(nèi)互聯(lián)網(wǎng)平臺(tái)。一名釘釘資深用戶在公司的運(yùn)維群創(chuàng)建故障報(bào)警應(yīng)用時(shí),嘗試在“自定義機(jī)器人”插件中接入ChatGPT,完成配置后即可自動(dòng)寫開年規(guī)劃、英文郵件和爬蟲代碼等。
ChatGPT尚未面向中國(guó)市場(chǎng)開放,但國(guó)內(nèi)已聚集了一批個(gè)人“淘金者”,在公眾號(hào)、小程序上搭建ChatGPT的鏡像產(chǎn)品,國(guó)內(nèi)用戶在小程序上提問,鏡像連接ChatGPT服務(wù)器,再將答案轉(zhuǎn)述給用戶。懂經(jīng)哥親測(cè)后發(fā)現(xiàn),該類產(chǎn)品通??擅赓M(fèi)試用10次對(duì)話,隨后需要充值或開通會(huì)員方能繼續(xù),收費(fèi)標(biāo)準(zhǔn)從10元至300元不等。有媒體推測(cè),有人兩個(gè)月以此牟利達(dá)數(shù)萬(wàn)元。
在國(guó)研新經(jīng)濟(jì)研究院創(chuàng)始院長(zhǎng)朱克力看來,ChatGPT在國(guó)內(nèi)的突然爆火,主要是技術(shù)突破和資本參與的雙重結(jié)果,“算法、算力和數(shù)據(jù)是AIGC的‘三駕馬車’,隨著國(guó)內(nèi)三方面的技術(shù)沉淀,AIGC已經(jīng)實(shí)現(xiàn)了不少落地應(yīng)用,因此ChatGPT自上線以來在技術(shù)圈層保持活躍的討論度,春節(jié)后資本市場(chǎng)關(guān)注到這一現(xiàn)象后,才實(shí)現(xiàn)了面向大眾的‘破圈’?!?/p>
02
一場(chǎng)“燒錢”的試驗(yàn)
多家科技巨頭紛紛入局,打造自己的“ChatGPT”,這意味著產(chǎn)業(yè)發(fā)展的趨勢(shì)正在快速調(diào)整。復(fù)旦大學(xué)管理學(xué)院信息管理與商業(yè)智能系系主任、教授張誠(chéng)表示,ChatGPT背后技術(shù)并沒有壟斷性,各家都可以做。從技術(shù)創(chuàng)新角度來看,OpenAI推出的ChatGPT屬于集成或漸進(jìn)性創(chuàng)新,在模型、數(shù)據(jù)和算力上實(shí)現(xiàn)了進(jìn)步,但仍非原始創(chuàng)新。
實(shí)際上,人工智能發(fā)展多年,聊天機(jī)器人早已滲透在我們的日常生活中,蘋果的Siri、微軟的小冰、百度的小度等等都屬于聊天機(jī)器人范疇。包括去年曾爆火網(wǎng)絡(luò)的AI繪畫、AI換臉,和ChatGPT也屬于同一類型應(yīng)用。
相似產(chǎn)品不少,ChatGPT的優(yōu)勢(shì)在哪?歸結(jié)下來就是“擬人化”和“反應(yīng)快”兩點(diǎn)。業(yè)內(nèi)人士介紹,這對(duì)應(yīng)了ChatGPT兩方面的特殊性。
第一,ChatGPT使用了更為通用的NLP(自然語(yǔ)言處理)模型,訓(xùn)練過的話題包羅萬(wàn)象,涵蓋人類社會(huì)信息的各方各面,而以往智能化應(yīng)答程度能達(dá)到如此高水平的應(yīng)用大多只聚焦在有限垂直領(lǐng)域;第二,ChatGPT依靠巨大的算力,實(shí)現(xiàn)了全內(nèi)容和實(shí)時(shí)性的平衡。一般來說,以往大部分聊天機(jī)器人使用的是輕量化的語(yǔ)言模型,這樣可以保證反應(yīng)的即時(shí)性,完成快速的“你問我答”,但內(nèi)容的質(zhì)量也相應(yīng)有所下降,而ChatGPT的推理時(shí)間可能延長(zhǎng)至幾十秒甚至幾分鐘,大型語(yǔ)言模型讓輸出內(nèi)容的質(zhì)量得到了極大的提升。
這兩點(diǎn)都對(duì)聊天機(jī)器人的算法模型和訓(xùn)練數(shù)據(jù)樣本提出了極高的要求。ChatGPT使用的GPT—3.5語(yǔ)言預(yù)測(cè)模型是此前模型GPT—3的迭代版本。根據(jù)公開信息,GPT—3模型包含的參數(shù)量達(dá)1750億,訓(xùn)練所用的數(shù)據(jù)量達(dá)45TB。
45TB數(shù)據(jù)量是什么概念?一位從業(yè)者向懂經(jīng)哥解釋,1MB相當(dāng)于一本紅樓夢(mèng)的數(shù)據(jù)量,1TB為100多萬(wàn)本紅樓夢(mèng)的數(shù)據(jù)量,所以ChatGPT相當(dāng)于至少看過了4500萬(wàn)本紅樓夢(mèng)的內(nèi)容。
正是因?yàn)橛袕?qiáng)大的數(shù)據(jù)和算力支持,ChatGPT才具備了“以假亂真”的對(duì)話能力,實(shí)現(xiàn)了超越以往的信息總結(jié)能力。再加上其互動(dòng)感十足的交互設(shè)計(jì),引起了用戶極大的興趣,最終引爆了消費(fèi)市場(chǎng)。
大數(shù)據(jù)、大算力并不是一條好走的路,OpenAI至今仍處在劇烈燒錢的狀態(tài)。ChatGPT每回復(fù)一次大概要消耗1美分, 2022年OpenAI的整年虧損已經(jīng)高達(dá)5.45億美元。國(guó)內(nèi)文本智能處理企業(yè)達(dá)觀數(shù)據(jù)CEO陳運(yùn)文表示,看到ChatGPT的橫空出世,他與身邊的從業(yè)者都十分驚訝,因?yàn)镺penAI的技術(shù)方向此前并不被業(yè)界看好。成本高昂,產(chǎn)出的文本質(zhì)量也不一定很高,導(dǎo)致包括谷歌在內(nèi)的大部分公司都沒有將這一技術(shù)方向作為首選。
“但從目前的結(jié)果來看,ChatGPT讓大家看到,大規(guī)模語(yǔ)言模型確實(shí)可以勝任復(fù)雜的人類工作,接下來的兩三年內(nèi),沿著ChatGPT這條技術(shù)方向會(huì)有越來越多的產(chǎn)品出現(xiàn)?!标愡\(yùn)文說,這款產(chǎn)品可能讓AI產(chǎn)業(yè)發(fā)展大大提速,NLP技術(shù)原本需要十幾年才能實(shí)現(xiàn)的目標(biāo)已變得近在咫尺。
03
商業(yè)盈利仍待驗(yàn)證
AIGC作為一種賦能千行百業(yè)的技術(shù),一旦突破必將改變現(xiàn)有的商業(yè)生態(tài)。上海人工智能研究院總工程師王資凱向懂經(jīng)哥舉例,國(guó)外語(yǔ)法糾正知名應(yīng)用Grammarly在輔助寫作領(lǐng)域一家獨(dú)大,估值最高曾達(dá)到130億美元,但由于ChatGPT的出現(xiàn),許多初創(chuàng)公司都可以利用其提供的基礎(chǔ)設(shè)施搭建自己的輔助寫作平臺(tái),Grammarly技術(shù)的獨(dú)特性和產(chǎn)品的壟斷性立刻被打破。
包括前文所提到的,將ChatGPT嵌入到搜索引擎當(dāng)中,也將改變搜索引擎的服務(wù)模式。王資凱預(yù)計(jì),有了大語(yǔ)言模型支持后,搜索網(wǎng)頁(yè)的內(nèi)容呈現(xiàn)方式將不同,用戶會(huì)更直接地接收到信息,用戶使用習(xí)慣和搜索引擎的盈利模式都可能發(fā)生變化。
ChatGPT已經(jīng)開始落地化嘗試,但總體來看,其商業(yè)化進(jìn)程還處于初期階段。陳運(yùn)文認(rèn)為,由于業(yè)界對(duì)ChatGPT的看好,此技術(shù)方向目前處于“不差錢”的階段,大家都希望先把產(chǎn)品做出來占領(lǐng)市場(chǎng),但可持續(xù)的盈利模式仍在探索當(dāng)中,即使是開發(fā)者OpenAI也不例外。
具體來看,根據(jù)應(yīng)用場(chǎng)景的不同,ChatGPT的落地難度也不盡相同。張誠(chéng)認(rèn)為,如果將ChatGPT應(yīng)用到信息總結(jié)、文法糾正、創(chuàng)意寫作方面,落地速度將非??欤琌penAI提供的基礎(chǔ)設(shè)施可以直接使用。但如果應(yīng)用在對(duì)正確率要求較高的場(chǎng)景,比如醫(yī)療問診、商業(yè)咨詢等方面,還需要進(jìn)一步改善算法在內(nèi)容正確與表達(dá)流暢間的平衡。
“ChatGPT商業(yè)運(yùn)用的主要挑戰(zhàn)還是其內(nèi)容的真實(shí)有效性?!睆堈\(chéng)說,即使一項(xiàng)AIGC技術(shù)的正確率能達(dá)到95%,但對(duì)于某些嚴(yán)肅應(yīng)用場(chǎng)景,1%的差錯(cuò)可能都會(huì)導(dǎo)致巨大的決策失誤,企業(yè)可能需要花費(fèi)比使用AIGC技術(shù)更高的成本去做校對(duì)。在這些場(chǎng)景中,目前能使用的AIGC技術(shù)仍是“命題發(fā)揮”,即在有限的、經(jīng)過驗(yàn)證的知識(shí)文本中自動(dòng)生成內(nèi)容。
雖然國(guó)內(nèi)多家機(jī)構(gòu)宣稱推出類ChatGPT產(chǎn)品,但國(guó)產(chǎn)版“平替”與ChatGPT的差距依然肉眼可見。
以360公司為例,由于訓(xùn)練數(shù)據(jù)源及應(yīng)用方向的原因,在中文環(huán)境下的實(shí)際效果強(qiáng)于GPT—2,與當(dāng)前流行的ChatGPT—3有著代際差距。與國(guó)外同行相比,國(guó)內(nèi)在中文語(yǔ)料數(shù)據(jù)資源端有豐富的多模態(tài)大數(shù)據(jù)積累,但在預(yù)訓(xùn)練大模型和多模態(tài)數(shù)據(jù)清洗融合技術(shù)領(lǐng)域存在較大差距。不少互聯(lián)網(wǎng)企業(yè)或許與360公司有著類似的選擇——用充足的資金儲(chǔ)備用于購(gòu)買大規(guī)模算力,深入自行研發(fā)的同時(shí)尋找強(qiáng)有力的合作伙伴,以此來降低技術(shù)壁壘。
“雖然我國(guó)在AI領(lǐng)域已有所成就,但主要集中在應(yīng)用端,技術(shù)端仍由美國(guó)互聯(lián)網(wǎng)巨頭引領(lǐng),目前仍有兩三年的差距?!敝炜肆Ρ硎?,AIGC屬于“養(yǎng)成類”產(chǎn)品,除了技術(shù)外,“喂養(yǎng)”的內(nèi)容也非常關(guān)鍵,我國(guó)應(yīng)用市場(chǎng)廣大、數(shù)據(jù)內(nèi)容豐富,可趁此機(jī)會(huì)“彎道超車”趕超,“在法律合規(guī)的前提下,如何把握好開放、發(fā)展與安全的平衡,釋放國(guó)內(nèi)的數(shù)據(jù)內(nèi)容的潛在價(jià)值,值得各方聯(lián)合探索?!?/p>
04
既是野獸,也是獵手
“如同其他人工智能模型一樣,ChatGPT是把雙刃劍,既可以是提升效率的工具,甚至編寫代碼。同時(shí)也可能被繞過安全機(jī)制,用于實(shí)施有害的活動(dòng)。”奇安信虎符智庫(kù)研究員李建平告訴懂經(jīng)哥,對(duì)網(wǎng)絡(luò)安全行業(yè)來說,以ChatGPT為代表的人工智能工具,既可以用來編寫網(wǎng)絡(luò)釣魚、生成惡意軟件、開展網(wǎng)絡(luò)攻擊,也能成為網(wǎng)絡(luò)防御者的有力工具。
奇安信人工智能研究院負(fù)責(zé)人介紹,美國(guó)在暗網(wǎng)中發(fā)現(xiàn)了1500多條惡意軟件和驗(yàn)證代碼中有ChatGPT的身影,甚至還利用惡意代碼對(duì)ChatGPT進(jìn)行“培訓(xùn)”,以生成可逃避病毒檢測(cè)的惡意代碼不同變體,研究人員已經(jīng)確定ChatGPT可以有效生成信息竊取器、遠(yuǎn)程訪問木馬和加密貨幣竊取器等。
此外,ChatGPT還降低了網(wǎng)絡(luò)犯罪的門檻,即便是沒有技術(shù)的“小白”,也能成為攻擊者。境外已有網(wǎng)絡(luò)釣魚即服務(wù)(即服務(wù)是一種軟件許可模式)和勒索軟件即服務(wù)開始向攻擊者提供收費(fèi)工具包,使其可以輕松實(shí)施攻擊,特別是ChatGPT面向公眾免費(fèi)開放,網(wǎng)絡(luò)攻擊的成本進(jìn)一步降低。
目前,國(guó)內(nèi)已經(jīng)有多家人工智能研究院成立了ChatGPT項(xiàng)目專班,開展該技術(shù)在網(wǎng)絡(luò)安全領(lǐng)域的場(chǎng)景研究和應(yīng)用,未來將廣泛應(yīng)用于安全產(chǎn)品開發(fā)、威脅檢測(cè)、漏洞挖掘、安全運(yùn)營(yíng)及自動(dòng)化、攻防對(duì)抗、反病毒、威脅情報(bào)分析和運(yùn)營(yíng)、涉網(wǎng)犯罪分析等領(lǐng)域。
“我們看到ChatGPT相繼被Stack Overflow編程問答社區(qū)、行業(yè)協(xié)會(huì)和高?!鈿ⅰ?,部分原因就是它仍然會(huì)生成一些虛假錯(cuò)誤內(nèi)容,并且難以辨別?!崩罱ㄆ秸f。遺憾的是,迄今為止ChatGPT自動(dòng)生成的內(nèi)容依然真假難辨,OpenAI已經(jīng)發(fā)布相關(guān)AI內(nèi)容檢測(cè)器,但是識(shí)別置信度正確率僅為26%,甚至還會(huì)將人類創(chuàng)作文本誤識(shí)別為AI創(chuàng)作,“其象征意義比實(shí)際意義更大?!?/p>
網(wǎng)絡(luò)上有句戲言:“只有魔法才能打敗魔法”,同理,只有AI才能打敗AI,規(guī)避ChatGPT安全隱患的最好辦法,或許正是它自己。
“ChatGPT可以在網(wǎng)絡(luò)釣魚檢測(cè)、漏洞發(fā)現(xiàn)和事件分析與響應(yīng)三方面提高安全防護(hù)力?!崩罱ㄆ奖硎?,ChatGPT能幫助組織識(shí)別和標(biāo)記釣魚郵件,在接收郵件前進(jìn)行標(biāo)記,從而降低網(wǎng)絡(luò)釣魚成功的機(jī)會(huì),同時(shí)訓(xùn)練網(wǎng)絡(luò)釣魚檢測(cè)系統(tǒng),增強(qiáng)識(shí)別相關(guān)的模式和語(yǔ)言,以便提高網(wǎng)絡(luò)釣魚檢測(cè)系統(tǒng)的效率。另外,隨著ChatGPT人工智能模型的演進(jìn),有可能實(shí)現(xiàn)漏洞檢測(cè)和修復(fù)的自動(dòng)化。更有甚者,ChatGPT還可以在檢測(cè)和響應(yīng)網(wǎng)絡(luò)攻擊,更快地從數(shù)據(jù)中創(chuàng)建有關(guān)安全事件的報(bào)告,輔助IT團(tuán)隊(duì)做出安全決策。
“來自人工智能的威脅并不是新問題,只是ChatGPT展示了一些看起來很可怕的應(yīng)用?!逼姘残湃斯ぶ悄苎芯吭贺?fù)責(zé)人表示,關(guān)鍵要及時(shí)意識(shí)到ChatGPT的潛在風(fēng)險(xiǎn)并及時(shí)采取適當(dāng)?shù)拇胧﹣響?yīng)對(duì)。展望未來,ChatGPT也可能是一個(gè)信號(hào),表明距離網(wǎng)絡(luò)防御決策的更高自動(dòng)化不再遙遠(yuǎn)。
敬請(qǐng)關(guān)注電子技術(shù)應(yīng)用2023年2月22日==>>商業(yè)航天研討會(huì)<<