《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 英偉達(dá)牽頭發(fā)布代碼大模型StarCoder2

英偉達(dá)牽頭發(fā)布代碼大模型StarCoder2

2024-03-06
來源:36Kr

生成式人工智能的走紅已經(jīng)持續(xù)了一年多時(shí)間,而且大概率會(huì)一直熱下去。

不過隨著大眾對(duì)于AI的了解越來越深入,有一個(gè)事實(shí)也被不少人用段子的形式揭露了出來,“我以為AI是要來幫人類做家務(wù)的,讓我好去寫詩做畫,結(jié)果現(xiàn)在AI來了,AI直接開始寫詩做畫了,我依然在掃地做菜”。

如此調(diào)侃背后指向了當(dāng)下的AI過于“風(fēng)花雪月”,離真正能改變生產(chǎn)力場景太遠(yuǎn)。

1.png

01

當(dāng)然,目前并不是所有的AI大模型廠商都在文生圖、文生視頻賽道狂奔。

日前有消息顯示,英偉達(dá)聯(lián)合知名AI開源社區(qū)Hugging Face和ServiceNow,發(fā)布了名為StarCoder2的LLMs系列模型,并希望成為代碼生成領(lǐng)域的新標(biāo)準(zhǔn)。

據(jù)悉,LLMs系列系列模型包括一個(gè)由ServiceNow訓(xùn)練的30億參數(shù)模型、一個(gè)由Hugging Face訓(xùn)練的70億參數(shù)模型,以及一個(gè)由英偉達(dá)訓(xùn)練的150億參數(shù)模型。

據(jù)悉,StarCoder2經(jīng)過了619門編程語言的訓(xùn)練,可執(zhí)行源代碼生成、工作流生成、文本摘要等專業(yè)任務(wù)。英偉達(dá)對(duì)此表示,開發(fā)人員可以利用它進(jìn)行代碼補(bǔ)全、高級(jí)代碼總結(jié)、代碼片段檢索等,從而提高工作效率。

并且值得一提的是,該模型將在BigCode Open RAIL-M許可證的基礎(chǔ)上以開放訪問的方式發(fā)布,以允許免版稅分發(fā)。與現(xiàn)階段沒有用例限制的傳統(tǒng)開源軟件不同,BigCode在發(fā)布模型時(shí)附帶了一個(gè)負(fù)責(zé)任的人工智能模型許可證,限制其被用于生成或分發(fā)惡意代碼以損害電子系統(tǒng)。

2.png

02

在GitHub Copilot之后,終于又出現(xiàn)了一個(gè)真正意義上的代碼生成大模型。那么,這一次人人都能是程序員的時(shí)代要來了嗎?當(dāng)然不是,且不提StarCoder2并有沒有夸大宣傳,即便StarCoder做到了它所宣稱的一切,上限也只不過是一個(gè)程序員的助手,而非代替程序員。這與Midjourney、Stable Diffusion在一定程度上代替畫家,有著本質(zhì)的區(qū)別。

目前StarCoder2的技術(shù)文檔并沒有公開,但從它的上一代產(chǎn)品StarCoder就能一窺該LLMs系列模型的特質(zhì)。作為將大語言模型集成至編程領(lǐng)域代表的StarCoder,其訓(xùn)練模式與傳統(tǒng)的大語言模型并沒有什么區(qū)別,無非就是訓(xùn)練ChatGPT、文心一言這類大模型主要是使用各種文字內(nèi)容,而StarCoder的語料則是代碼。

這也就意味著StarCoder與ChatGPT、文心一言沒有本質(zhì)上的區(qū)別,前者更像是一個(gè)專精于細(xì)分場景的大模型,而這一類代碼大模型目前能做到的就是自動(dòng)補(bǔ)全代碼、根據(jù)指令修改代碼,以及用自然語言解釋代碼片段等任務(wù)。

3.png

要知道,目前一眾大語言模型最大的命門就是缺乏自我糾正的能力,無論是作為AI聊天機(jī)器人的ChatGPT、文生圖的Stable Diffusion,還是文生視頻的Sora都無法規(guī)避幻覺,它們可能會(huì)生成一大段不同風(fēng)格天馬行空般的囈語。如今能看到的用ChatGPT作詩、用Stable Diffusion作畫,乃至用Sora生成視頻,其實(shí)都離不開人來篩選和修正其中可用的一段。而這背后的含義,就是目前的AIGC還不是智能體、更不是AGI,而像是一種對(duì)于人類輸出能力的模仿。

以目前應(yīng)用AIGC最為成熟的游戲美術(shù)領(lǐng)域?yàn)槔?,游戲廠商通常采用的工作流是用AI出一個(gè)底稿,然后由人工來增加細(xì)節(jié)、并糾偏,再將修改過的畫面重新輸入AI大模型,然后重復(fù)多次,直至打磨出能用的作品。指望AI一次就做成可以商用的圖片,至少現(xiàn)階段是不現(xiàn)實(shí)的一件事。然而這樣的工作模式放在編程領(lǐng)域就不那么好使了,因?yàn)槭褂肧tarCoder2其實(shí)就相當(dāng)于是接手別人的代碼、并debug。

4.png

但這幾乎可以說是程序員最不喜歡做的事情之一,特別是沒有注釋的代碼。因?yàn)槟悴豢赡芮逦髁说亓私馑舜a的整體設(shè)計(jì)思想及理念,所以能讓代碼跑起來就已經(jīng)不錯(cuò)了,再加上缺失了相關(guān)注釋,debug簡直就是一件災(zāi)難性的工作。因此如今即便已經(jīng)是程序員的用戶,對(duì)于代碼模型的使用都很謹(jǐn)慎,基本也不會(huì)考慮直接用大模型生成用于生成環(huán)境的代碼。

03

至于說有了StarCoder2人人都能成為程序員,這就更難實(shí)現(xiàn)了。用自然語言生成代碼其實(shí)早在GitHub的Copilot Chat上就已經(jīng)實(shí)現(xiàn),可又多少人僅僅靠著Copilot Chat就能敲開程序員生涯的大門呢?其實(shí)編程是一門與計(jì)算機(jī)對(duì)話的學(xué)問,C++、Java、PHP等語言則是代碼世界的“英語”、“漢語”、“法語”。但程序員真正的競爭力并不是代碼編得又快又好,而是能否把現(xiàn)實(shí)世界中的需求,清晰地翻譯到抽象的觀念世界。

5.png

這種能力,就是產(chǎn)品經(jīng)理與開發(fā)這兩大互聯(lián)網(wǎng)公司中常見職位的標(biāo)志性差異,而沒有受過計(jì)算機(jī)科學(xué)培訓(xùn)的人最缺乏的往往就是抽象能力。不過盡管程序員暫時(shí)還不需要像畫師一般擔(dān)憂自己的工作馬上就會(huì)被AI搶走,可StarCoder2等代碼大模型的出現(xiàn),就代表著相關(guān)廠商一直在嘗試削弱程序員群體的議價(jià)權(quán),這顯然不是一個(gè)好兆頭。


weidian.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。