《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 商湯絕影行業(yè)首發(fā)原生多模態(tài)大模型車端部署

商湯絕影行業(yè)首發(fā)原生多模態(tài)大模型車端部署

80 億參數(shù)、每秒 40 Tokens
2024-07-20
來(lái)源:IT之家

 7 月 19 日消息,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛 17 日宣布,商湯絕影在行業(yè)內(nèi)率先實(shí)現(xiàn)了原生多模態(tài)大模型的車端部署。車載端側(cè) 8B 模型首包延遲在 300 毫秒以內(nèi),推理速度 40 Tokens / 秒,覆蓋主流算力平臺(tái)。

0.png

商湯絕影為多模態(tài)大模型打造計(jì)算引擎“HyperPPL”,目前擴(kuò)展并支持主流車載計(jì)算硬件,兼容多種主流操作系統(tǒng),適配多個(gè)車載芯片的部署平臺(tái)。

商湯絕影稱 HyperPPL 針對(duì)車載多人場(chǎng)景進(jìn)行優(yōu)化,使得車內(nèi)多人并發(fā)情況下,車端多模態(tài)大模型的模型推理效率相比單人沒(méi)有明顯降低。

據(jù)IT之家此前報(bào)道,商湯絕影此前表示,深圳首條自動(dòng)駕駛公交線路采用其車輛與技術(shù),所有駕駛操作都無(wú)需人員介入。

明年上千 TOPS 算力的車載芯片(英偉達(dá) Thor)就會(huì)問(wèn)世?;诟咚懔Φ挠?jì)算平臺(tái),商湯預(yù)計(jì)絕影多模態(tài)大模型車端部署方案的首包延遲將大幅降低,推理速度進(jìn)一步提高。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。