123,123

商汤绝影行业首发原生多模态大模型车端部署

80 亿参数、每秒 40 Tokens

日期： 2024-07-20

來源：IT之家

關(guān)鍵詞： 商汤绝影多模态大模型车载芯片

7 月 19 日消息，商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛 17 日宣布，商湯絕影在行業(yè)內(nèi)率先實現(xiàn)了原生多模態(tài)大模型的車端部署。車載端側(cè) 8B 模型首包延遲在 300 毫秒以內(nèi)，推理速度 40 Tokens / 秒，覆蓋主流算力平臺。

商湯絕影為多模態(tài)大模型打造計算引擎“HyperPPL”，目前擴(kuò)展并支持主流車載計算硬件，兼容多種主流操作系統(tǒng)，適配多個車載芯片的部署平臺。

商湯絕影稱 HyperPPL 針對車載多人場景進(jìn)行優(yōu)化，使得車內(nèi)多人并發(fā)情況下，車端多模態(tài)大模型的模型推理效率相比單人沒有明顯降低。

據(jù)IT之家此前報道，商湯絕影此前表示，深圳首條自動駕駛公交線路采用其車輛與技術(shù)，所有駕駛操作都無需人員介入。

明年上千 TOPS 算力的車載芯片（英偉達(dá) Thor）就會問世。基于更高算力的計算平臺，商湯預(yù)計絕影多模態(tài)大模型車端部署方案的首包延遲將大幅降低，推理速度進(jìn)一步提高。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

商汤绝影行业首发原生多模态大模型车端部署

日期： 2024-07-20

來源：IT之家

相關(guān)內(nèi)容