《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > NVIDIA發(fā)布數(shù)字人微服務(wù)

NVIDIA發(fā)布數(shù)字人微服務(wù)

為制作生成式AI數(shù)字化身鋪平未來之路
2024-06-03
來源:NVIDIA
關(guān)鍵詞: NVIDIA 生成式AI 數(shù)字人

NVIDIA ACE現(xiàn)已全面在云端推出,并在RTX AI PC上提供搶先體驗,已獲戴爾科技、ServiceNow、Aww Inc.、英業(yè)達、完美世界游戲等多家客戶服務(wù)、游戲和醫(yī)療保健領(lǐng)域的公司采用

COMPUTEX—2024年6月2日NVIDIA宣布全面推出NVIDIA ACE生成式AI微服務(wù),以加速新一代數(shù)字人的發(fā)展,并將在平臺上推出全新的生成式AI突破??蛻舴?wù)、游戲和醫(yī)療保健領(lǐng)域的公司率先采用ACE技術(shù),以簡化在客戶服務(wù)、遠程醫(yī)療、游戲和娛樂領(lǐng)域創(chuàng)建、動畫化并操作栩栩如生的數(shù)字人的過程。

NVIDIA ACE數(shù)字人生成式AI套件現(xiàn)已全面推出,包括以下內(nèi)容:

●  NVIDIA Riva ASR,TTS和NMT — 用于自動語音識別、文本到語音轉(zhuǎn)換和翻譯。

●  NVIDIA Nemotron LLM — 用于語言理解以及根據(jù)上下文生成回復。

●  NVIDIA Audio2Face — 根據(jù)音軌制作栩栩如生的面部動畫。

●  NVIDIA Omniverse RTX — 用于實時路徑追蹤以制作逼真的皮膚和毛發(fā)。

全新推出的技術(shù)包括:

●  NVIDIA Audio2Gesture — 用于根據(jù)音軌生成肢體手勢,即將推出。

●  NVIDIA Nemotron-3 4.5B — 一種全新的小語言模型 (SLM),專為低延遲、本地端RTX AI PC推理而設(shè)計。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“數(shù)字人將為各行各業(yè)帶來革命性變革。NVIDIA ACE為我們的開發(fā)者生態(tài)提供多模態(tài)大語言模型和神經(jīng)圖形領(lǐng)域的突破,使我們更接近意圖驅(qū)動的計算未來,即與計算機的交互將像與人類的互動一樣自然。”

數(shù)字人進駐一億臺RTX AI PC

NVIDIA已將ACE作為NIM微服務(wù)提供給開發(fā)者在數(shù)據(jù)中心運行?,F(xiàn)在,NVIDIA正在打造ACE PC NIM微服務(wù),可以部署在裝機量達到一億臺的RTX AI PC和筆記本電腦上。

這包括NVIDIA的首個小語言模型(SLM) -- NVIDIA Nemotron-3 4.5B,該模型專門用于在終端設(shè)備上運行,具有與在云端運行的大語言模型(LLMs)相似的精度和準確性。Nemotron-3 4.5B 小語言模型(SLM)現(xiàn)已進入搶先體驗階段。NVIDIA Audio2Face和NVIDIA Riva ASR的設(shè)備端模型也將很快推出搶先體驗版。

全新的NVIDIA AI Inference Manager (AIM)應(yīng)用開發(fā)工具包簡化了ACE在PC上的部署過程。它以統(tǒng)一格式為PC預先配置必要的AI模型、引擎和依賴包,同時在PC和云端之間完美調(diào)度AI推理操作。

與Inworld AI合作開發(fā)的最新版Covert Protocol技術(shù)Demo在COMPUTEX演示。通過在 GeForce RTX PC上本地運行Audio2Face和Riva ASR,該演示使玩家能夠通過對話來互動,并影響數(shù)字人非玩家角色(NPC)的行為,以完成任務(wù)。

最新ACE技術(shù)擴展數(shù)字人生態(tài)規(guī)模

NVIDIA正與Aww Inc.、戴爾科技、Gumption、Hippocratic AI、英業(yè)達、掌趣科技、完美世界游戲、Reality Arts、甲尚科技、ServiceNow、Soulbotix、數(shù)字栩生和UneeQ等公司的開發(fā)者合作,利用ACE開發(fā)各種應(yīng)用。

Aww Inc. — 位于日本的領(lǐng)先虛擬人技術(shù)開發(fā)公司Aww Inc.在2018年推出了首個虛擬名星Imma。此后,Imma在50多個國家成為主要全球品牌的代言人。現(xiàn)在,Aww Inc.計劃利用ACE Audio2Face微服務(wù)進行實時動畫制作,為用戶提供更好的互動交流體驗。

完美世界游戲 — 游戲開發(fā)者和發(fā)行商完美世界游戲公司在其全新的神話荒野風格的Legends技術(shù)演示Demo中采用了ACE。玩家可以與逼真的 AI NPC 用英語和普通話完全互動。利用NVIDIA Audio2Face NIM,可實時生成與角色聲音響應(yīng)相符的逼真的面部動畫。

掌趣科技 — 掌趣科技和悠米互娛聯(lián)合推出的 Code Z 是一款 AI 游戲創(chuàng)作平臺,能夠利用 AI 技術(shù)減少創(chuàng)作開放世界游戲所需的資源,讓個人和小型團隊也能制作大型游戲。Code Z 基于“Faith Framework”AI 機器學習訓練系統(tǒng),讓創(chuàng)作者無需編寫任何代碼,即可快速生成 3D 游戲場景和數(shù)字素材。此外,它還能讓創(chuàng)作者創(chuàng)建和訓練高度個性化的 AI 數(shù)字人,實現(xiàn)動態(tài)互動和沉浸式體驗。Code Z 采用了 Audio2Face 和 DLSS,使 AI 數(shù)字人能夠在與玩家實時對話時生成豐富的表情,并實現(xiàn)實時口型同步。

英業(yè)達 — 正在大力投資AI領(lǐng)域的科技公司英業(yè)達使用NVIDIA Audio2Face NIM增強其VRSTATE平臺的醫(yī)療保健AI客戶端。集成NVIDIA Audio2Face NIM可以提供更具吸引力和安撫性的虛擬咨詢體驗。英業(yè)達將在COMPUTEX期間展示一款可以幫助患者獲取健康信息的AI客戶端。

ServiceNow — 用于協(xié)助企業(yè)業(yè)務(wù)轉(zhuǎn)型的AI平臺ServiceNow,近期在其Now Assist Gen AI Experience中展示ACE NIM的生成式AI服務(wù)客戶端演示,突顯數(shù)字化身在零售、旅游等行業(yè)提升客戶和員工互動的潛力。

戴爾科技 — 在上個月的Dell Technologies World上推出用于制作數(shù)字助手的最新解決方案Dell Generative AI Solutions。該解決方案使企業(yè)能夠利用智能數(shù)字助理,通過自然對話的形式與零售、醫(yī)療保健和客戶服務(wù)等各行各業(yè)的客戶進行互動。

NVIDIA在COMPUTEX 2024為數(shù)字人初創(chuàng)企業(yè)喝彩

NVIDIA藝術(shù)團隊使用基于ACE的生成式AI工具,包括Synthesia和Hour One,制作了一個“digital Jensen”化身,該化身由文字生成的視頻制作而成。這款多語言化身以他獨特的聲音和風格為特色,使用ElevenLabs的專有AI語音技術(shù)生成普通話和英語的聲音。NVIDIA還與專注于AI語音技術(shù)的NVIDIA Inception成員Voicemod合作,為NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛主題演講的謝幕曲進行創(chuàng)作。

ACE NIM現(xiàn)已推出

用于服務(wù)器部署的NVIDIA ACE NIM微服務(wù)(包括Riva和Audio2Face)現(xiàn)已投入生產(chǎn),可添加NVIDIA AI Enterprise應(yīng)用,供開發(fā)者獲得企業(yè)級的支持服務(wù)?,F(xiàn)可點擊注冊以獲取在RTX AI PC上運行的ACE NIM微服務(wù)的搶先體驗版。

Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。