《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > IBM企業(yè)級(jí)AI開(kāi)發(fā)平臺(tái)watsonx.ai上線DeepSeek R1蒸餾模型

IBM企業(yè)級(jí)AI開(kāi)發(fā)平臺(tái)watsonx.ai上線DeepSeek R1蒸餾模型

2025-02-11
來(lái)源:IT之家

2 月 11 日消息,IBM 日前宣布,DeepSeek-R1 蒸餾版 Llama 3.1 8B 和 Llama 3.3 70B 現(xiàn)已上線 IBM 的企業(yè)級(jí) AI 開(kāi)發(fā)平臺(tái) watsonx.ai。

0.jpg

根據(jù)官方介紹,DeepSeek 還借助知識(shí)蒸餾技術(shù),利用 R1 模型生成的數(shù)據(jù)優(yōu)化了多個(gè) Llama 和 Qwen 變體。用戶可通過(guò)以下方式在 watsonx.ai 上使用 DeepSeek 蒸餾模型:

在 watsonx.ai 的“按需部署”目錄中,IBM 提供 Llama 蒸餾版,用戶可以部署專用實(shí)例以進(jìn)行安全推理。

用戶還可通過(guò)“自定義基礎(chǔ)模型”導(dǎo)入功能,上傳 DeepSeek-R1 其他變體,例如 Qwen 蒸餾模型。

DeepSeek-R1 具備強(qiáng)大的推理能力,適用于多個(gè)領(lǐng)域:

規(guī)劃:其“鏈?zhǔn)剿季S”邏輯有助于處理需要逐步推理的任務(wù),特別適合智能體(agentic)應(yīng)用。

編程:可用于代碼生成、調(diào)試和優(yōu)化,提升開(kāi)發(fā)效率。

數(shù)學(xué)問(wèn)題求解:具備處理復(fù)雜數(shù)學(xué)問(wèn)題的能力,在科研、工程和科學(xué)計(jì)算等領(lǐng)域表現(xiàn)突出。

開(kāi)發(fā)者可在 watsonx.ai 上利用 DeepSeek-R1 進(jìn)行 AI 解決方案開(kāi)發(fā),并使用以下解決方案能力:

直觀測(cè)試和評(píng)估模型輸出

通過(guò)連接向量數(shù)據(jù)庫(kù)和嵌入模型構(gòu)建 RAG(檢索增強(qiáng)生成)管道

支持 LangChain、CrewAI 等主流 AI 框架

IBM watsonx.ai 提供靈活的開(kāi)源模型定制選項(xiàng),支持 DeepSeek-R1 在不同環(huán)境下的部署,并簡(jiǎn)化智能體開(kāi)發(fā)、微調(diào)、RAG、提示工程等工作流。此外,watsonx.ai 內(nèi)置安全機(jī)制,保障用戶應(yīng)用的安全性。

據(jù)此前報(bào)道,IBM 首席執(zhí)行官本月初曾發(fā)表長(zhǎng)文稱,他們(DeepSeek)僅用約 2000 枚英偉達(dá)芯片,以大約 600 萬(wàn)美元的成本訓(xùn)練了最新的模型,遠(yuǎn)低于行業(yè)預(yù)期。這再次證明,小型、高效的模型也能帶來(lái)實(shí)際成果,無(wú)需依賴龐大而昂貴的專有系統(tǒng)。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。