今年的春節(jié)聯(lián)歡晚會(huì)舞臺(tái)上,人形機(jī)器人以整段復(fù)雜編排、穩(wěn)定協(xié)同的方式,與真人演員同臺(tái)完成高強(qiáng)度表演。過去一年,我們?cè)隈R拉松賽事、行業(yè)大會(huì)、城市示范應(yīng)用現(xiàn)場,頻繁看到人形機(jī)器人的身影。從公開競技到產(chǎn)業(yè)場景試運(yùn)行,從實(shí)驗(yàn)室樣機(jī)到商業(yè)化測試平臺(tái),當(dāng)行業(yè)關(guān)注點(diǎn)從“表演”走向“實(shí)干”,具身智能開始進(jìn)入一個(gè)更為冷靜、也更為關(guān)鍵的階段——底層能力建設(shè)。算法是否標(biāo)準(zhǔn)化?數(shù)據(jù)體系是否可復(fù)用?控制平臺(tái)是否具備跨場景遷移能力?這些問題,決定了機(jī)器人產(chǎn)業(yè)能否從示范應(yīng)用走向規(guī)模部署。

2月28日,第二屆智能機(jī)器人通用技術(shù)底座開發(fā)者大會(huì)暨啟智技術(shù)成果發(fā)布會(huì)隆重召開,大會(huì)把焦點(diǎn)放在開發(fā)工具鏈、數(shù)據(jù)體系構(gòu)建與控制平臺(tái)架構(gòu)上,試圖回答一個(gè)更現(xiàn)實(shí)的問題:機(jī)器人產(chǎn)業(yè)的規(guī)?;瘧?yīng)用,通用技術(shù)底座準(zhǔn)備好了嗎?
從能力展示到系統(tǒng)落地:三大結(jié)構(gòu)性矛盾倒逼底座升級(jí)
具身智能近年來在運(yùn)動(dòng)控制層面取得明顯突破,機(jī)器人可以完成奔跑、平衡控制與復(fù)雜抓取,硬件穩(wěn)定性持續(xù)提升。然而,當(dāng)應(yīng)用場景從展示轉(zhuǎn)向真實(shí)生產(chǎn)與服務(wù)環(huán)境,產(chǎn)業(yè)長期存在的結(jié)構(gòu)性矛盾逐漸顯現(xiàn)。
市場并不缺需求。制造、零售、醫(yī)療等領(lǐng)域,對(duì)機(jī)器人替代部分重復(fù)性崗位的期待一直存在。但是當(dāng)其真正進(jìn)入現(xiàn)場部署時(shí),難題往往接踵而至:任務(wù)邏輯需要工程師反復(fù)示教,參數(shù)調(diào)試高度依賴人工經(jīng)驗(yàn),不同場景之間難以遷移復(fù)用。與此同時(shí),“小腦”與“大腦”的能力并不在同一進(jìn)度線上。長程任務(wù)理解、多步驟決策、跨環(huán)境泛化能力,仍然是制約機(jī)器人走向?qū)嵱没年P(guān)鍵因素。更值得關(guān)注的是生態(tài)層面的割裂。一方面,國產(chǎn)核心部件與整機(jī)能力不斷成熟,硬件基礎(chǔ)日益夯實(shí);另一方面,操作系統(tǒng)、開發(fā)工具鏈與技能沉淀機(jī)制仍然分散,不同品牌之間的遷移成本高,已有能力難以轉(zhuǎn)化為通用資產(chǎn)。
因此,當(dāng)行業(yè)的關(guān)注點(diǎn)從“單點(diǎn)突破”轉(zhuǎn)向“系統(tǒng)能力”時(shí),啟智給出了自己的答案:構(gòu)建一套可持續(xù)演進(jìn)的通用技術(shù)底座。
構(gòu)建三位一體的技術(shù)底座:讓能力沉淀為產(chǎn)業(yè)資產(chǎn)
過去,一個(gè)機(jī)器人新技能的實(shí)現(xiàn),往往意味著數(shù)周甚至數(shù)月的示教與調(diào)試。啟智在發(fā)布會(huì)上推出的墨斗IDE全新功能——Vibe Coding,打破機(jī)器人開發(fā)長期依賴專業(yè)工程師示教與編程的壁壘,其核心在于以自然語言驅(qū)動(dòng)任務(wù)生成,讓最懂業(yè)務(wù)的人直接描述需求,由系統(tǒng)自動(dòng)轉(zhuǎn)化為流程圖與可執(zhí)行代碼,真正實(shí)現(xiàn)“意圖直出”。

面對(duì)專業(yè)開發(fā)者,墨斗IDE可以通過模型輕量化技術(shù)提升仿真流暢度;通過一鍵生成DXF工程圖功能,讓仿真布局與現(xiàn)場的CAD圖紙無縫銜接,確?!八娂此谩薄?/p>
墨斗IDE為何能如此高效?答案在于底座協(xié)同。它并非孤立工具,而是建立在大衍數(shù)據(jù)平臺(tái)的技能模型與Openmind OS控制體系之上,前端的“自然語言直出”,背后是完整的數(shù)據(jù)與控制支撐。
正因如此,數(shù)據(jù)體系的升級(jí),是本次發(fā)布會(huì)另一條主線。很多開發(fā)團(tuán)隊(duì)最大的時(shí)間消耗并不在算法,而在數(shù)據(jù)采集、標(biāo)注與治理。升級(jí)后的大衍數(shù)據(jù)平臺(tái),正在把這一過程重構(gòu)為標(biāo)準(zhǔn)化流程。異構(gòu)數(shù)采模塊實(shí)現(xiàn)對(duì)VR遙操、多模態(tài)動(dòng)捕服及光學(xué)動(dòng)捕系統(tǒng)的統(tǒng)一接入,等于為不同機(jī)器人本體建立了一套“通用適配接口”。自動(dòng)標(biāo)注與質(zhì)量評(píng)估形成數(shù)據(jù)治理的“智能雙核”,結(jié)合強(qiáng)化學(xué)習(xí)工具鏈與GOPS強(qiáng)化學(xué)習(xí)軟件,讓模型訓(xùn)練周期顯著壓縮。

大衍數(shù)據(jù)平臺(tái)的長期目標(biāo),是構(gòu)建一個(gè)開放共享的機(jī)器人“技能庫”。這一體系以“蕪湖矽客機(jī)器人未來社區(qū)”的多元真實(shí)場景為基礎(chǔ),涵蓋工業(yè)、服務(wù)與家庭環(huán)境,使機(jī)器人在真實(shí)與仿真結(jié)合的條件下開展大規(guī)模、多樣化訓(xùn)練,確保技能來源于真實(shí)需求。
與此同時(shí),通過HumanGPT與RobotGPT的協(xié)同機(jī)制,前者負(fù)責(zé)理解和學(xué)習(xí)人類動(dòng)作意圖,轉(zhuǎn)化為數(shù)字化技能模型,后者則將這些技能適配至不同機(jī)器人本體,實(shí)現(xiàn)跨平臺(tái)遷移與復(fù)用。最終,人類示范與機(jī)器自主學(xué)習(xí)的成果將持續(xù)沉淀,形成可迭代進(jìn)化的技能生態(tài)。
如果說墨斗IDE解決的是開發(fā)效率,大衍平臺(tái)回應(yīng)的是智能成長,那么Openmind OS則是整套底座能否落地的關(guān)鍵一環(huán)。發(fā)布會(huì)上,啟智將其定義為“打通思考與行動(dòng)的最后一道關(guān)卡”。在行業(yè)普遍面臨“開源算法活躍、控制系統(tǒng)封閉”的現(xiàn)實(shí)背景下,Openmind OS采用分層架構(gòu),讓實(shí)時(shí)控制與智能算法在同一系統(tǒng)中協(xié)同運(yùn)行。系統(tǒng)兼容ROS生態(tài),同時(shí)在關(guān)鍵控制模塊實(shí)現(xiàn)自主化替代,為跨平臺(tái)遷移、多機(jī)協(xié)同與安全運(yùn)行提供統(tǒng)一基礎(chǔ)。

大會(huì)現(xiàn)場通過一段商超理貨實(shí)景演示,對(duì)系統(tǒng)能力進(jìn)行了集中驗(yàn)證。圍繞“倉庫取貨—開箱處理—商品上架”的完整流程,墨斗IDE以自然語言快速生成任務(wù)編排,Openmind OS統(tǒng)一調(diào)度復(fù)合機(jī)器人與人形機(jī)器人協(xié)同作業(yè):前者完成導(dǎo)航與搬運(yùn),后者承擔(dān)開箱、識(shí)別、抓取與精準(zhǔn)擺放,全程無需人工干預(yù)。機(jī)器人穩(wěn)定、靈巧的操作能力,則源于大衍數(shù)據(jù)平臺(tái)訓(xùn)練形成的技能模型支持。該案例以真實(shí)場景打通任務(wù)生成、協(xié)同執(zhí)行與技能支撐的閉環(huán),展現(xiàn)了機(jī)器人自主作業(yè)從概念走向?qū)嵺`的可行路徑。
yobot系列發(fā)布:底座能力的系統(tǒng)驗(yàn)證
除了通用技術(shù)底座的升級(jí)外,大會(huì)期間,啟智發(fā)布了全新機(jī)器人平臺(tái)家族——yobot系列,作為通用技術(shù)底座能力的產(chǎn)品化呈現(xiàn),這一基于統(tǒng)一技術(shù)架構(gòu)構(gòu)建的機(jī)器人產(chǎn)品系列,覆蓋運(yùn)動(dòng)探索、服務(wù)交互與勞動(dòng)執(zhí)行等不同應(yīng)用方向,用于驗(yàn)證底座在真實(shí)場景中的工程可行性。
其中,R2V1主要承擔(dān)運(yùn)動(dòng)控制與算法訓(xùn)練驗(yàn)證任務(wù),W2面向醫(yī)療服務(wù)場景提供交互與導(dǎo)引能力,R2V2則定位為高強(qiáng)度勞動(dòng)機(jī)器人,已進(jìn)入商超等環(huán)境執(zhí)行理貨與補(bǔ)貨作業(yè)。不同形態(tài)機(jī)器人共享底座能力,使開發(fā)、訓(xùn)練與部署形成統(tǒng)一技術(shù)路徑。從運(yùn)動(dòng)驗(yàn)證到服務(wù)交互,再到勞動(dòng)執(zhí)行,yobot系列展示了不同場景能力,也構(gòu)建起通用技術(shù)底座持續(xù)迭代的數(shù)據(jù)來源與應(yīng)用反饋通道,形成從研發(fā)到落地的閉環(huán)路徑。
結(jié)語
在技術(shù)體系持續(xù)演進(jìn)的同時(shí),啟智同步構(gòu)建圍繞通用技術(shù)底座的產(chǎn)業(yè)與研發(fā)生態(tài)。過去一年,公司與多所高校開展真實(shí)機(jī)器人平臺(tái)聯(lián)合研究,并與清華大學(xué)共建“具身智能計(jì)算與感知聯(lián)合研究中心”,推動(dòng)前沿算法在國產(chǎn)平臺(tái)與真實(shí)場景中驗(yàn)證落地。啟智在大會(huì)上正式發(fā)布“啟智開發(fā)者扶持計(jì)劃”,區(qū)分研究型與應(yīng)用型路徑,旨在將少數(shù)人的科研成果轉(zhuǎn)化為服務(wù)多數(shù)人開發(fā)的能力。同時(shí),在工業(yè)制造、醫(yī)療服務(wù)與未來社區(qū)等場景中,通過POC持續(xù)沉淀工程經(jīng)驗(yàn),加速底座能力迭代升級(jí)。

當(dāng)具身智能邁向規(guī)?;渴鸬呐R界點(diǎn),決定產(chǎn)業(yè)節(jié)奏的,將是系統(tǒng)能力的可復(fù)制與可擴(kuò)展。啟智以技術(shù)、產(chǎn)品與生態(tài)協(xié)同推進(jìn),讓具身智能真正從“演示”走向“實(shí)干”。通用技術(shù)底座的成熟度,終將決定機(jī)器人產(chǎn)業(yè)落地的速度與高度。

