《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 我國(guó)科研團(tuán)隊(duì)提出全球首個(gè)“力位混合控制算法”

我國(guó)科研團(tuán)隊(duì)提出全球首個(gè)“力位混合控制算法”

機(jī)器人操作成功率提升近 40%
2025-10-21
來(lái)源:IT之家

10 月 20 日消息,據(jù)央視新聞報(bào)道,近日,我國(guó)科研團(tuán)隊(duì)在機(jī)器人算法領(lǐng)域取得重大突破,提出全球首個(gè)“力位混合控制算法的統(tǒng)一理論”。


6389663913334170392986656.jpg

該算法無(wú)需依賴力傳感器,就能讓機(jī)器人同時(shí)學(xué)習(xí)位置與力的控制,相關(guān)任務(wù)成功率較只使用位置控制的策略提高了約 39.5%。更值得關(guān)注的是,其相關(guān)論文目前已斬獲國(guó)際機(jī)器人學(xué)習(xí)大會(huì)杰出論文獎(jiǎng),這也是該獎(jiǎng)項(xiàng)設(shè)立以來(lái),首次由全中國(guó)籍學(xué)者團(tuán)隊(duì)摘得。

科研人員介紹,當(dāng)前廣泛應(yīng)用的視覺(jué)-語(yǔ)言-動(dòng)作模型(VLA),在應(yīng)對(duì)現(xiàn)實(shí)生活中的諸多任務(wù)時(shí),往往會(huì)顯得“力不從心”,核心問(wèn)題就在于這些任務(wù)大多涉及復(fù)雜的接觸場(chǎng)景。比如,擦黑板時(shí),機(jī)械臂必須既貼合表面又保持適當(dāng)?shù)膲毫?;開(kāi)關(guān)柜門(mén),需精準(zhǔn)感知內(nèi)部的推拉彈簧結(jié)構(gòu)。

機(jī)器人需要的不僅是“走到哪里”“手伸到哪里”,還需要理解“該用多大的力”。而在沒(méi)有力位混合控制算法前,這些都需要通過(guò)力傳感器來(lái)解決。

查詢獲悉,北京通用人工智能研究院提出首個(gè)統(tǒng)一的力位混合控制算法,能夠在無(wú)需力傳感器的條件下,同時(shí)學(xué)習(xí)位置與力的控制。

該研究通過(guò)強(qiáng)化學(xué)習(xí),訓(xùn)練策略從機(jī)器人歷史狀態(tài)中估計(jì)力,并借助位置與速度調(diào)整進(jìn)行補(bǔ)償,從而模擬多種位置、力指令及外部擾動(dòng)。

該策略可實(shí)現(xiàn)位置跟蹤、施力、力跟蹤和柔順交互等多種操作行為。

此外,力估計(jì)模塊引入的接觸信息提升了基于軌跡的模仿學(xué)習(xí)效果,在四項(xiàng)接觸豐富的操作任務(wù)中,成功率比僅使用位置控制的策略提高約 39.5%。

本研究提出了 UniFP(Unified Force and Position Control Policy)。這是足式機(jī)器人第一個(gè)能夠在單一框架下統(tǒng)一處理力與位置的控制算法。它的核心靈感來(lái)自阻抗控制。阻抗控制的思想是把機(jī)器人末端執(zhí)行器與環(huán)境之間的交互視作一個(gè)彈簧–阻尼–質(zhì)量系統(tǒng),通過(guò)控制偏差來(lái)同時(shí)調(diào)節(jié)位置與力。

在 UniFP 中,只考慮末端執(zhí)行器低速移動(dòng)的問(wèn)題,忽略速度和加速度項(xiàng),把期望的位置、位置指令和力指令、外部的接觸力統(tǒng)一寫(xiě)進(jìn)了一個(gè)公式,讓策略既能完成軌跡跟隨,又能根據(jù)接觸情況自動(dòng)調(diào)節(jié)。同時(shí)通過(guò)一個(gè)力估計(jì)器,利用機(jī)器人歷史狀態(tài)信息和動(dòng)作信息估計(jì)出受到的合外力。這樣一來(lái),機(jī)器人不再是“機(jī)械地走完路徑”,而是能夠感知并主動(dòng)對(duì)環(huán)境施加力,回應(yīng)環(huán)境。

該研究在 Unitree B2-Z1 四足操控平臺(tái)和 Unitree G1 人形機(jī)器人上開(kāi)展了七項(xiàng)實(shí)驗(yàn)任務(wù)。在擦黑板任務(wù)中,位置控制的策略要么擦不干凈,要么用力過(guò)大,而 UniFP 能保持穩(wěn)定的接觸壓力,把黑板徹底擦干凈。在開(kāi)關(guān)柜門(mén)任務(wù)中,視覺(jué)方法根本無(wú)法識(shí)別微小的推拉式彈簧,而 UniFP 通過(guò)力估計(jì)器準(zhǔn)確地觸發(fā)開(kāi)關(guān)。在抽屜被遮擋的場(chǎng)景下,基線方法成功率急劇下降到 0.3,而 UniFP 借助力感知將成功率提升到 0.76。


subscribe.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。