【環(huán)球快播報】谷歌 DeepMind 推出無需監(jiān)督即可自學的人工智能機器人
編程客棧() 6月26日消息:機器人正迅速成為我們?nèi)粘I畹囊徊糠郑鼈兺ǔV槐痪幊虂硗瓿商?i class="ZpUhGM">android定的任務。盡管利用人工智能的最新進展可能會導致機器人在更多方面發(fā)揮幫助作用,但構建通用機器人的進展較慢,部分原因是需要收集現(xiàn)實世界的培訓數(shù)據(jù)。
日前谷歌 DeepMind 最新的論文php介紹了一種自我改進的機器人人工智能代理程序,名為 RoboCat,它學習執(zhí)行不同機械臂上的各種任務,然后自動生成新的訓練數(shù)據(jù)來改善其技術。
(相關資料圖)
DeepMind 表示,先前的研究探索了如何開發(fā)能夠按比例學習多項任務并將語言模型的理解能力與協(xié)助機器人的現(xiàn)實能力相結合的機器人。RoboCat 是第一個解決并適應于多個任務,并在不同的真實機器人上完成的代理程序。
RoboCat 學習速度比其他最先進的模型快得多。它可以通過僅使用 100 個演示來掌握新任務,因為它依靠大量和多樣化的數(shù)據(jù)集。這種能力將有助于加速機器人學研究,因為它減少了人工監(jiān)督培訓的需求,并是創(chuàng)建通用機器人的重要一步。
DeepMind 的研究科學家兼 Ro編程客棧boCat 團隊成員之一的 Alex Lee 在接受 TechCrunch 的電子郵件采訪時表示:「我們證明了一個單一的大型模型可以在多個真實機器人實體上解決各種不同的任務,并能夠快速適應新的任務和實體。」
RoboCat 是受 Gato 啟發(fā)而開發(fā)的,Gato 是 DeepMind 的一個人工智能編程客棧模型,可以分析和處理文本、圖像和事件。RoboCat 使用在模擬和現(xiàn)實生活中收集的圖像和行動數(shù)據(jù)進行訓練。Lee 表示,這些數(shù)據(jù)來自虛擬環(huán)境中其他控制機器人模型、人類控制機器人以及之前的 RoboCat 模型的組合。
為了訓練 RoboCat,DeepMind 的研究人員首先收集了 100 到編程客棧1000 個由人類控制的機器人臂執(zhí)行任務的示范。然后,他們在該任務上對 RoboCat 進行了微調(diào),創(chuàng)建了一個專門的「分支」模型,平均訓練了該任務 1 萬次。
利用分支模型生成的數(shù)據(jù)和示范數(shù)據(jù),研究人員不斷擴充了 RoboCat 的訓練數(shù)據(jù)集,并訓練了后續(xù)的新版本 RoboCat。
RoboCat 的最終版本在模擬和實際世界中的 141 種不同變體的任務集上進行了訓練,總共涵蓋了 253 個任務。DeepMind 聲稱,在觀察了數(shù)小時的人類控制示范后,RoboCat 學會了操作不同的機器人臂。
雖然 RoboCat 在四種帶有雙爪臂的機器人上進行了訓練,但該模型能夠適應一個帶有三指夾爪和兩倍可控輸入的更復雜的臂。
盡管在 DeepMind 的測試中,RoboCat 在不同任務上的成功率差異很大,從最低 13% 到最高 99%。這是在訓練數(shù)據(jù)中有 1000 個示范的情況下;當示范數(shù)量減少一半時,成功率可預見地較低。
然而,在某些場景中,DeepMind 聲稱 RoboCat 只需 100 個示范就能學會新任務。
Lee 補充說:「通過提供有限數(shù)量的示范來進行新任務的微調(diào),RoboCat 可以自動生成更多數(shù)據(jù)以進一步改進。」未來,研究團隊的目標是將 RoboCat 學習完成新任務所需的示范數(shù)量降低到 10 個以下。
閱讀DeepMind在 arXiv 上的論文:https://arxiv.org/abs/2306.11706
關鍵詞:
相關文章
【環(huán)球快播報】谷歌 DeepMind 推出無需監(jiān)督即可自學的人工智能機器人
編程客棧()6月26日消息:機器人正迅速成為我們?nèi)粘I畹囊徊糠郑鼈?/p>
中國信通院:1-5月國內(nèi)市場手機總體出貨量累計1.08億部 同比下降0.7%
6月26日,中國信通院數(shù)據(jù)顯示,2023年5月,國內(nèi)市場手機出貨量2603 7萬
精彩推送
【環(huán)球快播報】谷歌 DeepMind 推出無需監(jiān)督即可自學的人工智能機器人
編程客棧()6月26日消息:機器人正迅速成為我們?nèi)粘I畹囊徊糠郑鼈?/p>
億通科技(300211.SZ):近日取得1項發(fā)明專利 為一種快速、精確的圓形檢測和圓心定位方法|環(huán)球聚焦
格隆匯6月25日丨億通科技(300211 SZ)公布,公司于近日取得國家知識產(chǎn)權
新消息丨研報掘金丨天風證券:百亞股份618表現(xiàn)亮眼,結構優(yōu)化渠道精耕持續(xù)推進
格隆匯6月26日丨天風證券601162研報指出百亞股份003006SZ618自由點同比
奔朗新材:亮相廣州陶瓷工業(yè)展 意向訂單增幅喜人_今日關注
證券時報網(wǎng)訊,近日,“2023中國國際陶瓷工業(yè)技術與產(chǎn)品展覽會(第37屆
深圳通報百富興大廈異響振動事件后續(xù):房屋基礎薄弱,將全面加固 每日速看
6月26日,百富興大廈事件處置現(xiàn)場指揮部發(fā)布百富興大廈后續(xù)情況通報。
中國信通院:1-5月國內(nèi)市場手機總體出貨量累計1.08億部 同比下降0.7%
6月26日,中國信通院數(shù)據(jù)顯示,2023年5月,國內(nèi)市場手機出貨量2603 7萬
天天實時:墻角數(shù)枝梅凌寒獨自開詩題_墻角數(shù)枝梅凌寒獨自開全詩
1、出自《梅花》,是北宋詩人王安石創(chuàng)作的一首五言絕句。2、此詩前兩句
破發(fā)股凱賽生物擬定增募66億 2020上市即巔峰募55.6億
破發(fā)股凱賽生物擬定增募66億2020上市即巔峰募55 6億---中國經(jīng)濟網(wǎng)北京6
洛陽銀保監(jiān)分局 “三步走”推動轄內(nèi)村鎮(zhèn)銀行減費讓利|觀熱點
為全面提升洛陽轄內(nèi)村鎮(zhèn)銀行服務實體經(jīng)濟質(zhì)效,切實降低企業(yè)信貸融資成
中國鐵路端午小長假運輸發(fā)送旅客超7000萬人次 較2019年同期增長11.3%_全球球精選
中新社北京6月26日電 (記者 劉文文)記者26日從中國國家鐵路集團有
當前動態(tài):中國信通院:5 月國內(nèi)市場手機出貨量 2603.7 萬部,增長 25.2%
IT之家6月26日消息,中國信通院公布數(shù)據(jù)顯示,2023年5月,國內(nèi)市場手機
內(nèi)蒙古鄂爾多斯啟動灌木植被碳儲量監(jiān)測計量方法研究技術服務項目
內(nèi)蒙古鄂爾多斯啟動灌木植被碳儲量監(jiān)測計量方法研究技術服務項目近日,
環(huán)球動態(tài):全國首創(chuàng)!北京推養(yǎng)老服務合同網(wǎng)簽,預付金有新規(guī)
北京日報客戶端|記者王琪鵬養(yǎng)老機構線上能監(jiān)管,簽約服務全程可追溯。
環(huán)球視訊!打通供電服務“最后一米” 電力數(shù)字化“移動營業(yè)廳”開到了村門口
圖說:今年端午節(jié)期間,一個“數(shù)字營業(yè)廳”出現(xiàn)在寶山區(qū)月獅村門口采訪
福建華安名優(yōu)特產(chǎn)品專展在京召開 簽約超8000萬元_全球聚焦
6月25日,北京福建會客廳& 183;華安名優(yōu)特產(chǎn)品專展在北京福建大廈舉辦
焦點要聞:遠東發(fā)展(00035.HK)附屬與其他Care Park各方及Belteky各方訂立和解契據(jù)
遠東發(fā)展(00035)公布,于2023年6月26日(交易時段后),F(xiàn)ECC
重慶氣礦江北作業(yè)區(qū)提前10天實現(xiàn)采氣目標“過半”
截至6月20日,江北作業(yè)區(qū)生產(chǎn)天然氣1508 98萬立方米,完成年度天然
外交部:中方支持俄羅斯維護國家穩(wěn)定 實現(xiàn)發(fā)展繁榮-微頭條
作為友好鄰邦和新時代全面戰(zhàn)略協(xié)作伙伴,中方支持也相信俄羅斯能夠維護
