這個存儲庫包含Piper RL的簡單演示代碼,展示了如何使用Piper RL來訓練一個簡單的任務:到達目標,該任務要求Piper的夾持器的中心達到指定的目標位置,而不要求Piper的末端執(zhí)行器的結(jié)束姿勢,通過簡單的獎勵函數(shù)實現(xiàn)。該存儲庫提供了兩個模擬器下的訓練示例:Mujoco和Genesis。
是德科技創(chuàng)新技術(shù)峰會來襲,報名領(lǐng)好禮
自己動手從0到1寫嵌入式操作系統(tǒng)
編程魔法師大思想
野火F407開發(fā)板-霸天虎視頻-【高級篇】
嵌入式軟件調(diào)試專題第01季:調(diào)試原理入門
內(nèi)容不相關(guān) 內(nèi)容錯誤 其它
本站介紹 | 申請友情鏈接 | 歡迎投稿 | 隱私聲明 | 廣告業(yè)務 | 網(wǎng)站地圖 | 聯(lián)系我們 | 誠聘英才
ICP許可證號:京ICP證070360號 21ic電子網(wǎng) 2000- 版權(quán)所有 用戶舉報窗口( 郵箱:macysun@21ic.com )
京公網(wǎng)安備 11010802024343號