关于重新建设网站的请示,济南网站制作策划,最全磁力搜索引擎,马帮erp是干嘛的一、项目更新
近期重新git clone isaac gym的强化部分#xff08;具体见系列第5篇#xff09;时发现官方的github库有跟新#xff0c;git clone下来后发现多了若干个task#xff0c;在环境配置上也有一定区别。 例如新旧两版工程项目的setup.py区别如下#xff1a; git …一、项目更新
近期重新git clone isaac gym的强化部分具体见系列第5篇时发现官方的github库有跟新git clone下来后发现多了若干个task在环境配置上也有一定区别。 例如新旧两版工程项目的setup.py区别如下 git clone新项目后直接在之前配置好的环境中运行会有报错如下
Error executing job with overrides: [taskCartpole]
Traceback (most recent call last):File train.py, line 146, in launch_rlg_hydrarunner build_runner(RLGPUAlgoObserver())File train.py, line 137, in build_runnermodel_builder.register_model(continuous_amp, lambda network, **kwargs : amp_models.ModelAMPContinuous(network))
AttributeError: module rl_games.algos_torch.model_builder has no attribute register_modelSet the environment variable HYDRA_FULL_ERROR1 for a complete stack trace.根据新项目的setup.py的提示添加了如下的环境
ip install rl-games1.5.2
pip install gym0.24.1
pip install pyvirtualdisplay添加后可以运行新的工程项目。
二、benchmark框架梳理
给出的tasks实例位于如下路径
~/IsaacGymEnvs/isaacgymenvs/tasks执行命令为
python train.py tasktask名称2.1 task相关程序构成
每一个task主要由三个文件构成 主程序task名.py 在tasks文件夹下以task名称命名task名.py的文件是主体程序包含程序主要设计环境生成奖励函数控制模块等等 强化学习算法配置文件task名PPO.yaml 位于~/isaacgymenvs/cfg/train 主要是包含强化学习相关的配置参数 task参数文件task名.yaml 位于~/isaacgymenvs/cfg/task 主要包含此task的名称训练环境数量需要用到的初始参数加载的各类模型(urdf文件等)路径以及仿真环境sim信息轴向、重力、physx相关系数等
2.2 训练后得到文件
训练后生成的模型文件位于~/isaacgymenvs/runs/task名 文件夹内包含nn,summaries.config.yaml三个文件
其中config.yaml为本次训练的环境参数env、仿真参数sim、训练参数train等
nn文件夹内为后缀为.pth的模型文件可以用命令进行回放相关指令见之前博文或官网每一定周期内会生成一个过程文件名称为last_task名_ep_x_rew_x.pth其中x为相关参数有一最优参数保留的模型文件名称为task名.pth在终端可以看到.pth文件的打印与更新提示
2.3 task主程序逻辑图
个人绘制如有错误还请见谅欢迎指出随时交流 撰写自己的task时模板位于~/isaacgymenvs/tasks/base/vec_task.py所有程序根据此车程序进行子类化。