原文来源:crowdai.org、GitHub
「机器人圈」编译:嗯~阿童木呀
概况
欢迎来到“学会奔跑”(LarningtoRun),这是此届NIPS比赛新添的议程NIPSComptitionTrack中所要面对的5个官方赛题之一,你需要开发一个控制器,使一个基于生理学的人体模型尽可能快地跨越一个复杂的障碍物。你将获得一个人体肌骨骼模型和一个基于物理学的模拟环境,在其中,你可以合成物理上和生理学上都十分准确的运动。而潜在的障碍则包括诸如台阶,或光滑的地板等外部障碍,以及诸如肌肉无力或运动噪音等内部障碍。在比赛中,分数评定标准是你在一定时间内穿过障碍物路线的距离。
我们的目标是:
用深度强化学习来解决医学领域的问题。
在强化学习研究中推广开源工具(物理模拟器、强化学习环境和比赛平台,所有这些都是开源的)。
在计算复杂、且具有随机性和高维度动作空间的环境中鼓励进行强化学习研究。
你的任务是创建一个函数f,它采用当前状态观察(一个41维向量),并以最大化奖励的方式返回肌肉刺激作用(一个18维矢量)。而你的总奖励是最后一次迭代后,骨盆在x轴上的位置减去使用韧带力的惩罚。韧带是防止你的关节过于弯曲的组织——过度使用这些组织将导致受伤,所以我们想避免这个问题。总奖励中的惩罚等于韧带在试验中产生的力的总和除以。
点击此处获取挑战中数据集部分的入门指南。如果你已经做好准备,就让我们开启此次挑战的大门吧。
旅程开启
为了模拟物理和生物力学,我们使用OpnSim——一个用于肌肉骨骼模拟的生物力学物理环境。
需要Anaconda来运行我们的模拟环境。Anaconda将创建一个具有所有必需的库的虚拟环境,以避免与操作系统中的库有所冲突。你可以从这里获取Anaconda。而在接下来的文章中,我们假设Anaconda已成功安装。
我们支持Windows、Linux和MacOSX(均为64位)系统。如果想要安装我们的模拟器,你首先需要使用OpnSim包创建一个conda环境。
在Windows系统上,打开命令提示符并键入:
condacrat-nopnsim-rl-ckidzikopnsimgitpython=2.7activatopnsim-rl
在Linux/OSX系统上,运行:
condacrat-nopnsim-rl-ckidzikopnsimgitpython=2.7sourcactivatopnsim-rl
这些命令将在你的计算机上创建一个安装了所有必要的模拟库的虚拟环境。接下来,你需要安装我们的python强化学习环境。类型(在所有平台上可用):
condainstall-cconda-forglapackgitpipinstallgit+什么偏方能治白癜风北京看白癜风要多少钱