机器人运动控制算法工程师(强化学习)
薪资面议
算法工程师 北京 本科 2026届

岗位关键词
毕业要求:2026届
投递时间:2025年8月1日-2025年12月31日
岗位职责
1. 开发基于强化/模仿学习的机器人行走及全身控制策略;
2. 开发复杂地形下基于视觉的强化学习行走策略;
3. 负责算法策略的训练与移植部署,实现算法sim-to-real在机器人实机上落地应用;
4. 持续跟踪国内外前沿研究成果,并进行相关算法复现;
5. 编写相关技术文档,推动团队技术沉淀与知识共享。
岗位要求
1. 硕士及以上学历,机器人、计算机、机械工程、人工智能、应用数学等专业,数学、英语能力扎实,具有较强的学习与研究能力;
2. 掌握主流的强化学习算法,如:PPO、DQN、DDPG、SAC等;
3. 掌握机器人学习中的广泛使用的训练方法和模型架构,如:教师学生模型(Teacher-Student Network),课程学习(Curriculum Learning),域随机化(Domain Randomization),混合专家模型(MoE)等;
4. 熟悉Mujoco、IsaacGym、IsaacLab等机器人仿真平台;
5. 具备足式机器人强化学习算法的实机调试和sim-to-real经验;
6. 扎实的C++、Python编程能力,熟悉Pytorch等机器学习框架,熟悉Linux,Git,ROS等开发环境和工具。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报