机器人运动控制算法工程师(强化学习)

薪资面议
算法工程师
北京
本科
2026届
岗位关键词

毕业要求:2026届

投递时间:2025年8月1日-2025年12月31日

岗位职责
1. 开发基于强化/模仿学习的机器人行走及全身控制策略; 2. 开发复杂地形下基于视觉的强化学习行走策略; 3. 负责算法策略的训练与移植部署,实现算法sim-to-real在机器人实机上落地应用; 4. 持续跟踪国内外前沿研究成果,并进行相关算法复现; 5. 编写相关技术文档,推动团队技术沉淀与知识共享。
岗位要求
1. 硕士及以上学历,机器人、计算机、机械工程、人工智能、应用数学等专业,数学、英语能力扎实,具有较强的学习与研究能力; 2. 掌握主流的强化学习算法,如:PPO、DQN、DDPG、SAC等; 3. 掌握机器人学习中的广泛使用的训练方法和模型架构,如:教师学生模型(Teacher-Student Network),课程学习(Curriculum Learning),域随机化(Domain Randomization),混合专家模型(MoE)等; 4. 熟悉Mujoco、IsaacGym、IsaacLab等机器人仿真平台; 5. 具备足式机器人强化学习算法的实机调试和sim-to-real经验; 6. 扎实的C++、Python编程能力,熟悉Pytorch等机器学习框架,熟悉Linux,Git,ROS等开发环境和工具。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
小米集团
硬件
已上市
北京 上海 深圳 南京 武汉
查看其他 127 个职位