【智元机器人】训练框架算法工程师-校招-实习-社招都要,组内直推,直接进面试流程
捞人捞人捞人!!!
岗位职责
训练框架研发与效率优化
- 设计与迭代具身智能训练研发框架,构建统一的训练、评测与真机实验全流程。
- 优化模型训练与推理性能,持续提升 GPU 集群利用效率与研发效率。
- 深入理解 VLA、IL、RL、模仿学习、自监督学习等核心算法,并基于算法特性进行系统级优化。
- 负责数据加载、分布式训练、在线真机强化学习等模块的性能瓶颈分析与优化。
- 参与自动化模型迭代体系建设(训练监控、日志采集、模型评估、可视化分析等)。
- 与算法团队紧密合作,将 算法需求工具化、模块化、可扩展化,推动端到端模型研发流程高效演进。
开源具身智能工具链建设
- 参与具身智能相关开源工具链的设计、研发与生态建设。
- 基于自研训练框架,支持社区开源模型的 训练、微调、算法复现与能力验证。
- 构建高可复现的训练与评测体系,沉淀行业标准化工具与最佳实践。
- 与外部开发者深度协作,共建具身智能方向的可持续开源生态。
职位要求
- 具备扎实的 Python/C++ 编程能力,熟悉底层实现原理,具备优秀的性能调优能力。
- 具有良好的工程意识、代码规范与系统化设计思维,能构建高可靠、高扩展性的训练组件。
- 熟悉主流深度学习框架(PyTorch / JAX / Transformers / DeepSpeed / Megatron 等),理解其内部机制与关键抽象。
- 对 强化学习(RL)、模仿学习(IL)、行为克隆(BC)、自监督学习(SSL)或多模态模型(VLA) 有理解或实战经验之一者优先。
- 熟练掌握 profiling、量化、蒸馏、混合并行、缓存优化等 模型训练与推理加速技术,能够基于算法与系统特性共同优化性能。
- 对训练框架有深入理解,具备从零到一 构建、优化、交付 系统的经验者优先。
- 熟悉分布式训练架构,包括数据并行、模型并行、流水线并行等,能够根据算法需求设计合适的并行策略。
加分项
- 有真机强化学习经验,或理解 sim2real 的挑战与解决思路。
- 熟悉 RoboSuite、ManiSkill、Isaac 等具身智能模拟器。
- 有大规模 GPU 集群训练经验,理解调度、吞吐、稳定性等系统级问题。
- 能阅读或复现机器学习/RL/VLA 顶会论文。
- 有模拟器或机器人相关项目经验。
- 对开源社区有兴趣,愿意参与具身智能开源工具链的建设。
