博士算法实习生招聘(VLM/VLA)
薪资面议
算法工程师 深圳 不限 5天/周 最少3个月 有转正

岗位职责
1.前沿模型研究与创新:聚焦 VLM/VLA 核心技术突破,包括多模态对齐机制优化、视觉编码器适配(针对具身控制场景)、动作决策模块设计等,探索 WorldVLA 融合架构的技术路径;
2.模型训练与工程实现:基于 PyTorch/TensorFlow 框架,搭建大规模多模态数据集(视觉、文本、传感器数据)的训练 pipeline,运用微调、强化学习、分布式训练等技术提升模型性能与效率;
3.关键技术攻关:解决 VLA 模型在时空一致性、实车 / 机器人端实时运行、跨场景泛化等核心问题,优化模型量化、剪枝与推理加速方案;
4.学术成果转化:参与顶会论文(CVPR/NeurIPS/ICLR/CoRL 等)的研究设计与撰写,主导或核心参与开源项目开发,构建技术影响力;
5.跨领域协同创新:与自动驾驶、机器人团队协作,将 VLM/VLA 技术落地于感知、预测、规划等实际任务,构建多维度评估体系。
岗位要求
1. 硬性条件
计算机科学、人工智能、机器人学、自动化等相关领域博士在读(优秀硕士需提供顶级会议 / 项目证明);
精通 Python 编程,熟练掌握 PyTorch/TensorFlow 等深度学习框架,了解 DeepSpeed/FSDP 分布式训练工具或 TensorRT 推理优化技术;
深入理解 VLM/VLA 核心原理,熟悉多模态融合、跨模态对齐、模仿学习 / 强化学习等关键技术,有相关模型训练或微调经验;
能保证 6 个月以上实习周期,每周稳定投入工作时间。
2. 加分项
在 CVPR/NeurIPS/ICML/ICLR 等顶级会议发表过 VLM/VLA、多模态大模型相关论文(一作 / 共同一作优先);
有自动驾驶、机器人具身智能项目经验,熟悉 nuScenes/Waymo 等数据集或 ROS 系统者;
参与过开源 VLM/VLA 项目(如 Qwen2.5VL、Paligemma),或有模型工程化落地、性能优化案例者;
掌握 C++ 编程、传感器融合(LiDAR/Camera)、大模型压缩加速等技能者。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报