博士算法实习生招聘（VLM/VLA）

薪资面议

算法工程师

不限

5天/周

最少3个月

有转正

张女士 3分钟前在线

深圳市道通智能航空技术股份有限公司·HR总监

反馈率：52% | 反馈时长：5天

岗位职责

1.前沿模型研究与创新：聚焦 VLM/VLA 核心技术突破，包括多模态对齐机制优化、视觉编码器适配（针对具身控制场景）、动作决策模块设计等，探索 WorldVLA 融合架构的技术路径； 2.模型训练与工程实现：基于 PyTorch/TensorFlow 框架，搭建大规模多模态数据集（视觉、文本、传感器数据）的训练 pipeline，运用微调、强化学习、分布式训练等技术提升模型性能与效率； 3.关键技术攻关：解决 VLA 模型在时空一致性、实车 / 机器人端实时运行、跨场景泛化等核心问题，优化模型量化、剪枝与推理加速方案； 4.学术成果转化：参与顶会论文（CVPR/NeurIPS/ICLR/CoRL 等）的研究设计与撰写，主导或核心参与开源项目开发，构建技术影响力； 5.跨领域协同创新：与自动驾驶、机器人团队协作，将 VLM/VLA 技术落地于感知、预测、规划等实际任务，构建多维度评估体系。

岗位要求

1. 硬性条件计算机科学、人工智能、机器人学、自动化等相关领域博士在读（优秀硕士需提供顶级会议 / 项目证明）；精通 Python 编程，熟练掌握 PyTorch/TensorFlow 等深度学习框架，了解 DeepSpeed/FSDP 分布式训练工具或 TensorRT 推理优化技术；深入理解 VLM/VLA 核心原理，熟悉多模态融合、跨模态对齐、模仿学习 / 强化学习等关键技术，有相关模型训练或微调经验；能保证 6 个月以上实习周期，每周稳定投入工作时间。 2. 加分项在 CVPR/NeurIPS/ICML/ICLR 等顶级会议发表过 VLM/VLA、多模态大模型相关论文（一作 / 共同一作优先）；有自动驾驶、机器人具身智能项目经验，熟悉 nuScenes/Waymo 等数据集或 ROS 系统者；参与过开源 VLM/VLA 项目（如 Qwen2.5VL、Paligemma），或有模型工程化落地、性能优化案例者；掌握 C++ 编程、传感器融合（LiDAR/Camera）、大模型压缩加速等技能者。

南山区智园B1栋8楼

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

深圳市道通智能航空技术股份有限公司

企业服务

B轮

深圳市

查看其他 2 个职位

0 笔试题目 0 面试经验 0 面试短评