【可转正】多模态大模型/端到端自动驾驶校园招聘/实习生招聘

一、团队介绍

高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张或地图,让出行和生活更美好!我们希望更多优秀的高校同学、社会人才加入我们,一起打造极致的算法和产品体验。

二、基本要求
面向应届毕业生、实习生(至少实习 6 个月)、社招。实习地点:北京,我们将提供有竞争力的工作薪酬和充足的训练资源。

三、职位描述
团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可:
1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。
2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。
3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。
4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。
5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。
6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

四、职位要求
1. 自然语言处理、计算机视觉、人工智能等相关专业的硕士生/博士生,对发文章有兴趣,具备良好的英文写作能力;
2. 发表过CV&AI顶会论文优先,ACM编程竞赛、数据建模竞赛等竞赛获奖优先。
3. 动手实现能力强,代码基本功扎实,精通基于Python的算法开发;熟练掌握pytorch/tensorflow/mxnet等至少一项深度学习框架。
4. 自驱力强、充满好奇心、团队合作、沟通能力佳。

简历请发suishou.zh@alibaba-inc.com
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务