多模态视觉模型实习生(VLM数据挖掘方向)

200-260元/天
数据挖掘
上海
硕士
5天/周
最少6个月
岗位关键词
岗位职责
1、多模态数据挖掘与优化 (1)调研前沿多模态算法,探索其在低成本自动化数据标注方案以及自动驾驶长尾场景中的应用潜力 (2)参与自动驾驶场景下的真实多模态数据(图像、视频、激光雷达、文本描述)的清洗、标注与特征提取,构建适配视觉语言模型的高质量训练数据集。 2、VLM算法开发与调优 (1)基于真实驾驶数据针对自动驾驶感知任务进行多模态数据利用方式及训练方法的探索,解决使用VLM业务场景落地方面的技术及工程问题 (2)开发多模态数据融合策略,研究时序视频数据、空间信息以及文本语义的联合建模方法
岗位要求
1、教育背景:计算机科学、电子工程、应用数学、人工智能等相关专业硕士/博士在读,具备扎实的深度学习基础 2、技术能力 (1)熟练使用Python,掌握PyTorch/TensorFlow框架,精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识 (2)熟悉常用多模态模型架构,理解Transformer、扩散模型的核心原理,了解大模型预训练算法 (3)具有良好的编程习惯及分析解决问题的能力 加分项 1、善于运用AI工具提效,分析和处理问题 2、有自动驾驶数据集处理经验,或参与过VLM和LLM预训练和分布式训练实际项目经验 3、在CVPR/ICCV/ECCV/NeurIPS等顶会发表多模态相关论文,或开源社区活跃贡献者"
嘉定区
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
智驾大陆
互联网
未融资
上海市
查看其他 0 个职位