大型视觉语言模型算法实习生

薪资面议
2025-05-27










岗位职责
- 探索视觉语言大模型在自动驾驶场景下的创新应用。
- 开发和优化场景理解和视觉推理模型,提高其在车端、座舱等场景的表现。
- 开发和优化场景理解和视觉推理模型,提高其在车端、座舱等场景的表现。
岗位要求
- 计算机、人工智能、数学等相关专业,本科及以上学历;
- 熟练掌握 Python/C++,具备扎实的编程能力和良好的工程化实践;
- 熟悉深度学习框架(如 PyTorch、TensorFlow),并有从零到一构建模型的经验;
- 具备较强的学习能力和独立钻研精神,能够快速掌握新技术并应用到实际问题中;
- 具有良好的团队合作精神和沟通能力,能够与不同背景的同事进行有效的合作。
加分项
- 有开放集目标检测(如Grounding-DINO)模型研究或应用经验;
- 有视觉-图像大模型的研究或应用经验
- 在机器学习/计算机视觉/自动驾驶 领域的顶级会议(如 NeurIPS、ICLR、CVPR、ICCV、ICRA)发表过论文;
- 具备高水平的算法竞赛背景(如 ACM/NOI/IOI);
- 熟练掌握 Python/C++,具备扎实的编程能力和良好的工程化实践;
- 熟悉深度学习框架(如 PyTorch、TensorFlow),并有从零到一构建模型的经验;
- 具备较强的学习能力和独立钻研精神,能够快速掌握新技术并应用到实际问题中;
- 具有良好的团队合作精神和沟通能力,能够与不同背景的同事进行有效的合作。
加分项
- 有开放集目标检测(如Grounding-DINO)模型研究或应用经验;
- 有视觉-图像大模型的研究或应用经验
- 在机器学习/计算机视觉/自动驾驶 领域的顶级会议(如 NeurIPS、ICLR、CVPR、ICCV、ICRA)发表过论文;
- 具备高水平的算法竞赛背景(如 ACM/NOI/IOI);