视觉算法实习生招聘 多模态 南京/成都
计算机视觉算法实习生
岗位描述:
1. 学历与专业背景:拥有研究生及以上学历,专业为计算机科学、数学、人工智能等相关领域,具备扎实的理论知识基础。 2. 技术技能要求:熟练掌握 Python 编程语言,能够运用其高效完成各类编程任务;熟悉 Linux 操作系统,能够在该环境下进行开发和部署工作;了解 C++ 语言,具备基本的代码阅读和理解能力;熟悉 CUDA/CANN 技术,能够进行相关的并行计算和优化;深入了解英伟达和华为人工智能技术栈,能够灵活运用其技术优势。同时,养成良好的编程习惯,注重代码质量和可维护性。 3. 计算机视觉与深度学习能力:深刻掌握计算机视觉的基础理论和算法,如特征提取、目标检测、图像分割等;熟练使用训练框架,如 PyTorch、TensorFlow 等,能够快速搭建深度学习模型并进行训练;熟悉模型调优过程中遇到的各种问题及解决方法,如过拟合、欠拟合、梯度消失等,能够通过有效的策略进行优化。 4. 模型与技术理解:对卷积神经网络(CNN)和常见图像处理技术有深入理解,熟悉 CNN 的结构和原理,能够根据实际需求进行模型设计和改进,并在实际项目中成功应用;熟悉常用的分类模型,如 ResNet、ResNext、DenseNet、MobileNet、CSPNet 等,了解其优缺点和适用场景;熟悉常用的 anchor-based 和 anchor-free 检测模型,如 YOLO 系列、DETR 系列,能够根据项目需求选择合适的模型并进行定制化开发。 5. 前沿技术与模型经验:熟悉 ViT、SwimTranformer 等 Transform 结构,了解其在计算机视觉领域的应用;有 CLIP 使用经验者优先,能够运用 CLIP 进行图像和文本的联合学习;熟悉 GroundingDINO、YOLO-World 等万物检测模型,有多模态等实际项目经验者优先,能够将多模态技术应用于实际项目中,提升项目的智能化水平。 6. 多模态模型知识:了解 BLIP-2、VisualBERT、LXMERT、Oscar 等多模态模型者优先,具备将多模态信息融合的能力,能够在多模态数据分析和处理方面发挥优势。 7. 成果与能力加分:在 CV 类深度学习模型优化工作中做出突出成果者优先,如在模型精度、速度、内存占用等方面有显著提升;具备良好的文档化写作能力,能够清晰、准确地记录项目过程和技术细节;具备出色的计划跟踪和沟通能力,能够有效地协调团队成员,推进项目顺利进行;具备良好的英语读写能力者优先,能够及时了解国际前沿技术动态。
公司:南京奥看信息科技
base:南京/成都
薪资:300/天,优秀另谈
时长:三个月以上
欢迎投递简历:**********,或私信联系