纯cv想找多模态的实习,必须有论文才行吗
在实验室做的都是纯cv的检测识别之类的,计算资源也很少跑不了大模型。想去找多模态的实习,需要学习什么东西,有什么成果,准备到什么程度呢。
最近的话,先把vit,swin,mae这些vision transformer的东西巩固了一下,然后找了一些博客,把从CLIP开始到VLMo到BEiT,这些多模态大模型预训练的东西看了看。下周准备找个下游任务,多模态检测比如GLIP,还有VQA之类的,跑跑代码。这个方向的多模态实习好找吗
还是说大部分多模态大模型做的还是DALL E, SD那种生图的工作,可是GAN我都一点不懂,这个转起来感觉跨度太大了
最近的话,先把vit,swin,mae这些vision transformer的东西巩固了一下,然后找了一些博客,把从CLIP开始到VLMo到BEiT,这些多模态大模型预训练的东西看了看。下周准备找个下游任务,多模态检测比如GLIP,还有VQA之类的,跑跑代码。这个方向的多模态实习好找吗
还是说大部分多模态大模型做的还是DALL E, SD那种生图的工作,可是GAN我都一点不懂,这个转起来感觉跨度太大了
全部评论
实习可以没有论文,学校够硬就行
多模态大模型看下Blip2, LLaVA, CogVLM这些基础的常用的。
相关推荐
2025-12-09 14:12
新乡学院 嵌入式软件开发
程序员花海:实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价 其中项目经历注意要体现业务 实习经历里面的业务更是要自圆其说 简历模板尽可能保持干净整洁 不要太花哨的 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看8道真题和解析