纯cv想找多模态的实习,必须有论文才行吗
在实验室做的都是纯cv的检测识别之类的,计算资源也很少跑不了大模型。想去找多模态的实习,需要学习什么东西,有什么成果,准备到什么程度呢。
最近的话,先把vit,swin,mae这些vision transformer的东西巩固了一下,然后找了一些博客,把从CLIP开始到VLMo到BEiT,这些多模态大模型预训练的东西看了看。下周准备找个下游任务,多模态检测比如GLIP,还有VQA之类的,跑跑代码。这个方向的多模态实习好找吗
还是说大部分多模态大模型做的还是DALL E, SD那种生图的工作,可是GAN我都一点不懂,这个转起来感觉跨度太大了
最近的话,先把vit,swin,mae这些vision transformer的东西巩固了一下,然后找了一些博客,把从CLIP开始到VLMo到BEiT,这些多模态大模型预训练的东西看了看。下周准备找个下游任务,多模态检测比如GLIP,还有VQA之类的,跑跑代码。这个方向的多模态实习好找吗
还是说大部分多模态大模型做的还是DALL E, SD那种生图的工作,可是GAN我都一点不懂,这个转起来感觉跨度太大了
全部评论
实习可以没有论文,学校够硬就行
多模态大模型看下Blip2, LLaVA, CogVLM这些基础的常用的。
相关推荐

点赞 评论 收藏
分享

点赞 评论 收藏
分享
09-12 23:09
门头沟学院 嵌入式软件开发 小肥罗:此乃引蛇出洞之计,勾出你想去杭州的原因再告诉你不在杭州,让你打脸,自己离开。好一招抛砖引玉,虾仁猪心。你回复:计划去杭州,但我心中第一选择是宁波~巧了!
这计名叫“阿Q精神胜利法之厚脸皮不要脸我不尴尬谁爱尴尬谁尴尬去”之计!克制一切!
点赞 评论 收藏
分享