纯cv想找多模态的实习,必须有论文才行吗

在实验室做的都是纯cv的检测识别之类的,计算资源也很少跑不了大模型。想去找多模态的实习,需要学习什么东西,有什么成果,准备到什么程度呢。
最近的话,先把vit,swin,mae这些vision transformer的东西巩固了一下,然后找了一些博客,把从CLIP开始到VLMo到BEiT,这些多模态大模型预训练的东西看了看。下周准备找个下游任务,多模态检测比如GLIP,还有VQA之类的,跑跑代码。这个方向的多模态实习好找吗
还是说大部分多模态大模型做的还是DALL E, SD那种生图的工作,可是GAN我都一点不懂,这个转起来感觉跨度太大了
全部评论
实习可以没有论文,学校够硬就行
2 回复 分享
发布于 2024-01-01 16:19 浙江
多模态大模型看下Blip2, LLaVA, CogVLM这些基础的常用的。
点赞 回复 分享
发布于 2023-12-29 08:21 广东

相关推荐

06-23 11:28
门头沟学院 Java
牛客91966197...:也有可能是点拒绝的时候自动弹的话术
点赞 评论 收藏
分享
07-18 18:09
门头沟学院 Java
点赞 评论 收藏
分享
评论
3
18
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务