阿里千问算法实习一面-多模态
继续来分享下之前的面经~欢迎友好讨论,信息共享
1.项目细节深挖
2.除了caption数据,为什么还要做一些VQA、reasoning、summary数据呢?
3.解释为什么VQA、conversation、reasoning数据可能会提升模型效果
4.当时的消融实验是完全消融吗?具体怎么做的?
5.你的关键帧是怎么做的?
6.技术报告看过吗:glm-4.1V,qwen3-vl,mimo-vl,kimi-vl,seed-1.5-vl
7.你有仔细去看现在主流的VLM是怎么去洗数据,或者是怎么构造整套pipeline吧
8.假如说你参与到这个进程中,你怎么看待接下来的趋势,或者说你拿到一个STEM任务类型,你会怎么去做,你觉得现在技术报告里的缺点在哪里,你有什么想法吗?
9.使用VLM-as-judge做整套的数据清洗pipeline,从合成、清洗、过滤、验证、合并,这块有了解吗
1.项目细节深挖
2.除了caption数据,为什么还要做一些VQA、reasoning、summary数据呢?
3.解释为什么VQA、conversation、reasoning数据可能会提升模型效果
4.当时的消融实验是完全消融吗?具体怎么做的?
5.你的关键帧是怎么做的?
6.技术报告看过吗:glm-4.1V,qwen3-vl,mimo-vl,kimi-vl,seed-1.5-vl
7.你有仔细去看现在主流的VLM是怎么去洗数据,或者是怎么构造整套pipeline吧
8.假如说你参与到这个进程中,你怎么看待接下来的趋势,或者说你拿到一个STEM任务类型,你会怎么去做,你觉得现在技术报告里的缺点在哪里,你有什么想法吗?
9.使用VLM-as-judge做整套的数据清洗pipeline,从合成、清洗、过滤、验证、合并,这块有了解吗
全部评论
相关推荐
03-05 22:34
河南工程学院 C++ 点赞 评论 收藏
分享