科大讯飞秋招多模态算法一面

一、项目介绍+没有手撕?
项目介绍完直接开始面,没写代码

二、八股
1.介绍下Transformer在NLP和CV中的使用区别
2.什么是 CLIP 模型?它是如何做跨模态对齐的?
3.BLIP-2 中 Q-Former 的作用是什么?为什么要加一个Query Transformer?
4.Contrastive Learning 的 InfoNCE Loss 公式是什么?直观上是怎么工作的?
5.在多模态预训练中,如何处理图像分辨率过高的问题?关键优化手段有哪些?
6.LoRA 微调在多模态大模型中的应用有何特别之处?
7.什么是多模态对齐?它和 RLHF 的关系是怎样的?
8.介绍一下 LLaVA 架构的核心原理和主要创新点
9.在视频问答(VideoQA)场景下,时间信息是如何建模的?常见方法有哪些?

三、项目
1.多模态问答系统如何处理OCR和物体检测信息?这些特征在模型中怎么融合?
追问:如果 OCR 提取结果错误,会影响问答准确率吗?你如何降低影响?
2.你的医学影像 + 病历文本项目(这个项目我没用大模型),数据标注成本高,如何缓解?
追问:有用到合成数据/数据增强方法吗?效果如何?
3.在 LLaVA 的基础上加入分辨率自适应编码器,主要优化的是哪部分的瓶颈?推理速度提升多少?
全部评论

相关推荐

只会按tab的bug...:高中:这个班高考人均985,我考不上985是不是很丢人啊? 考上985本: 班里人均保研985硕了,我保不上是不是很丢人啊? 985本硕:班里人均bat了,我进不去是不是很丢人啊?进了大厂:组里人均p8年薪200w,我拿不到是不是很丢人啊?拿了p8和200w: 身边人都买房买车结婚生子了,我还没买房是不是很丢人啊?你有没有发现,每当你达到下一个目标时,你身边的人必然都是和你同个层次同样优秀的人,如果你陷入这种不断的比较,你永远会不满足。事实就是,当你拿到一个阶段的成就的时候,你就已经超过很多人很厉害很优秀了,你是不需要下一个阶段的成功来证明自己的。
点赞 评论 收藏
分享
1.  你先做个简单的自我介绍吧。2.  Java常用的集合 ArrayList 和 LinkedList 的区别是什么?3.  (ArrayList/LinkedList)在查询、插入、删除使用上各自的区别呢?4.  Java中常用的 final 修饰符有哪些作用?5.  谈谈你对 IOC 和 AOP 的理解。6.  谈谈你对 Java 反射机制的理解,以及它的优点和缺点。7.  能介绍下线程池常用的七大参数吗?8.  一般设置核心线程数会从哪些因素去考虑?9.  介绍一下线程池的工作机制(任务提交后如何工作)?10. 核心线程执行完任务时会被销毁吗?11. 谈一下你对消息队列的理解,它主要有哪些作用?12. 介绍一下线程和进程的区别。13. 进程间通信和线程间通信各自有什么方式?14. 描述下数据库事务的四大特性(ACID)。15. 描述一下创建索引的一些原则。16. 你对全文索引、哈希索引和 B+ 树索引的理解是什么?它们各自的应用场景?17. 介绍一下 JVM 垃圾收集器的几种算法及其优缺点。18. (实习经历)能简单介绍一下你主要做什么?19. 你们在做的过程中有没有遇到什么比较棘手的问题?20. 你能简单介绍一下你们的审批流模块主要做了什么事情?21. (审批流)有涉及到多角色或组织架构吗?22. 你能介绍一下(另一份实习)的经历吗?23. 你最近有学习过什么新的技术和知识吗?24. 你之前提到的技术挑战赛,主要是做什么的?25. 你的数学建模(竞赛)主要是做了什么事情?26. 你对这两个竞赛有什么收获吗?27. 你看你有没有什么问题需要问的?
查看27道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务