美团LLM大模型日常实习一面
1.你们产品里真的用大模型了吗?怎么训的?从0开始还是微调?
2.LoRA 是什么?它的权重是怎么初始化的?为什么有效?
3.你们实验室做过哪些横向项目?有没有处理过文档目录结构解析?
4.多模态场景下,怎么让模型理解图表(比如柱状图、表格)?
5.RAG 你们怎么优化的?chunk size / overlap 怎么设?有没有加 rerank?
6.SFT 阶段用了多少卡?训练时长多久?数据量级是多少?
7.预训练 loss 用的什么?怎么评估模型效果?(我当时答不会…)
8.有了解 Perplexity(PPL)吗?它和 loss 有什么关系?
9.长文档 PDF 处理,你们用了哪些长上下文扩展技术?
10.Vision Encoder 的 loss 怎么设计的?CLIP 之后有哪些新进展?
11.手撕:接雨水(LeetCode 42)
2.LoRA 是什么?它的权重是怎么初始化的?为什么有效?
3.你们实验室做过哪些横向项目?有没有处理过文档目录结构解析?
4.多模态场景下,怎么让模型理解图表(比如柱状图、表格)?
5.RAG 你们怎么优化的?chunk size / overlap 怎么设?有没有加 rerank?
6.SFT 阶段用了多少卡?训练时长多久?数据量级是多少?
7.预训练 loss 用的什么?怎么评估模型效果?(我当时答不会…)
8.有了解 Perplexity(PPL)吗?它和 loss 有什么关系?
9.长文档 PDF 处理,你们用了哪些长上下文扩展技术?
10.Vision Encoder 的 loss 怎么设计的?CLIP 之后有哪些新进展?
11.手撕:接雨水(LeetCode 42)
全部评论
多模态场景下,怎么让模型理解图表咋回答的
相关推荐
点赞 评论 收藏
分享
昨天 22:50
北京工业大学 Java 本人之前有一段一个月的水实习,也没有涉及到具体的工作内容,可以编写一些项目经历写在简历里么?应该如何包装呢?想在年后3月左右找一份日常实习。同时,有没有大佬帮我看看上一条帖子哇哇哇,求助求助!感激不尽
点赞 评论 收藏
分享