字节豆包大模型面经
1️⃣一面:
1.自我介绍
2.选一个做的好的实习或者论文讲一下
3.了解 RAG 吗, GraphRAG 的做法
4.讲一下 FlashAttention 的思想和做法
5.讲一下 RoPE ,目前常用的位置编码还有哪些, Ro PE 有什么优点
6.场景题:如果要提升大模型的多轮对话能力,你有哪些可以改进的点
7.代码题:56.合并区间
2️⃣二面:
1.自我介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
3️⃣三面:
1.自我介绍,过实习和论文
2.了解 Qwen 的结构吗,微调的数据配比是怎样的
3.大模型的灾难性遗忘问题怎么解决
4.了解 KV cache 吗, GQA 的思想是什么
5.场景题:目前有一些专业领域知识(如医疗知识或者法律条文),准备做个智能助手,如何搭建一个 RAG 链路
6.开放题:用过豆包吗,觉得目前豆包还存在什么问题
7.代码:416.分割等和子集
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
1.自我介绍
2.选一个做的好的实习或者论文讲一下
3.了解 RAG 吗, GraphRAG 的做法
4.讲一下 FlashAttention 的思想和做法
5.讲一下 RoPE ,目前常用的位置编码还有哪些, Ro PE 有什么优点
6.场景题:如果要提升大模型的多轮对话能力,你有哪些可以改进的点
7.代码题:56.合并区间
2️⃣二面:
1.自我介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
3️⃣三面:
1.自我介绍,过实习和论文
2.了解 Qwen 的结构吗,微调的数据配比是怎样的
3.大模型的灾难性遗忘问题怎么解决
4.了解 KV cache 吗, GQA 的思想是什么
5.场景题:目前有一些专业领域知识(如医疗知识或者法律条文),准备做个智能助手,如何搭建一个 RAG 链路
6.开放题:用过豆包吗,觉得目前豆包还存在什么问题
7.代码:416.分割等和子集
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
查看13道真题和解析