腾讯大模型算法一面-校招面经
1.自我介绍及项目经历
2.如何增强模型的多轮对话能力?
3.介绍MoE (混合专家)架构核心优势。
4.阐述大模型训练与推理的完整流程。
5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。
6.FlashAttention v1 和 v2 的主要改进点分别是什么?
7.CoT(Chain-of-Thought)训练数据是如何构造的?
8.当前主流的强化学习算法有哪些?
9.代码:LeetCode 22,实现“括号生成”问题
2.如何增强模型的多轮对话能力?
3.介绍MoE (混合专家)架构核心优势。
4.阐述大模型训练与推理的完整流程。
5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。
6.FlashAttention v1 和 v2 的主要改进点分别是什么?
7.CoT(Chain-of-Thought)训练数据是如何构造的?
8.当前主流的强化学习算法有哪些?
9.代码:LeetCode 22,实现“括号生成”问题
全部评论
相关推荐
冷艳的柠檬精要暴富:二面怎么还问了这么多八股,还手写sql。还有代码题


查看16道真题和解析 点赞 评论 收藏
分享
查看2道真题和解析 点赞 评论 收藏
分享
