腾讯大模型算法岗面经
1.自我介绍及项目经历
2.如何增强模型的多轮对话能力?
3.介绍MoE (混合专家)架构核心优势。
4.阐述大模型训练与推理的完整流程。
5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。
6.FlashAttention v1 和 v2 的主要改进点分别是什么?
7.CoT(Chain-of-Thought)训练数据是如何构造的?
8.当前主流的强化学习算法有哪些?
9.代码:LeetCode 22,实现“括号生成”问题。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
#互联网大厂# 大模型 #面经# 人工智能就业 #校
2.如何增强模型的多轮对话能力?
3.介绍MoE (混合专家)架构核心优势。
4.阐述大模型训练与推理的完整流程。
5. 对比 LORA 微调 Qwen 模型两种微调方式的性能表现。
6.FlashAttention v1 和 v2 的主要改进点分别是什么?
7.CoT(Chain-of-Thought)训练数据是如何构造的?
8.当前主流的强化学习算法有哪些?
9.代码:LeetCode 22,实现“括号生成”问题。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
#互联网大厂# 大模型 #面经# 人工智能就业 #校
全部评论
标记
相关推荐
查看2道真题和解析 点赞 评论 收藏
分享
等闲_:业务开发就是prompt+数据,Ai就是中间件,中台或者鸡架会做一些Agentic infra和智能体记忆之类的,再底层一点就是AI infra,MLops,模型微调,推理优化之类的了,所以对于普通后端就是纯业务,没啥技术含量,除非去技术架构组或者底层一点的组,要不AI就是个API,别神话AI应用开发 点赞 评论 收藏
分享
