面试记录-a
📍面试公司:华海智汇科技
💻面试岗位:大模型应用开发工程师
❓面试问题:
1 Flash-Attention 原理细节描述。online-softmax 与GPU 通信次数。FlashAttention 为什么能做到onepass?
2-RAG 流程。针对上下文多轮对话情况 如何对历史对话进行处理?同时 如何解决LLM 长度限制问题。能否在基座模型的基础上做扩充?
3- Function call / Agent Tools / MCP / A2A 解释名词 原理 对比?
4 最近论文阅读?更倾向算法还是开发工作?
🙌面试感想:
面试官说都挺符合的 但是他们没有坑位
#面试问题记录#
💻面试岗位:大模型应用开发工程师
❓面试问题:
1 Flash-Attention 原理细节描述。online-softmax 与GPU 通信次数。FlashAttention 为什么能做到onepass?
2-RAG 流程。针对上下文多轮对话情况 如何对历史对话进行处理?同时 如何解决LLM 长度限制问题。能否在基座模型的基础上做扩充?
3- Function call / Agent Tools / MCP / A2A 解释名词 原理 对比?
4 最近论文阅读?更倾向算法还是开发工作?
🙌面试感想:
面试官说都挺符合的 但是他们没有坑位
#面试问题记录#
全部评论
没有手撕 attention 吗
相关推荐

点赞 评论 收藏
分享