📍面试公司:华海智汇科技💻面试岗位:大模型应用开发工程师❓面试问题:1 Flash-Attention 原理细节描述。online-softmax 与GPU 通信次数。FlashAttention 为什么能做到onepass?2-RAG 流程。针对上下文多轮对话情况 如何对历史对话进行处理?同时 如何解决LLM 长度限制问题。能否在基座模型的基础上做扩充?3- Function call / Agent Tools / MCP / A2A 解释名词 原理 对比?4 最近论文阅读?更倾向算法还是开发工作?🙌面试感想:面试官说都挺符合的 但是他们没有坑位