工程架构与细节(AI面试题)
#面试官拷打AI项目都会问什么?#
RAG相关:“你的向量检索召回率低怎么办?有没有做混合检索(BM25+向量)?重排序(Rerank)模型选的什么?为什么?”
上下文管理:“长文本处理时,你的上下文窗口不够了怎么截断?摘要策略是什么?”
并发与延迟:“流式输出的首字延迟(TTFT)怎么优化的?如果并发量上来,你的显存占用怎么控制?”
面试官心理:想知道你对数据清洗、向量数据库、Prompt工程迭代这些脏活累活有没有经验。
避坑指南:准备好具体的参数细节。比如:“我对比了BGE和M3E模型,发现M3E在中文短文本上表现更好,所以选用了它。”
RAG相关:“你的向量检索召回率低怎么办?有没有做混合检索(BM25+向量)?重排序(Rerank)模型选的什么?为什么?”
上下文管理:“长文本处理时,你的上下文窗口不够了怎么截断?摘要策略是什么?”
并发与延迟:“流式输出的首字延迟(TTFT)怎么优化的?如果并发量上来,你的显存占用怎么控制?”
面试官心理:想知道你对数据清洗、向量数据库、Prompt工程迭代这些脏活累活有没有经验。
避坑指南:准备好具体的参数细节。比如:“我对比了BGE和M3E模型,发现M3E在中文短文本上表现更好,所以选用了它。”
全部评论
相关推荐

查看14道真题和解析