高频灵魂拷问(全是现场原题)
#面试官拷打AI项目都会问什么?#
总结如下:
文档为什么这么分片?分片大小、重叠度怎么定的?试过其他参数吗?
为什么用这个 Embedding 模型?换个召回率会降多少?
向量库为什么选 Milvus/Chroma/FAISS?各自适用场景区别?
只用向量检索够吗?有没有做关键词 + 语义混合检索?
有没有做 Reranker 重排序?不加会有什么问题?
怎么解决大模型幻觉?你项目里落地了哪些手段?
召回不准、答非所问、引用错误怎么处理?
增量文档怎么更新?向量库怎么维护、去重?
项目开发中最大的 3 个难点是什么?你怎么攻克的?
上线前遇到过什么诡异问题?怎么定位、怎么修复?
并发高了怎么办?接口响应慢怎么优化?
Token 成本太高,你做了哪些降本措施?
如果给你更多时间,你还能从哪 4 个维度优化?
总结如下:
文档为什么这么分片?分片大小、重叠度怎么定的?试过其他参数吗?
为什么用这个 Embedding 模型?换个召回率会降多少?
向量库为什么选 Milvus/Chroma/FAISS?各自适用场景区别?
只用向量检索够吗?有没有做关键词 + 语义混合检索?
有没有做 Reranker 重排序?不加会有什么问题?
怎么解决大模型幻觉?你项目里落地了哪些手段?
召回不准、答非所问、引用错误怎么处理?
增量文档怎么更新?向量库怎么维护、去重?
项目开发中最大的 3 个难点是什么?你怎么攻克的?
上线前遇到过什么诡异问题?怎么定位、怎么修复?
并发高了怎么办?接口响应慢怎么优化?
Token 成本太高,你做了哪些降本措施?
如果给你更多时间,你还能从哪 4 个维度优化?
全部评论
这个rag知识库分片相关的题还是第一次见
相关推荐
不知道怎么取名字_:其实感觉是他们想提高自己的存在感 点赞 评论 收藏
分享
