Ai Agent、ai应用开发面经面试题2

一些自己在网上搜刮的面经题目路过的牛爷爷可以试着答一答,附上自己的答案,如果有更好的答案也可以拷打我,如果有别的比较好的题目也可以评论里发一发。

如何评估 RAG 效果?指标是什么?

分层评估:

  1. 检索质量评估:看如HitRate(命中率),Recall(召回率)等指标
  2. 生成质量评估:看如相关性(是否切题)、忠诚度(生成是否基于检索内容生成)、完整性(生成答案是否完整)
  3. 用户满意度测评:答案是否满意,检索速度够不够块。

RAG 和微调怎么取舍?

RAG适合更新频率高,存在隐私数据以及需要可解性性要求高需要稳定输出的场景。

微调适合需要特定规则以及语气的使用场景。

这两个技术在大部分场景下都不是互斥的,一般一个成熟的系统需要结合使用

多路召回怎么做?

多路召回的目的是解决某一种检索方式的缺陷。

比如向量检索对于专有名词,精确匹配方面逊色。在实际应用中可以结合如BM25或倒排索引做多路召回,

具体怎么做多路召回要看实际使用场景做调整。

如何降低 RAG 的延迟?

  1. 缓存机制:将使用率高的项放入缓存,命中直接召回。
  2. HNSW索引:将原本的索引换成HNSW。
  3. 减少TOP-K:减少TOP-K的数量。
  4. 向量维度:减少向量维度。

如何解决幻觉问题?

  1. Prompt优化:提示词中强制要求不许捏造事实,并且允许模型在不知道的情况下拒绝回复。
  2. RAG:使用检索增强生成技术
  3. 模型优化:调低Temperature、top-p、top-k等参数

如何让模型输出稳定格式?

  1. 结构化生成:大部分模型原生支持结构化输出。
  2. prompt优化:使用提示词强制约束格式、以及加入few-shot。
  3. 模型微调:使用特定格式的数据训练微调模型。
  4. 生成后检验:生成后进行检验如果不是所需格式进行重新生成。

LLM 调用很慢怎么办?

  1. 加入缓存:命中直接返回,或者以一个模型做检验然后返回
  2. 减少token输入:优化prompt、做输出约束等。
  3. 模型优化:使用更轻量的模型、量化、蒸馏等。

如何做缓存?

使用LRU(最近最少使用淘汰)+TTL(固定时间淘汰)兼顾热度于时效。

返回分两步首先精确匹配、如没匹配到进行语义匹配,被精确匹配的直接返回,语义匹配的返回前再一次经过模型做一次检验

#我的求职进度条##牛客解忧铺#
全部评论
大佬 考虑我司不 考虑的话可以看我主页帖子
点赞 回复 分享
发布于 05-26 19:56 陕西
大佬面试多吗?
点赞 回复 分享
发布于 05-25 22:59 广东

相关推荐

不愿透露姓名的神秘牛友
05-26 15:37
1、这群人晚上 11 点发朋友圈:"凌晨 11 点,三环的灯还亮着。" 实际下班时间:19:30。2、什么是嘉豪呀?我最近在字节实习,没什么时间上网3、同龄人:学校社团、酒吧蹦迪;我:acm、字节/腾讯实习4、别人朋友圈发:“今天不想上课”;我朋友圈发:“今天的班就上到这里啦”,定位:字节跳动5、别人的朋友圈都是到处旅游的定位,我的朋友圈天天都是“字节定位”,还一定要是在【公司的健身房】里拍张照片,实际只练了10分钟,其中凹造型5分钟6、mentor布置任务的时候,别人都是:”好的收到“,我:”是不是要xxxx,xxxx这么做也可以吧,这个技术方案会不会更好些“7、别人书包里装的:王道408、轻薄本、四六级真题。我书包里面装的:显存24GB4090独显gpu(24小时开机运行,屏幕上贴着“字节/腾讯等贴纸”)、速效救心丸(代码报错用)、电棍(熬夜写代码困了用),就很……你们懂吧8、入职大厂第一件事:发朋友圈、发小红书,晒工牌,985计算机硕|字节实习生|可以接咨询|有偿改简历,9、别人的社交软件简介:25岁|男|希望遇见有趣的灵魂;嘉豪的社交软件简介:25岁|程序员|字节跳动工程师|一张佩戴工牌的自拍照大厂嘉豪标配:1. 挂胸前的工牌(地铁里只挂不收,怕你看不见 logo)2. 降噪耳机(不放音乐也戴着,避免别人跟自己说话)3. 印 logo 的电脑包(字节红 / 腾讯蓝 / 阿里橙 / 美团黄)4. 手表(最好显示心率,午饭后必发"步数已破 6,000")
牛客30247842...:因为不好进啊要是大厂随便进哪来这么多人装逼
点赞 评论 收藏
分享
评论
2
27
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务