AI面试问题分享

#AI面试问题分享#
1、Transformer 为什么能替代 RNN?自注意力机制的核心作用是什么?
2、请解释一下 QKV 的计算过程,以及为什么要除以 sqrt(dk)。
3、BERT 和 GPT 的区别是什么?各自更适合哪些任务?
4、训练大模型时,过拟合一般怎么处理?常见优化手段有哪些?
5、微调、LoRA、Prompt Engineering 分别适用于什么场景?
6、什么是幻觉问题?在实际业务里可以怎么缓解?
7、RAG 的基本流程是什么?它和直接微调模型相比有什么优缺点?
8、如果让你设计一个智能问答系统,你会怎么做模型选型、知识库检索和效果评估?
全部评论

相关推荐

头像
03-17 09:55
绥化学院 Java
首先理清头绪,三个问题:用户是谁?他们要解决什么问题?我手里有什么资源?第一步,分析并理清分层逻辑。用户进来第一句话,我得先判断这人是来干嘛的。是来骂人的?是来问路的?还是来调戏机器人的?我会用一个轻量级的分类模型(比如BERT微调)快速识别意图。如果是骂人、涉政、或者明显想搞事情,直接转人工或者礼貌结束对话。别让模型跟用户对骂,那是灾难。第二步,高频回答。大多数用户问的都是重复问题:退货政策、物流查询、改地址。这一层我用RAG,把知识库里的标准答案检索出来生成回复。要求是快、准、稳,温度设到0.1,不要有任何创造性,照着文档念就行。第三步,多轮任务。如果用户说“我要退货”,这就不是一问一答能解决的了。需要进入一个状态机:先问订单号,再查订单状态,确认是否在退货期内,然后生成退货地址,最后通知仓库。这一层我会上Agent,让它调用后端的API,每一步都向用户确认,走完整个流程。第四步,转人工。这是最重要的安全网。当模型连续两次不确定、用户情绪检测为负面、或者用户明确说“我要找人工”时,必须无缝转接,并且把对话摘要一起带过去,让人工客服不用重复问一遍。难点一,多轮对话的“失忆症”用户:我的订单怎么还没到?客服:请问您的订单号是多少?用户:123456客服:好的,查询到您的订单已发货,预计明天到达。用户:那它多少钱?这个“它”指的是什么?是订单总价?还是运费?还是某个商品的价格?模型如果忘了上文,就会乱猜。我们尝试了两种方法:一是显式维护上下文状态,把每轮的关键实体(订单号、商品名、价格)抽出来存着;二是在查询改写时,把“它”替换成上一轮提到的实体。但有个坑:如果上一轮提到了多个实体,改哪个?这时候需要模型判断指代的是什么。多轮对话做到最后,你会发现它其实是半个“推理问题”。难点二,情绪的“温度计”用户明显已经生气了,但模型还在机械地回复“请问还有什么可以帮您”。用户直接炸了,发了一长串感叹号。加了一个情绪识别模块,实时分析用户输入的情感分数。一旦低于某个阈值(比如负面情绪强烈),立刻触发两个动作:第一,回复语气变得特别客气(“非常抱歉给您带来不便…”);第二,如果用户持续负面,直接转人工。客服的第一原则不是解决问题,而是安抚情绪。 情绪没稳住,问题解决了用户也不满意。不能指望一个模型解决所有问题。要设计的是一个系统,让模型、规则、API、人工各司其职。用户不会因为是AI就降低要求,他们只在乎“我的问题解决了吗”、“我等了多久”、“你态度好不好”。
面试官最爱问的 AI 问...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务