暑期阿里淘天AI应用研发一面 夯爆了版

继续来分享下最近的面经~欢迎友好讨论,信息共享
1. 实习拷打

2. 在RAG系统中,它一般的召回阶段的排序策略通常有哪些?如果一个用户在召回的时候,他的查询是一些长尾或者是语义模糊的关键词,你怎么去提升这个召回的准确率?

3. 召回排序的过程有几个阶段或几个层次?

4. 有哪些方式可以改写Query,为什么能够提升这个召回精准度?

5. RRF融合中,它的K参数一般取值是多少?大一点、小一点对结果有什么影响?

6. 在你的项目里面,实际召回中有遇到不准的情况吗?在你们这个提升准确率的过程中,你们去做了哪些事情去提升,怎么做?

7. 如果在查询中间,输入的一些极其模糊的表达,在实际工程中间要怎么去做呢?

8. 那如果要做这么一个AI,你具体怎么去提示他,怎么去做?遇到这种一次性说不清楚话的用户,那你这个agent怎么去解决这一类的问题?

9. 怎么去降低整个项目的一个幻觉?从数据、检索和生成这三个方面去阐述一下

10. Agent项目如何设计评测方案

11. 后端压测性能优化,如何定位问题

之后是两个场景题:
1. 假如需要你去设计一个电商客服agent的评测方案。这个agent主要有三类任务:商品咨询、售后咨询、还有投诉安抚。你需要去设计一个完整的评价系统,主要包括测评的维度指标,以及数据集的构成构建方案。然后如何区分这个agent到底是好还是坏,你怎么去设计?比如说我们就开发了一个这样的客服系统跑在线上,你总得有一些衡量的指标,你怎么去建这个衡量指标,怎么得出来这个agent是比较好的、比较提效的?比如说在安抚这个场景,用户的满意度是很难去衡量的,那你需要假如说让你设计一些指标,或选取一些指标去衡量用户是否满意,你觉得怎么去提取或者是设计这个指标?

2. 假如让你负责一个文本转SQL的模型训练集的构建,你只有500条真实标注样本,需要你去覆盖200多个查询模式(单表查询、多表连接、聚合查询等等),需要你设计一个完整的数据生产流,包括合成策略、怎么控制质量,以及怎么去迭代优化,你怎么去设计?

再之后是两道ai coding
全部评论

相关推荐

04-28 03:25
门头沟学院 Java
给我面没招了,发点面经攒攒人品~1.实习拷打2.论文拷打3.毕业是否有发表论文的要求?4.你自己有没有准备要发表论文?5.请详细聊一聊你的项目经历。你可以先讲一下"生活优选"这个项目是怎么做的。6.这个项目是基于某个开源项目做了二次开发,还是从零开始搭建的?7.请讲一下这个项目的整体架构是怎样的。8.你觉得这个项目中最有挑战性或者最难的地方是哪里?9.你这个服务是分布式的,还是单机部署的?10.你最初在MySQL中实现秒杀逻辑时,具体是用什么SQL语句来保证不超卖和一人一单的?11.为什么你认为MysqI不能保证原子性?12.如果使用update table set stock=stock-1wherestock>0,这个语句本身是原子性的,为什么你会觉得它无法防止超卖?13.你在Redis中是如何实现秒杀逻辑的?具体用了什么数据结构或脚本?14.既然你的系统是单机部署,为什么不在JVM内存中使用本地锁,而要去使用Redis增加额外的开销和复杂度?15.你之前面试过哪些公司或团队?是什么方向的?16.你这个项目是如何部署的?17.有没有尝试过部署到云服务器上?18.是否使用过Docker或Kubernetes等容器技术?你对此有什么了解?19.你在项目中使用了乐观锁和悲观锁来解决订单支付与关单的并发问题,请详细讲一下具体是如何实现的。20.悲观锁在数据库层面如何显式加锁?21.乐观锁和悲观锁分别适用于什么场景?有没有选择的原则?
点赞 评论 收藏
分享
评论
点赞
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务