暑期阿里淘天AI应用研发一面 夯爆了版

继续来分享下最近的面经~欢迎友好讨论,信息共享
1. 实习拷打

2. 在RAG系统中,它一般的召回阶段的排序策略通常有哪些?如果一个用户在召回的时候,他的查询是一些长尾或者是语义模糊的关键词,你怎么去提升这个召回的准确率?

3. 召回排序的过程有几个阶段或几个层次?

4. 有哪些方式可以改写Query,为什么能够提升这个召回精准度?

5. RRF融合中,它的K参数一般取值是多少?大一点、小一点对结果有什么影响?

6. 在你的项目里面,实际召回中有遇到不准的情况吗?在你们这个提升准确率的过程中,你们去做了哪些事情去提升,怎么做?

7. 如果在查询中间,输入的一些极其模糊的表达,在实际工程中间要怎么去做呢?

8. 那如果要做这么一个AI,你具体怎么去提示他,怎么去做?遇到这种一次性说不清楚话的用户,那你这个agent怎么去解决这一类的问题?

9. 怎么去降低整个项目的一个幻觉?从数据、检索和生成这三个方面去阐述一下

10. Agent项目如何设计评测方案

11. 后端压测性能优化,如何定位问题

之后是两个场景题:
1. 假如需要你去设计一个电商客服agent的评测方案。这个agent主要有三类任务:商品咨询、售后咨询、还有投诉安抚。你需要去设计一个完整的评价系统,主要包括测评的维度指标,以及数据集的构成构建方案。然后如何区分这个agent到底是好还是坏,你怎么去设计?比如说我们就开发了一个这样的客服系统跑在线上,你总得有一些衡量的指标,你怎么去建这个衡量指标,怎么得出来这个agent是比较好的、比较提效的?比如说在安抚这个场景,用户的满意度是很难去衡量的,那你需要假如说让你设计一些指标,或选取一些指标去衡量用户是否满意,你觉得怎么去提取或者是设计这个指标?

2. 假如让你负责一个文本转SQL的模型训练集的构建,你只有500条真实标注样本,需要你去覆盖200多个查询模式(单表查询、多表连接、聚合查询等等),需要你设计一个完整的数据生产流,包括合成策略、怎么控制质量,以及怎么去迭代优化,你怎么去设计?

再之后是两道ai coding
全部评论

相关推荐

04-30 17:49
门头沟学院 Java
招银网络科技 后端 烂白菜 n×12 硕士211
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务