04-30 05:20 门头沟学院 Java

关注

暑期阿里淘天AI应用研发一面夯爆了版

继续来分享下最近的面经~欢迎友好讨论，信息共享
1. 实习拷打

2. 在RAG系统中，它一般的召回阶段的排序策略通常有哪些？如果一个用户在召回的时候，他的查询是一些长尾或者是语义模糊的关键词，你怎么去提升这个召回的准确率？

3. 召回排序的过程有几个阶段或几个层次？

4. 有哪些方式可以改写Query，为什么能够提升这个召回精准度？

5. RRF融合中，它的K参数一般取值是多少？大一点、小一点对结果有什么影响？

6. 在你的项目里面，实际召回中有遇到不准的情况吗？在你们这个提升准确率的过程中，你们去做了哪些事情去提升，怎么做？

7. 如果在查询中间，输入的一些极其模糊的表达，在实际工程中间要怎么去做呢？

8. 那如果要做这么一个AI，你具体怎么去提示他，怎么去做？遇到这种一次性说不清楚话的用户，那你这个agent怎么去解决这一类的问题？

9. 怎么去降低整个项目的一个幻觉？从数据、检索和生成这三个方面去阐述一下

10. Agent项目如何设计评测方案

11. 后端压测性能优化，如何定位问题

之后是两个场景题：
1. 假如需要你去设计一个电商客服agent的评测方案。这个agent主要有三类任务：商品咨询、售后咨询、还有投诉安抚。你需要去设计一个完整的评价系统，主要包括测评的维度指标，以及数据集的构成构建方案。然后如何区分这个agent到底是好还是坏，你怎么去设计？比如说我们就开发了一个这样的客服系统跑在线上，你总得有一些衡量的指标，你怎么去建这个衡量指标，怎么得出来这个agent是比较好的、比较提效的？比如说在安抚这个场景，用户的满意度是很难去衡量的，那你需要假如说让你设计一些指标，或选取一些指标去衡量用户是否满意，你觉得怎么去提取或者是设计这个指标？

2. 假如让你负责一个文本转SQL的模型训练集的构建，你只有500条真实标注样本，需要你去覆盖200多个查询模式（单表查询、多表连接、聚合查询等等），需要你设计一个完整的数据生产流，包括合成策略、怎么控制质量，以及怎么去迭代优化，你怎么去设计？

再之后是两道ai coding

全部评论

推荐最新楼层

04-25 16:08

广西大学算法工程师

阿里 AI 应用开发暑期一面秒挂

1. 自我介绍2. 项目里怎么做意图识别，如何理解用户真正要解决的问题意图识别不是简单做文本分类，而是把用户输入转换成系统能执行的任务。比如用户问“这个供应商最近还能不能继续合作”，表面上是一个问答，实际上可能需要查询供应商资质、历史履约、黑名单、逾期付款、合同违约记录和采购金额变化。这里要识别的不只是意图标签，还包括业务对象、时间范围、风险类型和是否需要调用工具。工程上我会分成三层。第一层是规则和实体识别，先提取合同编号、供应商名称、采购单号、金额、日期这类强结构化槽位。第二层是模型意图分类，判断是合同审查、条款解释、供应商风险、付款异常还是流程咨询。第三层是置信度和兜底，如果置信度低，就让...

AI-Agent面试实战...

点赞评论收藏

分享

04-28 03:25

门头沟学院 Java

阿里云AI应用研发面经分享-实习

给我面没招了，发点面经攒攒人品～1.实习拷打2.论文拷打3.毕业是否有发表论文的要求?4.你自己有没有准备要发表论文?5.请详细聊一聊你的项目经历。你可以先讲一下"生活优选"这个项目是怎么做的。6.这个项目是基于某个开源项目做了二次开发，还是从零开始搭建的?7.请讲一下这个项目的整体架构是怎样的。8.你觉得这个项目中最有挑战性或者最难的地方是哪里?9.你这个服务是分布式的，还是单机部署的?10.你最初在MySQL中实现秒杀逻辑时，具体是用什么SQL语句来保证不超卖和一人一单的?11.为什么你认为MysqI不能保证原子性?12.如果使用update table set stock=stock-1wherestock>0，这个语句本身是原子性的，为什么你会觉得它无法防止超卖?13.你在Redis中是如何实现秒杀逻辑的?具体用了什么数据结构或脚本?14.既然你的系统是单机部署，为什么不在JVM内存中使用本地锁，而要去使用Redis增加额外的开销和复杂度?15.你之前面试过哪些公司或团队?是什么方向的?16.你这个项目是如何部署的?17.有没有尝试过部署到云服务器上?18.是否使用过Docker或Kubernetes等容器技术?你对此有什么了解?19.你在项目中使用了乐观锁和悲观锁来解决订单支付与关单的并发问题，请详细讲一下具体是如何实现的。20.悲观锁在数据库层面如何显式加锁?21.乐观锁和悲观锁分别适用于什么场景?有没有选择的原则?

点赞评论收藏

分享

05-06 18:39

中国科学院大学自然语言处理

阿里国际 | AI应用研发工程师 | 商品智能 | 暑期实习一面

面试时间： 5.21技术栈： Agent、Java、Python、Node、SQL、前端面试题目1.自我介绍2.新闻数据来源、数量规模如何存储，数据库表如何设计的，存哪些字段数据来源：RSS 订阅、爬虫抓取、第三方 API（如 NewsAPI）。存储规模达百万级时采用分库分表或时序分区。表设计核心字段：id、title、content、source、publish_time、category、embedding_vector（外链向量库）、create_time。按发布时间做范围分区，热数据放近期分区加速查询。3.新闻向量数据库如何分区？文本编码方式，新闻词嵌入，如何召回，编码方式和召回方式如...

查看7道真题和解析

点赞评论收藏

分享

04-28 07:00

门头沟学院 Java

阿里淘天AI应用开发二面分享 1h

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1. 实习拷打2. 调用openai的接口，背后协议是怎样的一个workflow3. 项目拷打4. code: n个人站成一排，从左到右编号1-n，每次随机淘汰一个奇数位置上的人，淘汰完之后右边的人左移，（淘汰49之后，50变49，51变50），99轮之后，只剩的最后一个人获胜，问: 假如你参加这个游戏，站在哪个位置可以让你的赢面最大5. 模型基座怎么训的了解吗6. 场景题: 根据名字预测性别，方案和需要的数据量7. 讲一下ppo，dpo，grpo，以及rl到底在优化什么东西8. 讲一下持续学习的概念吧，业界持续学习大概有哪几种方法9. 讲解一下这篇论文

查看7道真题和解析

点赞评论收藏

分享

04-21 09:35

门头沟学院 Java

空洞废话不如量化数据

家人们谁懂啊！发现90%的人，根本不会在简历上体现AI能力。写的全是“熟练使用ChatGPT”“了解LangChain框架”“掌握RAG技术”这种废话，HR扫一眼就直接扔垃圾桶了，投100份简历99份石沉大海，真的一点都不冤。今天必须把这些简历上写AI能力的致命坑全扒出来，再告诉大家正确的写法，别再让你的AI能力，毁在一句废话上了。先盘点一下，简历上写AI能力，最常见的5个致命坑，90%的人全中坑1：只写“会用什么工具/框架”，不写任何落地场景这是最常见、最致命的坑，没有之一。很多人的简历上，关于AI能力的部分，全是这种内容：熟练使用LangChain、LlamaIndex、AutoGen框架...

简历上如何体现你的“AI...

点赞评论收藏

分享

评论

点赞

8

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

22968次浏览 159人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

373183次浏览 2286人参与

# 我的求职总结 #

499189次浏览 6989人参与

# 摸鱼被leader发现了怎么办 #

205794次浏览 933人参与

# 27届实习投递记录 #

97867次浏览 994人参与

# 春招开局，你有保底offer吗？ #

145652次浏览 693人参与

# 腾讯工作体验 #

640956次浏览 3863人参与

# 如何看待应届生身份？ #

256873次浏览 2361人参与

# 你后悔选择现在的专业吗 #

126127次浏览 714人参与

# 材料专业可以靠半导体脱坑吗？ #

41256次浏览 156人参与

# 牛客AI体验站 #

31120次浏览 444人参与

# 你遇到过哪些神仙同事 #

146055次浏览 772人参与

# 你认为工作的意义是什么 #

290193次浏览 1597人参与

# 实习学不到东西正常吗？ #

69414次浏览 712人参与

# 如果有时光机，你最想去到哪个年纪？ #

80431次浏览 861人参与

# 实习的内耗时刻 #

239575次浏览 1653人参与

# 英伟达工作体验 #

19472次浏览 137人参与

# 今年秋招哪家公司给的薪资最良心？ #

486207次浏览 2589人参与

# 找实习记录 #

276280次浏览 1650人参与

# 拼多多工作体验 #

64512次浏览 446人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务