offer 好运加持 8

05-06 18:25 门头沟学院算法工程师

关注

大模型应用算法面经分享-字节-27实习

发一下问题给大家参考，攒攒人品！
1.实习拷打
2.拷打项目:针对长短期记忆，讲讲你是如何设计记忆的提取、压缩与冲突更新机制的？如果检测到用户存在极端情绪，你的Agent如何在不中断对话流的前提下进行干预？
3.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？
4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？
5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？
6.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？
7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？
8.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？
9.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？
10.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？
11.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？
12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？
14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？
15.手撕：第k大元素

全部评论

推荐最新楼层

喜欢溜溜球的卡尔国企上岸了

中国科学技术大学深度学习

飞书吗

点赞回复分享

发布于 05-25 15:24 安徽

牛客104437716号

甘肃政法大学算法工程师

点赞回复分享

发布于 05-10 22:44 甘肃

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉问的可以，看着有戏

点赞回复分享

发布于 05-07 23:56 北京

牛客282756144号

复旦大学算法工程师

RAG方向吗。问的问题很好

点赞回复分享

发布于 05-07 13:22 美国

05-26 19:51

北京邮电大学 Java

【面经】5月20日，蚂蚁智能体与大模型应用一面

自我介绍如何解决大模型幻觉？问题2中说到了模型的微调，面试官问对模型微调那些算法了解吗？项目的skills是怎么实现的？你是怎么写skills的？Spring AI框架的skills调用更像Claude Code还是其他Harness agent？你说看过Claude源码，Claude Code学习经验总结？Claude Code是给模型用grep检索，没有用RAG检索，这俩有什么区别？为什么没用rag？讲讲RAG的混合召回url解析过程tcp三次握手、四次挥手mysql的数据结构，讲讲B+树Spring的控制反转、AOP你平时用什么做ai coding？

查看13道真题和解析

点赞评论收藏

分享

05-08 04:55

门头沟学院算法工程师

大模型算法面经分享-阿里暑期

继续来分享下最近的面经~欢迎友好讨论，信息共享1.项目背景2.要解决的问题3.要解决问题的难点4.技术方案选型5.最终如何确定技术方案6.Qwen3-VL embedding 是怎么做的7.是怎么提取图片的8.用的什么提取器9.最终怎么嵌入到文本里10.怎么定义 DPO 训练集是高质量的11.DPO 训练数据量是怎么确定的12.数据量确定是拍脑袋，还是有原则13.为什么不用 SFT14.SFT 数据质量要求高体现在哪些方面15.如果现在用 SFT 去解决这个问题，从理论上能不能解决16.为什么不用 GRPO 解决，而是选择 DPO

查看16道真题和解析

点赞评论收藏

分享

05-13 23:42

门头沟学院全栈开发

无脑拥抱大模型（续）

我很讨厌被工作完全打满的状态，倒不是怕累，毕竟干了快二十年都这么过来的，主要是高强度工作会让人没有思考的精力和时间。从今年1月开始就被AI卷到爆，最近实在忍不住了，周末加班加点安排一篇，文字已过万，阅读请谨慎。很早之前我就跟周围人讨论过一件事：限制AI应用快速发展最大的瓶颈不是模型能力，而是“想象力”。这个“想象力”有很多种含义，比如：1、新的工程方法论诞生、完善我们亲身经历了从提示词工程师、思维链到评估体系、Harness，从ReAct到Reflexion再到ReflAct、Rememberer、Retrospex等变化。2、新的基础被大规模投入看看云计算平台的主要营收来源，在存储、网络、安...

建议收藏系列

点赞评论收藏

分享

05-13 16:11

字节跳动_gmpt_开发(实习员工)

字节春招大模型测开一面面经

面试的是大模型相关测试的部门，题目比较基础，但是牵扯到大模型相关的知识了，全部回答上来了，但是回答的模棱两可（太菜导致的）1.解释一下 Transformer 的 Encoder 和 Decoder 的区别和分别做什么的？2为什么模型参数越多，不一定代表单个 Token 推理成本越高呢？3.为什么 MoE会导致模型参数越多，不一定代表单个 Token 推理成本越高呢？4.解释一下什么是灾难性遗忘？5.为什么模型会出现幻觉？6.Temperature这个参数是干嘛的？7.Temperature → 0 时还会有幻觉吗？8.在向量数据库里，两个同义词是什么关系？9.假如有完全相同意思的词语，会出现在一条线上吗？10.RAG 的工作流程是什么？11.从一个 Query 进来开始，完整描述一下 RAG 的流程。12.如果 RAG 检索到的 Chunk 不足以回答问题，后续会怎么处理？

查看12道真题和解析

点赞评论收藏

分享

05-25 15:35

已编辑

内蒙古师范大学人工智能

Ai Agent、ai应用开发面经面试题2

一些自己在网上搜刮的面经题目路过的牛爷爷可以试着答一答，附上自己的答案，如果有更好的答案也可以拷打我，如果有别的比较好的题目也可以评论里发一发。 如何评估 RAG 效果？指标是什么？ 分层评估：  检索质量评估：看如HitRate（命中率），Recall（召回率）等指标 生成质量评估：看如相关性（是否切题）、忠诚度（生成是否基于检索内容生成）、完整性（生成答案是否完整） 用户满意度测评：答案是否满意，检索速度够不够块。  RAG 和微调怎么取舍？ RAG适合更新频率高，存在隐私数据以及需要可解性性要求高需要稳定输出的场景。 微调适合需要特定规则以及语气的使用场景。 这两个技术在大部分场景下都不...

查看8道真题和解析

点赞评论收藏

分享

评论

点赞

8

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

998947次浏览 5081人参与

# 国企是春招机械人最好的去处吗 #

153897次浏览 585人参与

# 发面经攒人品 #

8872506次浏览 98472人参与

# 硬件人的简历怎么写 #

350884次浏览 3147人参与

# 27届实习投递记录 #

163540次浏览 1662人参与

# AI了，我在打一种很新的工 #

208658次浏览 2235人参与

# 万物皆可发面经 #

4655次浏览 58人参与

# 实习，不懂就问 #

229511次浏览 1763人参与

# 运营人求职交流聚集地 #

260313次浏览 1135人参与

# 秋招投递攻略 #

296075次浏览 2643人参与

# 你的mentor是什么样的人？ #

67251次浏览 852人参与

# 实习生至暗时刻 #

93704次浏览 942人参与

# 实习如何「偷」产出？ #

772430次浏览 8611人参与

# 从mentor身上学到了__ #

67748次浏览 949人参与

# 父母对你找工作是助力还是阻力？ #

52727次浏览 467人参与

# 你觉得mentor喜欢什么样的实习生 #

64181次浏览 1090人参与

# 我和mentor的爱恨情仇 #

121591次浏览 1047人参与

# 非技术投递记录 #

741688次浏览 6979人参与

# 找实习记录 #

282514次浏览 1664人参与

# 第一次找实习，我建议__ #

90034次浏览 923人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务