算法打工人阿旺

04-01 22:19 中山大学算法工程师发布于山东

关注

字节大模型应用算法岗三面面经

1.自我介绍
2.拷打项目:针对长短期记忆，讲讲你是如何设计记忆的提取、压缩与冲突更新机制的？如果检测到用户存在极端情绪，你的Agent如何在不中断对话流的前提下进行干预？
3.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？
4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？
5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？
6.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？
7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？
8.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？
9.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？
10.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？
11.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？
12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？
13.随着超长上下文模型的出现，你认为传统RAG架构的必要性是否降低了？
14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？
15.手撕：第k大元素
20.反问
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉问的真的多啊，最后过了吗

点赞回复分享

发布于 04-02 22:53 北京

北京航空航天大学算法工程师

大佬有面经资料吗

点赞回复分享

发布于 04-02 14:20 北京

04-10 20:16

广西大学算法工程师

猿辅导大模型开发一面

1. 自我介绍2. RAG 怎么优化，评估时你会看哪些指标RAG 的优化一般不能只盯着生成端，很多问题其实出在检索阶段。常见优化思路包括 query rewrite、chunk 切分策略调整、混合召回、重排序、上下文压缩和引用约束。比如文档切得太碎，召回会有信息断裂；切得太长，又容易把无关信息一起带进来，生成端会受污染。真正线上效果好的 RAG，通常不是“某个 embedding 更强”，而是检索、排序、上下文组织和回答约束配合得比较好。评估时我一般拆成两层。第一层看检索，比如 Recall@k、MRR、HitRate，看相关证据能不能被捞上来；第二层看生成，比如答案正确率、faithfuln...

AI-Agent面试实战...

点赞评论收藏

分享

03-29 16:20

门头沟学院算法工程师

美团大模型应用算法一面凉凉

给我面没招了，发点面经攒攒人品～1.针对智能问答机器人，大模型上下文窗口有限，一般的解决方案是什么?2.记忆系统相较于RAG的优点是什么?3.对话系统的对话存储方式如何设计?4.如何对用户输入进行意图识别和分类?5.为什么记忆系统需要设计遗忘曲线?为什么有些信息需要被遗忘?6. LangChain、 Llamalndex 和 LangGraph的区别是什么?7.什么是MCP(ModelContextProtocol)?MCP的运转流程是什么?8.大模型FunctionCalling的能力是如何实现的?9.如果系统中的工具过多，导致模型调用工具能力变差，如何解决?10.如果工具路由(Router)失败，有什么方法可以缓解?11.在模型层面如何优化工具调用能力?12.如果通过微调来优化工具调用能力，一般采用哪种微调方式?13.如何在大模型系统中接入强化学习进行优化?14.算法题:合并区间(力扣56)

查看14道真题和解析

点赞评论收藏

分享

04-13 08:54

广西大学算法工程师

作业帮大模型算法开发一面

1. 自我介绍2. RAG系统的核心架构、检索优化与在教育场景的落地难点RAG核心架构分为数据预处理、检索模块、提示工程、大模型生成、后处理校验五部分。检索优化包括混合检索、多轮检索、知识切片、向量库优化等。在教育场景的落地难点在于知识专业性强、知识点关联复杂，易出现检索不精准；题目、公式、图表等多模态数据的结构化提取难度大；学生提问口语化、歧义多，意图理解难度高；需严格保证知识准确性，避免大模型幻觉。解决方案包括构建教育领域专属知识库、多模态文档解析、意图识别优化、事实校验机制等。3. SFT的核心流程、数据构造要点与在教育大模型中的应用SFT核心流程为数据准备、模型选择、微调策略、训练配置...

AI-Agent面试实战...

点赞评论收藏

分享

03-26 09:50

门头沟学院推荐算法

字节大模型算法二面面经分享

祝大家都能拿到满意的Offer！1.项目拷打2.你们这里说的分层混合编排式 Agent 架构设计是具体怎么做的3.我问一个就是你们在Routing那里，你会根据难度去做不同的一个处理，对吧？那你们这个难度是怎么划分的呢4.你刚才提到就是说，比方说如果刚开始有动态升级的一个范式，就是比方说这个任务刚开始被分配到了7B但是如果它在生成的过程当中，置信度或者说生成的结果它的置信度比较低，你们这个置信度是怎么生成的呢5.你们大概配备了多少个工具6.以风险评估为例，你们的输入输出分别是什么呢7.你的字段是什么8.比方说你说的收缩压这个字段，在用户的问题当中可能不会有这样的一个检测数据。那这种情况你们是怎么来处理呢9.我看到你这里有说在引入了应用层的MOE按照任务动态的激活专家路径，这个具体是怎么实现的呢10.这里就有个问题，我们针对不同的科室去训练一个微调专家，那你们是你们怎么训练的呢？怎么针对于不同科室去训练的，第二个问题就是逻辑上你们这个专家数量可不会少，然后你们的工作量会比较大，这个问题你们又是怎么解决的呢11.你们最终大概是用了多少个专家12.每个大概训练的数据量是多少呢13你们的这个70b模型用的是自己？从头开始预训练的吗？还是用的开源的14那你们医疗数据你们医疗数据的主要来源是在哪里呢？

查看14道真题和解析

点赞评论收藏

分享

03-31 22:05

广西大学算法工程师

吉利科技大模型应用开发二面

感觉面试官自己也不是很熟 没怎么招过1. 你挑一个最熟悉的项目详细讲一下，重点说业务背景、数据形态和你负责的部分2. 如果大模型输出格式和你预期不一致，你一般怎么处理这个问题如果只回答“加强 prompt 约束”会显得太浅。真实场景里，输出格式不一致通常有三层原因：第一层是模型没理解任务边界，第二层是格式本身太脆弱，第三层是生成阶段没有约束。我的做法一般是先把格式要求拆成字段级约束，尽量避免开放式自然语言和结构化字段混在一起；然后再根据场景决定是用 schema 校验、函数调用、受限解码，还是生成后重排修复。如果业务要求严格，比如必须产出合法 JSON，我不会只依赖 prompt。我会让模型先...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

12

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

34918次浏览 439人参与

# 想从事Agent应该学习哪些技术？ #

8602次浏览 290人参与

# 有哪些公司在面试时考察AICoding？ #

19455次浏览 349人参与

# 你的第一家实习公司是什么档次？ #

70315次浏览 335人参与

# HR面都在聊什么？ #

13856次浏览 163人参与

# 26届春招投递记录 #

3642次浏览 42人参与

# 从投递到OC，你用了多久 #

23900次浏览 240人参与

# 大学生该如何认清当下的就业环境？ #

162476次浏览 889人参与

# 什么人最适合大厂？ #

12843次浏览 133人参与

# 哪些公司面试还在问八股？ #

14183次浏览 125人参与

# 父母问你工作找得怎么样，怎么回 #

23184次浏览 285人参与

# 我的求职进度条 #

1116222次浏览 8054人参与

# 如何快速融入团队？ #

50117次浏览 306人参与

# 你觉得什么岗位会被AI替代 #

57266次浏览 371人参与

# 多益网络工作体验 #

68581次浏览 310人参与

# 薪资爆料 #

412695次浏览 2209人参与

# 美团开奖 #

407814次浏览 1805人参与

# 运营来爆料 #

98831次浏览 508人参与

# 你觉得机械有必要实习吗 #

83672次浏览 527人参与

# OPPO求职进展汇总 #

809076次浏览 5441人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务