2025-11-11 19:05 山东大学算法工程师

关注

小米秋招agent算法一面

一、手撕
题目：给定一个字符串 s 和一个整数 k，每隔 k 个字符反转一次，返回最终字符串。
简单很快就写出来了

二、八股
1.自注意力机制是什么？计算复杂度怎么算？
吟唱: 通过query-key相似度计算权重，对value加权求和，建模长距离依赖。O(n平方)n为序列长度。

2.KV-Cache的如何加速推理？
继续吟唱：生成时缓存已经计算过的kv，避免重复计算。

3.LoRA的原理是什么？与P-Tuning、Adapter的异同点？LoRA的参数选择对模型性能有何影响？
三连吟唱：原理是冻结原始权重，训练低秩矩阵参数。异同在于lora训练参数，p-tuning只优化了prompt嵌入。

4.介绍下RLHF的基本流程，与DPO的差异是什么？
主动吟唱：RLHF三段式，sft用高质量数据集微调，rm训练对比学习模型用于打分，ppo通过rl泛化增强。dpo直接优化偏好数据，省去rm和ppo。

5.分布式训练中的TP、PP、DP分别是什么？
TP按tensor维度拆分,PP按网络层数分段流水线执行，DP数据并行，复制模型副本分散计算

6.flash-attention的原理是什么？
这里回答没太好，只讲了通过内存层次结构什么的减少I/O瓶颈

7.DeepSeek的MoA架构与MoE有何区别？
moe通过门控机制选择专家子网络，参数规模增加但训练难度大。moa则用多个agent回答，通过数据迭代优化，缓解偏科。

8.如何处理数据不均衡问题？
上采样小样本，课程学习

三、项目与实习
1.agent实习主要负责哪些模块？
动作规划，memory经验，evaluation pipeline，后训练，很多模块都参与了，面试官也挺震惊哈哈。这里聊比较多就不po了。
2.记忆系统如何实现视觉-语言特征对齐？
clip映射到联合embbeding上
3.如果视觉模块误判，如何通过语言纠错？
检测矛盾关键字，通过反馈触发重试。
4.具体讲讲怎么构建evaluation pipeline的?
做了数据爬取，版本控制，llm打分

全部评论

推荐最新楼层

2025-12-10 16:29

门头沟学院 Java

怎么选项目 & 怎么包装一个项目

前言做一个项目无非是两个目的，要么是想学习技术拓宽视野，要么是简历项目薄弱，想包装一下放简历上，如何去学一个项目暂且不谈，每个人有每个人的学习方式。本篇以一个服役5年的夹娃老兵的视角聊一下该怎么去包装一个项目。从业这么久，别人面我的场次和我面别人的场数不清多少了，多多少少还是有些经验，大厂、小厂、独角兽、外包、线上线下也都面过我，应届生、1-3年、3-5年，外包仔，大厂仔，我也都面过。总结下来，除去个人基础的差异，我个人认为，决定你能不能通过面试的一个核心之一就是看你是不是足够自信。我们从最开始聊，怎么选项目怎么选项目大家公认一个规则就是，在企业里做过的真实项目价值远大于个人的学习项目，这一点...

那些拿到大厂offer的...

点赞评论收藏

分享

2025-12-17 23:25

合肥工业大学算法工程师

蚂蚁大模型Agent算法二面-55min

1.你的 Agent 系统Prompt 是怎么设计和迭代的？有没有做过 Prompt 自动优化？当用户提出不完整的请求时，如何补全用户意图的？2.构建 Agent 的时候，遇到过哪些瓶颈？LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离？你是如何保证线程安全的？4.微调 Llama2 你是怎么选择训练样本的？清洗逻辑是什么？你有没有观察到哪些训练样本质量问题对模型行为有很大影响？举例说明。5.DPO相比 SFT，有哪些优劣？它在 Agent 任务上效果提升明显吗？你怎么构造偏好对？构造逻辑是自动的还是人工？6.你说你服务部署在 vLLM 上，为何选择它？KV-cache 如何帮助推理加速？你自己做过哪些优化？7.假如需要支持 Streaming 输出，但当前服务延迟又超标，你会怎么折中设计？8.多轮对话上下文状态管理是如何做的？如何在高并发场景下保证一致性？9.你做的 Agent 使用了多少个外部工具，在调用链条上如何保障故障容错和超时机制？10.有没有做过工具调用失败后的feedback策略设计？11.训练过程中数据来自用户行为日志，你是如何从这些数据中抽取训练对话的？有没有做过归一化或事件抽象？12.有没有了解过带有时间窗口/偏移限制的对话系统？模型怎么“理解时间”？13.你觉得 Agent 哪些模块最容易在真实业务中出问题？你会如何监控和定位的？

点赞评论收藏

分享

2025-12-15 09:10

中南大学算法工程师

26校招阿里云Agent算法二面

1.八股：请介绍一下Transformer的核心组件及其作用2.八股：介绍LLM Decoder-Only架构3.八股：你对SFT的理解是什么？与预训练相比有什么差异？4.项目：SFT冷启动时数据集构造需要注意哪些因素？为什么要做数据清洗与均衡采样？5.项目：介绍一下RAG的整体流程。在Agent落地场景中，RAG会遇到哪些延迟和正确率问题？你怎么优化召回链路？6.项目：在你的问答Agent项目中，数据集构造的自动化流程是怎么实现的？7.项目：你是如何利用多Agent协同来提高推理正确率的？调度策略如何实现？8.项目：你提到用DeepSpeed做SFT训练，请讲一下DeepSpeed ZeRO Stage 1-3的区别，以及什么时候用FSDP会更好？9.项目：你做Prompt优化时，是如何判断优化后的Prompt在Agent推理链路中性能提升的？用什么指标来衡量？10.项目：在多Agent系统中，如何保证异步任务执行的稳定性和结果一致性？11.项目：如果Agent推理API需要低延迟响应，你会从哪些方面做系统级优化？12.代码题：lc34 在排序数组中查找元素的第一个和最后一个位置

查看12道真题和解析

点赞评论收藏

分享

2025-12-29 19:17

门头沟学院算法工程师

秋招选择推荐算法还是偏算法一些的agent

感觉推荐算法跟开发一样 各种场景超多业务，但是增量真的有限，低的用DNN都能跑出收益，水位线高的都在卷生成式。我目前接触过一些ai搜，做一些意图识别、搜索算法也是需要训模型的，感觉是不是比纯粹的推荐算法靠谱一些呢

点赞评论收藏

分享

2025-12-22 04:15

山东大学算法工程师

淘天AI Agent算法校招一面

1，介绍RAG流程；介绍对编码模型的了解、原理、优缺点；如何评估编码模型的能力2，RAG有哪些分类；多模态RAG有哪些实现框架；伪多模态RAG和多模态RAG分别怎么实现，有什么区别；CLIP可以用于哪一类多模态RAG，为什么3，RAG怎么评估，RAG评估体系中最重要的是什么4，传统RAG有什么痛点；介绍GraphRAG，GraphRAG的难点是什么；GraphRAG如何应对增量场景5，介绍微调负责的工作；大模型微调最重要的是什么6，后训练有哪些方式；微调有哪些方式，分别是怎么做的；LoRA原理及参数量7，介绍DPO；DPO与PPO的区别8，介绍一些Agent的实现框架；这些框架有什么区别；LangGraph适用于什么场景；LangGraph构建Agent的方式有哪几种9，场景题：客户输入一个软件或网页界面截图，如何通过RAG的方式帮助用户了解界面的每一个组件的作用（？？？说实话没太听懂），输入输出自己定义；相似的组件如图片框和视频框如何区分10，算法题：2n+1个数，两两成对，找出单独的那个数11，反问

点赞评论收藏

分享

评论

1

6

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 哪些公司在招寒假实习？ #

15547次浏览 195人参与

# 国企vs私企，你更想去？ #

305700次浏览 2491人参与

# MiniMax求职进展汇总 #

754次浏览 23人参与

# 26年哪些行业会变好/更差 #

18750次浏览 256人参与

# 卷__卷不过你们，只能卷__了 #

11819次浏览 264人参与

# 有深度的简历长什么样？ #

16479次浏览 341人参与

# 写论文的崩溃时刻 #

6341次浏览 148人参与

# 去年的flag与今年的小目标 #

9911次浏览 196人参与

# 关于春招你都做了哪些准备？ #

122169次浏览 707人参与

# 机械人，你最希望上岸的公司是？ #

198083次浏览 1917人参与

# 现在还是0offer，延毕还是备考 #

1256428次浏览 7922人参与

# 你不能接受的企业文化有哪些 #

11773次浏览 169人参与

# 入职第一天 #

10075次浏览 219人参与

# 租房前辈的忠告 #

350468次浏览 7445人参与

# 你都用AI做什么 #

6784次浏览 156人参与

# 你怎么看待AI面试 #

133416次浏览 745人参与

# 发工资后，你做的第一件事是什么 #

93117次浏览 311人参与

# 最难的技术面是哪家公司？ #

62966次浏览 949人参与

# 腾讯音乐求职进展汇总 #

147924次浏览 1053人参与

# 华为池子有多大 #

159142次浏览 876人参与

# 一人分享一道面试手撕题 #

22773次浏览 805人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务