03-25 08:30 西安交通大学算法工程师

关注

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习
1.项目拷打
2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？
3.像那种rl里面的那个MOE之类的那种的优化有去做过吗
4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？
5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下
6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做
7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么
8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的
9.试过用 Agent去生成cuda内核么，怎么去做的
10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？
11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了
12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

全部评论

推荐最新楼层

爱吃鸡腿的王者顶呱呱

杭州电子科技大学算法工程师

这怎么一个也不会啊

点赞回复分享

发布于 03-25 15:29 浙江

03-24 08:53

吉林农业大学算法工程师

高德大模型开发二面

1. 你做的 Agent 项目整体架构是什么？答：一个比较完整的 Agent 架构一般包括四层：用户输入层、规划决策层、工具执行层、结果整合层。用户输入进来后，先做意图识别和上下文整理，再由大模型决定是直接回答、检索知识、还是调用工具。工具层可能包括搜索、数据库查询、知识库检索、接口调用、代码执行等。工具返回结果后，再交给模型做总结、归因和最终输出。如果是生产环境，还会多一层治理能力，比如权限校验、超时控制、重试、日志、观测、敏感内容拦截。Agent 和普通问答最大的区别，就是它不是单纯生成文本，而是“模型负责决策，外部系统负责拿真实信息，最后再由模型组织答案”。2. Agent 为什么不等于...

AI-Agent面试实战...

点赞评论收藏

分享

昨天 10:35

门头沟学院推荐算法

高德大模型算法一面面经 1h

给我面没招了，发点面经攒攒人品～1.项目拷打2.语义漂移吗？如果遇到罕见病，模型产生‘幻觉对齐’导致误操，有没有方案去做兜底3.在医疗决策里，‘兴趣’是伪命题，‘合规’才是核心。用常规的DIN是做用户兴趣建模，但把DIN 里的激活单元改成了双线性交互这会不会导致模型对‘强特征’（如过敏史）的敏感度被‘软语义’稀释？4.知识库里既有权威指南又有脱敏病例。当这两者发生逻辑冲突时（比如新版指南否定了旧病例的方案），路由机制是怎么做确定性仲裁的？5.说的算子融合具体是怎么做的6.做生成式推荐重构，LLM虽然语义理解强，但天生带有选择偏见（。在冷启动场景下，怎么保证模型生成的物料序列不会陷入‘信息茧房’？7.手术机器人的环境是很复杂的，比如它组织形变是不规则的。你提到的不确定性感知），具体是基于传统的卡尔曼滤波还是基于大模型的分层鲁棒控制？当模型预测的8.动作序列与传感器实时反馈发生显著偏离，怎么实现毫秒级的安全制动9.用Pseudo-ID做时序追踪，但如果攻击者通过多维病理特征进行逆向重构，Embedding层做了哪些差分隐私处理10.手撕：Transformer block实现

查看10道真题和解析

点赞评论收藏

分享

03-15 22:57

字节跳动_研发工程师

AI 工程化实战：5分钟带你快速掌握 Function Calling！

最近 AI 圈最热的莫过于“养小龙虾（OpenClaw）”了，甚至不少人为了能够用上小龙虾，在腾讯大厦楼下排起了长队，等待腾讯工程师帮忙部署。为什么一个开源项目能引发如此规模的线下活动？因为大家发现，OpenClaw 并不是又一个只会『陪聊』的窗口，它是一个真正的『数字员工』。当你对它说“分析一下本地销售数据并把总结发给主管”时，它能自主翻找你电脑里的文件、运行统计脚本、最后登录你的企业飞书发出消息。这种从动口到动手的质变，源于它将原本封闭的大模型接入了现实世界。而支撑这种跨维度操作的核心技术，正是我们今天要介绍的 Function Calling（工具调用）。一. 痛点：为什么需要 Func...

点赞评论收藏

分享

03-24 11:45

门头沟学院机器学习

快手大模型llm面经分享

发一下问题给大家参考，攒攒人品！1 项目拷打2. 在 Agent 多轮对话任务中，Attention 的局限性具体体现在哪些方面？3. 简要介绍 SFT 的核心流程，以及如何制定数据集的构建策略？4. SFT 之后常见的 Post-Training还有哪些？它们各自的设计目的是什么5. 什么是RAG它提升生成质量的核心原理是什么6.RAG与传统的检索 + 模型生成流程有何不同7.如何构建评估体系来验证一个RAG系统是否真正Work？8.PPO和DPO在对齐阶段的主要区别是什么？9. 在进行DPO训练时，通常有哪些关键的注意事项？是否了解过GRPO10.在Modular Agent中，多步规划是如何实现的？11.针对多个工具的调用链路，你的调度策略是如何设计的12. Agent 评估体系包含哪些核心维度？如何量化衡量Planning能力与Hallucination Rate )？13.在微调Qwen模型时，你是如何确定训练阶段和 Loss Function的？14. Prompt自动推荐模块应用了哪些优化策略？是否尝试过Prompt压缩或Embedding表示的方式？15.假如Agent推理链路包含3个工具且请求频率极高，导致系统整体延迟较高，你会从哪些维度进行优化？17.在记忆系统中，意图识别 承担什么职责？18.Embedding的维度选择（如 1024 维）是基于什么逻辑？为什么不选择更高或更低的维度？19.Qwen-4B的Embedding是如何实现的？其模型框架是否属于 BERT 系列？20.Qwen-34B的Rerank是如何实现的？21.Attention机制中的Q, K, V矩阵具体是如何通过输入变换得到的？22.Attention公式中除以根号d_k的作用是什么？如果不除以它，是否有其他替代方案？23.请详细解释Multi-Head Attention ，并指出它目前存在的主要问题24. 如何解决多头注意力机制计算开销过大的问题25. 什么是 RoPE ？它核心解决了什么问题？26. 在 Memory  系统中，如果输入文本过长，常见的工程处理策略有哪些？

点赞评论收藏

分享

昨天 21:08

杭州电子科技大学大数据开发工程师

【深夜长文】AI杀疯了的2026年，前后端、测试、运维、UI到底谁还有活路？

老实说，看着现在各种大模型一键生成页面、秒写正则、连发版脚本都能顺手写了，大家心里慌是正常的。在牛客上每天都能看到“XXX岗位是不是要凉了”的焦虑贴。但剥开情绪外衣，客观现实是：AI干掉的不是某个岗位，而是某个岗位的低级执行层。 咱们挨个岗位盘一盘，现在的“活路”到底在哪。1. 后端：从CRUD 机器到业务与架构的守门员如果你的日常就是接参数、查数据库、拼 JSON 吐给前端，那确实非常危险，AI 写这种样板代码比你快，还不会漏写分号。活路在哪？ 核心在于复杂的业务壁垒和系统架构能力。AI 很难理解深度的业务上下文。比如搞个竞标平台的后端，瞬间的高并发打过来怎么扛？出价时的事务一致性怎么保证？...

AI时代，哪些岗位最容易...

点赞评论收藏

分享

评论

点赞

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI面会问哪些问题？ #

13952次浏览 279人参与

# 你做过最难的笔试是哪家公司 #

16533次浏览 109人参与

# 厦门银行科技岗值不值得投 #

4876次浏览 116人参与

# 你的实习产出是真实的还是包装的？ #

14177次浏览 209人参与

# 找AI工作可以去哪些公司？ #

3740次浏览 82人参与

# 春招至今，你的战绩如何？ #

44196次浏览 383人参与

# 米连集团26产品管培生项目 #

11909次浏览 276人参与

# 从事AI岗需要掌握哪些技术栈？ #

3924次浏览 110人参与

# 机械/制造每日一题 #

91926次浏览 1491人参与

# 阿里笔试 #

167981次浏览 1206人参与

# 春招你拿到offer了吗 #

822481次浏览 9947人参与

# 应届生进小公司有什么影响吗 #

132700次浏览 1188人参与

# 长得好看会提高面试通过率吗？ #

18091次浏览 190人参与

# 学历对求职的影响 #

656271次浏览 4202人参与

# 应届生第一份工作最好去大厂吗？ #

143270次浏览 1214人参与

# 沪漂/北漂你觉得哪个更苦？ #

6919次浏览 119人参与

# 一张图晒出你司的标语 #

2408次浏览 35人参与

# HR最不可信的一句话是__ #

3892次浏览 75人参与

# AI时代，哪个岗位还有“活路” #

7816次浏览 212人参与

# 职场新人体验 #

180343次浏览 1215人参与

# 工作丧失热情的瞬间 #

374957次浏览 2574人参与

# 什么专业适合考公 #

58522次浏览 303人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务