03-11 16:25 门头沟学院机器学习

关注

字节推荐算法大模型实习一面

给我面没招了，发点面经攒攒人品～
项目细节拷打
八股
1.大模型了解多少，强化学习了解什么
2.DPO的全称是什么，公式是什么，直接体现在哪里
3.与PPO对比

归一化方法
• 常用的归一化方法有哪些
• 讲讲RMSNorm

AUC
• auc的定义
• 从样本里随机去掉一些负样本，Auc怎么变

优化器
• 讲一讲常用的优化器
• sgd是什么，Adam相对于sgd改进了什么

位置编码
• 正余弦位置编码的公式

手撕
• 计算逆序对数量
• 多头自注意力

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉问的似乎不多吧

点赞回复分享

发布于 03-12 20:11 北京

创作小队长

牛客创作者运营

宝子，你这篇面经很有价值诶，感谢分享！！我私信你啦，你看看~

点赞回复分享

发布于 03-12 14:31 北京

04-01 22:35

已编辑

清华大学数据挖掘

ai agent手撕真题- ROPE旋转位置编码

先搞懂：为什么需要位置编码？Transformer 模型本身是 位置无关 的！它不知道哪个词在前，哪个词在后。比如 "我喜欢吃苹果" 和 "苹果喜欢吃我" Transformer 会认为这两个句子的结构完全一样，因为它只关心词与词之间的关系，不关心顺序。但实际上这两个句子的意思完全不同！所以需要 位置编码 来告诉模型每个词的位置信息传统位置编码问题方案1：学习型位置编码，初始化一个位置向量，全程全靠train给每个位置随机初始化一个向量让模型自己学习每个位置应该是什么样的❌ 缺点：只能处理训练时见过的长度，遇到更长的句子就傻眼了方案2：正弦位置编码用三角...

ai agent每日手撕

点赞评论收藏

分享

03-23 19:05

门头沟学院推荐算法

推荐算法实习二面-字节拷打麻了

被横向挂了，希望发出来对大家有帮助！1. 项目拷打2. 什么情况下，MAP的损失函数可以用NMSE来计算？（高斯噪声）3. 手写Multi-head Attention4. Attention的复杂度是多少？5. AUC是什么？6. 推荐算法了解哪些？7. 协同过滤的概念是什么？8. 如果是一种普适性很强的物品（如：新华字典），怎么设计指标对它降权？9. AUC怎么推广到非二分类问题？怎么快速计算AUC？10. bn训练阶段和测试阶段区别，详细讲讲原理

查看10道真题和解析

点赞评论收藏

分享

03-31 00:39

广西大学算法工程师

微信大模型算法开发一面

1. 介绍下你实习学了什么 做过什么项目,为什么离职的2. MoE 为什么能在参数量很大的情况下还能把训练和推理成本压住，真正难点在哪MoE 的关键不是“参数变多了”，而是“每个 token 只激活一部分参数”。也就是说总参数量可以做得很大，但单次前向只走少数几个 expert，所以理论上计算量不会随着总参数线性增长。这个思路在大模型里很有吸引力，因为可以同时兼顾容量和成本。但真正难的地方是路由和负载均衡。路由器如果只偏爱少数 expert，训练会很不稳定，热门 expert 被打爆，冷门 expert 学不到东西。另一个难点是通信开销，尤其多机训练时，token dispatch 和 gat...

AI-Agent面试实战...

点赞评论收藏

分享

03-26 07:50

门头沟学院推荐算法

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！1.项目拷打2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性4如果模型生成的排序导致广告主出现竞价上的博弈呢5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

查看9道真题和解析

点赞评论收藏

分享

04-17 09:40

安徽工业大学 IT技术支持

# 2026大学生就业真相：1270万人抢567万个岗，学历和专业决定生死

用真实数据拆解当代大学生就业的结构性矛盾 一、整体就业大盘：总量压力空前，优质岗位严重不足 2026届全国普通高校毕业生规模再创新高，叠加往届未就业、海归及职场回流人群，就业市场供需失衡进一步加剧：   📊 毕业生总数：1270万人（同比+48万，连续8年破千万）   👥 全年求职总人数：1500万人+   💼 有效校招岗位：约567万个   ⚖️ 整体供需比：≈2:1（平均2人竞争1个岗位）   ✍️ 直接签约率（不含升学）：约55%   ⏳ 慢就业/暂缓就业：30%~45%（以考研、考公、待业为主）   📉 16-24岁青年失业率：16.5%~17.3%（仍处高位徘徊）   二、学...

我的求职进度条

点赞评论收藏

分享

评论

6

18

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

74156次浏览 594人参与

# 你是怎么和mt相处的？ #

101949次浏览 496人参与

# 华泰星战营，提前锁定校招offer #

13767次浏览 389人参与

# 打工人的工作餐日常 #

96026次浏览 550人参与

# 拼多多集团-PDD笔试 #

86637次浏览 593人参与

# 网易游戏雷火笔试 #

11532次浏览 108人参与

# 26届秋招投递记录 #

123515次浏览 683人参与

# 招银网络科技（深圳）有限公司成都分公司笔试 #

5139次浏览 20人参与

# 毕业论文怎么查AI率 #

85419次浏览 1963人参与

# 网易笔试 #

171394次浏览 812人参与

# 简历上如何体现你的“AI”能力？ #

17430次浏览 383人参与

# 找不到大厂实习可以去小厂吗？ #

23268次浏览 279人参与

# 你总挂在第__面？ #

12446次浏览 149人参与

# 哪些AI项目值得做？ #

27286次浏览 663人参与

# 如何准备秋招 #

81866次浏览 871人参与

# 0offer互助地 #

770065次浏览 4725人参与

# 实习时最怕听到的一句话 #

24137次浏览 226人参与

# 多益网络工作体验 #

70127次浏览 312人参与

# 没有面试的日子里，你在做什么 #

14989次浏览 388人参与

# 秋招被挂春招仍然能投的公司 #

31806次浏览 241人参与

# 秋招开始捡漏了吗 #

244570次浏览 1058人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务