03-26 07:50 门头沟学院推荐算法

关注

字节大模型算法面经-面麻了已经

攒人品中，祝大家都能拿到满意的Offer！
1.项目拷打
2生成式推荐本质上是在做隐空间到离散iD的映射，你如何证明你生成的 ID 序列保留了用户意图的最优压缩
3.比如广告场景下不仅仅是预估 CTR。如果我们将生成式排序引入 GSP拍卖，大模型生成的候选列表概率分布，如何保证满足激励相容性
4如果模型生成的排序导致广告主出现竞价上的博弈呢
5.在H100集群上跑生成式重排，现在的瓶颈不在计算而在存储带宽。如果分阶段推理，我在Prefill阶段采用了FlashAttention-3，但在 Decoding 阶段因为 KV Cache 导致的Fragmented Memory太严重，怎么办
6.推荐系统要求毫秒级响应对于1B规模的排序模型，如果我要做Speculative Decoding，你如何设计那个Draft Model？这个小模型是该学大模型的 Logits 分布，还是该学用户的Embedding聚类
7.假设构建一个端到端生成式广告系统。现在面临一个场景：某个新入驻的土豪广告主投放了一批高质量视频，但由于模型对新 ID 的 Semantic Indexing 尚未完全对齐，导致第一波推荐给了错误的人群，产生了极高的 Negative Feedback，生成式模型的自回归特性会不断放大这种“第一印象”，导致该广告主瞬间被屏蔽你如何设计一套Online Counterfactual Correction这种，在不重新训练模型的前提下，通过修改 KV Cache里的隐藏状态来强行挽回这批广告的生命周期
9.在短视频重排阶段使用了一个 10B 的生成式模型但是业务反馈说模型在学会了今天最火的某个梗以后，竟然忘记了如何处理用户对“长尾科普视频”的旧兴趣，发生了明显的 Catastrophic Forgetting，设计一种基于 Gradient Orthogonal Projection的优化器，确保模型在更新实时热点知识时，参数更新量在旧知识的Null Space内。
10.都知道生成式模型有位置偏差从 Attention Entropy 的角度来看，为什么 $N$ 个候选 Item 在序列中的排列顺序会直接导致 Logits 的非线性漂移

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于 03-26 16:11 广东

会一点点编程

National University of Singapore 算法工程师

这么难吗

点赞回复分享

发布于 03-26 14:05 新加坡

04-13 08:54

广西大学算法工程师

作业帮大模型算法开发二面

1. 大模型微调的完整技术方案与工程落地细节采用 LoRA 参数高效微调方案，仅对 Transformer 的 Q/V 投影层添加低秩矩阵，冻结底座模型参数。训练时设置秩 r=8、缩放因子 α=16，使用 AdamW 优化器，学习率 2e-4，配合余弦退火学习率调度与梯度裁剪。工程上使用混合精度训练、分布式数据并行，提升训练效率，训练后合并 LoRA 权重，不增加推理延迟。 import torch import torch.nn as nn class LoRALinear(nn.Module):def __init__(self, in_features, out_features, r=...

查看24道真题和解析

点赞评论收藏

分享

04-21 00:20

中南大学算法工程师

字节大模型算法三面压力拉满

继续来分享下最近的面经~欢迎友好讨论，信息共享1.论文与项目拷打2.对agentic rl的了解简单介绍langchain和langgraphharness做的事情看起来langchain等也一直在做，为什么harness现在这么火，有什么区别3.端到端生成式推荐生成式召回生成式排序这几个方向各自的代表成果以及侧重你认为目前而言哪一块是融合的最好的，或者说哪一块价值最高码本训练的方法，评估指标，模态对齐怎么做，embedding模型是否要训练，幻觉怎么解决4.手撕:排序链表

查看8道真题和解析

点赞评论收藏

分享

03-31 00:26

广西大学算法工程师

小鹏大模型算法二面

1. 你做过的后训练项目里，最难解决的问题是什么2. SFT 数据你怎么构造，怎样避免模型被训练“油了”SFT 最大的问题不是量不够，而是数据风格太单一，最后把模型训成一种固定腔调：很会说、很圆滑、但信息密度低。构造数据时我一般会先按任务拆层，比如信息抽取、工具调用、复杂问答、拒答、安全、长文总结、结构化输出，每一层的目标都不一样。然后再做难度分桶，避免模型只见过简单样本。另一个关键点是负面风格清理。很多数据表面上没错，但非常模板化，比如“这是一个非常好的问题，让我们一步一步分析”，这类东西在少量数据里没问题，规模一大就会把模型带偏。所以我会专门清掉这种“高礼貌、低信息”的样本，保留更接近真实...

AI-Agent面试实战...

点赞评论收藏

分享

04-21 20:01

门头沟学院 Java

遇到KPI会脏面评吗？

我好恨呀！好不容易有个大厂面试，结果是KPI😭字节tiktok 客服平台只聊了项目和实习，还没聊的多深，大概就30多分钟吧，就说就到这吧，想问一下友友们，这种会脏面屏吗，要不要投诉他😭😭

点赞评论收藏

分享

04-14 08:50

广西大学算法工程师

快手大模型算法开发一面

1. 自我介绍2. 项目拷打3. Reward Model 在对齐训练里扮演什么角色Reward Model 本质上是在学一个“人类更偏好什么”的可微近似函数。SFT 学的是“像人那样答”，RM 学的是“人更喜欢哪种答法”。它并不直接生成答案，而是给候选答案打分，把人类偏好从离散排序信号压进一个标量目标里，后续无论是 PPO 还是其他策略优化方法，核心都要依赖这个分数去推动模型往偏好更强的方向移动。RM 最大的价值不是替代人工，而是把人工偏好从逐条监督扩展成可批量泛化的训练信号。真正难的地方在于它很容易学到表面模式，比如更长、更像模板、更会说套话的答案可能被错判成更优，所以 RM 训练的上限很...

AI-Agent面试实战...

点赞评论收藏

分享

评论

2

7

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

16775次浏览 118人参与

# Vibe Coding 会干掉初级岗位吗？ #

51659次浏览 328人参与

# 我的求职总结 #

486507次浏览 6870人参与

# 美团秋招笔试 #

218925次浏览 1196人参与

# 27届实习投递记录 #

85244次浏览 906人参与

# 实习生应该准时下班吗 #

360544次浏览 1762人参与

# 职场吐槽大会 #

361416次浏览 2308人参与

# 面试常问题系列 #

311109次浏览 4803人参与

# 面试中的破防瞬间 #

1268841次浏览 11141人参与

# 我是XXX，请攻击我最薄弱的地方 #

96018次浏览 642人参与

# 拼多多工作体验 #

62784次浏览 439人参与

# 机械人还在等华为开奖吗？ #

342019次浏览 1655人参与

# 华为工作体验 #

332347次浏览 1439人参与

# 牛油的搬砖plog #

207576次浏览 1337人参与

# 什么专业适合考公 #

73473次浏览 476人参与

# AI Coding实战技巧 #

32058次浏览 400人参与

# 实习工作，你找得还顺利吗？ #

597355次浏览 6758人参与

# 求职遇到的搞笑事件 #

192920次浏览 962人参与

# 运营每日一题 #

147666次浏览 981人参与

# 小厂实习有必要去吗 #

95197次浏览 453人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务