奶茶加冰不加糖会死星人

03-24 03:30 门头沟学院推荐算法

关注

字节大模型算法一面（好难

攒攒人品！有面试过同岗的朋友欢迎评论区交流
1. 在单次 Prompt 中产出 52 个标签，如何从信息论角度评估 Output Logits 的熵增问题？你是如何规避标签之间由于自回归生成顺序导致的潜在因果偏置的？
2. DeepSeek R1 的思维链极长，但在地图离线生产中，长 Token 意味着巨大的显存驻留。你如何设计一套 KV-Cache 压缩或分段预处理方案，确保推理吞吐量不随思维链增长而线性坍塌？
3. 针对价格敏感度这类缺乏强真值的标签，你构建的 Teacher-Student 蒸馏体系中，如何量化教师模型的知识毒素对小模型产生的负面增量？
4. 在 SFT 阶段，如果 52 个标签的分布极度不均，你如何在 Loss Function 中设计动态权重，防止模型退化为只预测高频标签的大样本分类器？
5. 你是如何实现硬逻辑约束，而非仅仅依靠提示词里的负向指令？如何证明这种干预不会破坏 LLM 的预训练分布？
6. 对于 4B 规模的轻量化模型，其语义对齐空间有限。当 52 个标签存在跨域干扰时，你是否尝试过什么思路进行指令微调？
7. 如何处理 LLM 在推理长行为序列时的注意力稀疏问题？对于超过 32k 长度的原始轨迹描述，你如何保证模型对序列中部的关键到访点依然保持高召回？
8. 在数据飞轮闭环中，若利用 R1 生成的银标进行迭代，如何防止模型产生自我崩溃
9. 日均 100 亿条定位数据，DBSCAN 的空间索引在处理高密度热点区域时会产生明显的计算热点，怎么解决这种热点问题
10. 室内定位的 WIFI 指纹具有极强的时间非平稳性，你解决商场内路由器变更导致的特征分布偏移？

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

通过面试了吗

点赞回复分享

发布于 03-26 22:56 北京

哈哈哈，你是老六

门头沟学院大数据开发工程师

可以的，最后通过了吗

点赞回复分享

发布于 03-26 22:56 北京

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉问的真的多啊

点赞回复分享

发布于 03-25 22:54 北京

门头沟学院后端工程师

夸张的难度

点赞回复分享

发布于 03-25 14:35 浙江

04-12 11:46

北京航空航天大学 Java

🎯【字节跳动 2026 年 2 月三面真题】面向大规模分布式训练的数据预处理与采样服务

面试轮次：三面岗位：AI平台研发/机器学习平台工程师难度：⭐⭐⭐⭐⭐📝面试题“为大规模分布式模型训练（如千卡级别训练ERNIE 4.0）设计一个高性能、可扩展的数据预处理与采样服务。要求：1️⃣ 能从海量（PB级）原始日志/文本中，实时清洗、去重、标准化，生成训练样本；2️⃣ 支持复杂的采样策略（如按热度负采样、难例挖掘）；3️⃣ 服务需以高吞吐（>10W样本/秒/节点）向训练集群供给数据，并保证全局采样分布的一致性。给出架构设计、核心数据处理流水线，并解决数据倾斜与背压问题。”💡解析：AI工业化生产的“数据引擎”💻 这道题直击AI工业化生产的核心——数据流水线。它要求构建一个从原...

字节跳动真题详解+代码+...

点赞评论收藏

分享

04-03 19:34

中山大学全栈开发

有没有了解字节Data推荐架构for抖音的友友？

最近拿了这个岗的暑期实习请教一下团队氛围，技术，工作内容之类的东西

字节跳动公司氛围 1113人发布

点赞评论收藏

分享

03-31 18:23

中国矿业大学（北京） Web前端

分享三个不那么常见的字节/快手前端手撕题

1. 判断一个对象是否是 Promise（使用TypeScript）面试写法 function isPromise<T = any>(val: any): val is Promise<T> { return ( val !== null && (typeof val === 'object' || typeof val === 'function') && typeof val.then === 'function' ) } 面试讲解要点核心标准不是 instanceof Promise Promise 的本质：thenable（拥有 ...

前端面试准备&技...

点赞评论收藏

分享

03-31 10:10

陕西理工大学算法工程师

小红书大模型实习一面

给我面没招了，发点面经攒攒人品～1. 项目拷打2. Embedding优化- 如何通过预训练/微调提升效果？对比过哪些模型- 参数量与效果的关系？是否尝试过蒸馏或量化？3. RAG车端项目- Pipeline中如何解决低延迟问题？Intent分类的标签体系设计逻辑- Rewriter是否引入强化学习？如何评估改写后的query质量？4. LLM对Embedding的影响- LLM的文本理解能力是否降低了对传统Embedding模型的依赖？举例说明。- 大模型在传统任务（如文本分类）未涌现的原因？（数据分布/任务形式差异）5. LeetCode：卡塔兰数推导（递归公式 + 动态规划实现）

查看8道真题和解析

点赞评论收藏

分享

03-29 00:13

广西大学算法工程师

阿里 AI Agent 开发二面

1. 大语言模型的 RLHF 训练流程是什么，它存在哪些潜在风险RLHF 一般分三步。第一步是 SFT，用高质量指令数据把基座模型调成能听懂任务、按格式回答的模型。第二步是训练奖励模型，把人工偏好数据整理成 chosen 和 rejected 形式，让奖励模型学会判断两个回答哪个更好。第三步是强化学习优化，最经典的是 PPO，让当前策略在奖励更高的方向上更新，同时用 KL 约束避免模型偏离初始策略太远。它的风险主要在三个地方。第一，奖励模型可能学偏，模型最后学到的是“讨好奖励模型”而不是真正更有帮助。第二，强化学习阶段如果约束不够，模型容易出现 reward hacking，看起来分数高，但真...

AI-Agent面试实战...

点赞评论收藏

分享

评论

2

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

34662次浏览 433人参与

# 大学生该如何认清当下的就业环境？ #

162420次浏览 888人参与

# 有哪些公司在面试时考察AICoding？ #

19346次浏览 349人参与

# 运营来爆料 #

98815次浏览 508人参与

# HR面都在聊什么？ #

13767次浏览 163人参与

# 美团开奖 #

407794次浏览 1805人参与

# 26届春招投递记录 #

3637次浏览 42人参与

# 百度工作体验 #

325420次浏览 2247人参与

# 想从事Agent应该学习哪些技术？ #

8576次浏览 288人参与

# 实习学到最有价值的工作习惯 #

69639次浏览 552人参与

# OPPO求职进展汇总 #

809059次浏览 5441人参与

# 校招生月薪1W算什么水平 #

143438次浏览 493人参与

# 你觉得什么岗位会被AI替代 #

57248次浏览 371人参与

# 从投递到OC，你用了多久 #

23828次浏览 240人参与

# 什么人最适合大厂？ #

12772次浏览 133人参与

# 父母问你工作找得怎么样，怎么回 #

23120次浏览 284人参与

# 哪些公司面试还在问八股？ #

14107次浏览 125人参与

373906次浏览 2921人参与

# 我与AI的日常 #

3272次浏览 16人参与

# 我的求职进度条 #

1115172次浏览 8049人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务