技术蓄力中

02-05 19:30 北京大学算法工程师

关注

字节大模型算法一面分享

整体面试还是不错的，但是没后续了...
1、项目介绍
2、Transformer结构理解
请详细说明Transformer的整体架构及其核心组成部分。
3、Attention机制问题
为什么Attention公式中要除以√dk？这个操作有什么作用？
Transformer训练过程中为什么容易出现梯度消失或爆炸问题？
4、SFT实践问题
在监督微调(SFT)过程中遇到过哪些典型问题？请分享您的解决方案和实践经验。
5、领域数据配比问题
在构建领域大模型时，如何确定不同领域数据的配比比例？有哪些考量因素？
6、Decoder-only架构问题
为什么当前主流LLM都采用Decoder-only架构？这种结构相比Encoder-Decoder有哪些优势？
7、优化器相关问题
ADAM优化器相比SGD有哪些改进？
请简要说明梯度下降的原理
ADAM是如何在SGD基础上进行优化的？
8、代码题
给定一个元素互不相同的整数数组nums，编写函数返回其所有可能的子集（幂集）。
示例：
输入：nums = [1,2,3]
输出：[[],[1],[2],[3],[1,2],[1,3],[2,3],[1,2,3]]

全部评论

推荐最新楼层

02-05 21:35

浙江大学算法工程师

26实习淘天大模型二面凉凉

给我面没招了，感觉自己好菜、面试很难，还是要多多练习，感觉自己说不明白业务逻辑1.实习介绍2.了解 Transformer 吗，编码器和解码器的注意力有什么区别3.后来有哪些比较经典的基于 Transformer 的语言模型，Qwen 相比于原始Transformer有哪些结构上的改动4. 了解 RLHF 吗，DPO 和 PPO 有什么区别，Loss 是什么样的，各自的优缺点是什么5.介绍一下 CLIP，还了解什么其他的对比学习方法6.开放题:了解哪些多模态大模型，目前多模态大模型最大的问题是什么7.代码:1143.最长公共子序列

查看7道真题和解析

点赞评论收藏

分享

02-05 09:20

浙江大学算法工程师

字节实习大模型一面凉经 43min

1. 实习介绍2. 项目拷打3. 标准RAG有什么问题？4. 了解Agent吗？把RAG做成Agent有什么好处5. 说一下LoRA的原理；LoRA完推理的时候要挂着Adaptor吗？6. 手撕代码：torch写SFT的loss计算代码（注意shift right）面试官对技术了解很深入，问得都是技术细节，感觉比我自己更了解我的项目，给我面没招了...

查看6道真题和解析

点赞评论收藏

分享

02-04 16:13

门头沟学院算法工程师

字节大模型算法面试

字节抖音风控部门大模型算法一面1.自我介绍（论文、实习、项目）2.拷打项目（问的很细，占据主要面试时间）3.实习介绍4.讲讲dpo与kto的区别5.grpo的非规则奖励如何设计6.两道medium力扣

查看6道真题和解析

点赞评论收藏

分享

02-04 15:15

西安交通大学算法工程师

字节大模型算法一面凉经-日常实习

1. 项目和八股介绍一下你做的这个项目为什么没有用 nsp，只用了 mlm分析一下transformer训练过程中显存占用和计算复杂度- 优化器 参数 梯度- 面试官说到：激活值也需要保存  训练过程中怎么去做到对激活值的显存占用，有什么参数可以进行控制 （答了混合精度，面试官说不对- 激活显存 ≈ `batch_size × seq_len × hidden_dim × n_layers × bytes_per_element`- 设置bs相关，也就是使用梯度检查点（Gradient Checkpointing），将大的bs分割成小的micro-bs来计算，最后进行一个统一PPO DPO GRPOclip可以限制分布差异  还有哪些方法KL 散度公式2. 手撕给定两个叶子节点，在二叉树中找到两个节点的最近公共祖先，空间复杂度要求o(1)。每个节点存在指向父节点指针

查看8道真题和解析

点赞评论收藏

分享

02-01 14:27

中山大学算法工程师

字节大模型算法面经

1.拷打论文、竞赛2.对强化学习训练有什么了解吗？3.如果有一个对话任务，没有固定答案，该怎么选RL训练策略4.讲一讲GRPO的原理，优劣以及后续改进5.预训练和SFT的loss计算差异？6.Qwen3相比前代有什么改进？7.目前LLM领域关注到哪些最新进展？8.手撕：最长公共子序列📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

查看7道真题和解析

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 在大厂上班是一种什么样的体验 #

10439次浏览 131人参与

# 你认为工作的意义是什么 #

249112次浏览 1498人参与

# 程序员找工作至少要刷多少题？ #

18073次浏览 246人参与

# 为了减少AI幻觉，你注入过哪些设定？ #

4407次浏览 147人参与

# 我现在比当时_，你想录用我吗 #

8575次浏览 111人参与

# 机械人避雷的岗位/公司 #

43317次浏览 298人参与

# 一张图晒一下你的AI员工 #

4910次浏览 113人参与

# 论秋招对个人心气的改变 #

10580次浏览 154人参与

# 关于春招/暑期实习，你想知道哪些信息？ #

7297次浏览 119人参与

# 刚入职的你踩过哪些坑 #

6676次浏览 127人参与

# AI Coding的使用心得 #

4536次浏览 101人参与

# 晒晒你司的新年福利 #

8355次浏览 104人参与

# 牛客AI体验站 #

6616次浏览 185人参与

# 12306一秒售罄，你抢到回家的票了吗？ #

1890次浏览 47人参与

# 柠檬微趣工作体验 #

14762次浏览 83人参与

# 总结:哪家公司面试体验感最差 #

92947次浏览 430人参与

# 程序员能干到多少岁？ #

8460次浏览 115人参与

# 你认为小厂实习有用吗？ #

117991次浏览 679人参与

# 互联网公司评价 #

485509次浏览 4109人参与

# 应届生进小公司有什么影响吗 #

118242次浏览 1159人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务