技术蓄力中

昨天 09:20 北京大学算法工程师

关注

字节大模型校招二面面经

实习介绍——5min
项目相关细节提问——5min
1. 了解 DeepSpeed 吗？训练时用 ZeRO 优化主要是解决啥问题？ZeRO 的三个阶段分别都是啥？
2. TP 或 PP 了解吗？
3. 并行训练时，如果模型参数量不大，怎么决定用 PP 还是 TP 策略？它们各自有啥好坏？
4. 如果用 TP=2 的策略，self-attention 层里的 QKV 矩阵具体是怎么切分的？
5. 用 TP 的时候，主要会发生哪些通信？不同的切分方式会改变通信行为吗？举个例子呗。
6. 讲讲 Flash Attention 的原理，矩阵 tiling 的过程说细一点，最好把 shape 也讲清楚。
手撕算法：经典接雨水+最长上升子序列

全部评论

推荐最新楼层

12-15 10:26

门头沟学院 Java

大厂技术岗职位从夯到拉，测试拉完了

1.后端开发我觉得基本上是技术岗中的中枢职位，对接产品测试前端等等，写接口、改逻辑、修Bug，配合测试上线，基本一提到技术就有后端的身影，但很多后端开发工作CRUD或者螺丝钉的工作，有点拉，而且现在后端很卷，我感觉投递后端的人相比于其他岗位最多，竞争激烈，而且越来越看重学历，更有甚者有双非本的经历直接简历挂，所以最高学历不是双一流的，我真的不建议来卷后端，很容易直接简历挂，但后端后面社招跳槽基本都能涨薪个20~30%，还是很有发展前景的，给个顶级吧2.前端开发很多工作是切图、改色块、适配表单、联调接口，React/Vue熟练即可，UI组件库封装啥的，有点技术含量，但不难，最近gemini3很火...

计算机有哪些岗位值得去？

点赞评论收藏

分享

12-17 16:19

浙江大学 Java

MySQL 一行记录是怎么存储的？

图解数据库基础-牛客面经...

点赞评论收藏

分享

10-29 16:19

华南师范大学 Java

27后端Java想找日常实习

怎么Java日常实习这么难找的? boss投了200个，就十几个有沟通，然后就两个面还被刷了😭鼠鼠要焦虑死了😭😭😭

纯真的河老师在喝茶：第一个是这个时间点岗位少，第二个是这个简历重复度太高了，10个有9个简历差不多的

点赞评论收藏

分享

10-27 17:51

字节跳动_Seed_项目经理

姐你别这么钓鱼啊？？？？

RT 问的问题如同1w5，实际情况1500，把哥们当250.。。

点赞评论收藏

分享

12-17 16:01

浙江大学 Java

阻塞与非阻塞的区别？

图解操作系统-牛客面经八...

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# mt对你说过最有启发的一句话 #

22063次浏览 286人参与

# 机械/制造每日一题 #

79574次浏览 1407人参与

# 秋招被挂春招仍然能投的公司 #

3559次浏览 53人参与

# 你怎么看待AI面试 #

128471次浏览 724人参与

# 摸鱼被leader发现了怎么办 #

88314次浏览 590人参与

# 工作以后，你父母对你啥态度 #

21945次浏览 160人参与

# 求职遇到的搞笑事件 #

151209次浏览 882人参与

# 秋招特别不鸣谢 #

10056次浏览 141人参与

# 2025，我想...... #

80158次浏览 637人参与

# 什么是优秀的实习经历 #

4728次浏览 160人参与

# 今年秋招你收到了多少封邮件？ #

13962次浏览 178人参与

# 选实习，你更看重哪方面？ #

8174次浏览 175人参与

# 工作中遇到的歹人 #

19023次浏览 243人参与

# 工作后，你落下了哪些病根 #

8436次浏览 158人参与

# 实习简历求拷打 #

825次浏览 24人参与

# 快手求职进展汇总 #

698102次浏览 7034人参与

# 找工作有哪些冷知识 #

202546次浏览 2586人参与

# 被上班搭子“传染”了哪些习惯 #

3478次浏览 77人参与

# 工作丧失热情的瞬间 #

339253次浏览 2495人参与

# 打工人的精神状态 #

122303次浏览 1423人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务