字节大模型算法一面 难死了...

给我面没招了,发点面经攒攒人品~
1.项目拷打
2.实习拷打
3.像那种rl里面的那个MOE之类的那种的优化有去做过吗
4.看您的训练经验比较丰富,而且您上线运行的推理内容之前也进行过一些什么样的优化吗?
5.有没有做过 kernel级别的优化?比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化,介绍一下
6像底层,如果你们在做.kernel fusion,倾向于用什么方式来做
7.有没有哪次你做了 fusion 结果性能反而下降的?原因是什么
8.平时写 CUDA的时候,有没有关注到底层实现细节?比如你刚提到 FA2,那再往下一层,像 Hopper架构里那个 warp specialization是什么,它底层大概是怎么实现的
9.试过用 Agent去生成cuda内核么,怎么去做的
10.如果我把 warp specialization 去掉,只保留 tile 和 shared memory 优化,大概会损失在哪?
11.怎么么判断一个 MoE 模型是真的学到了分工,而不是只是把 dense模型拆开了
12.在 RL + MoE 里,有没有遇到过 reward把 routing学坏的情况?就是模型为了拿 reward,全都走某几个 expert,这种情况你当时是怎么处理的
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
正在热议
更多
# 春招至今,你的战绩如何? #
11166次浏览 95人参与
# 你的实习产出是真实的还是包装的? #
1976次浏览 42人参与
# MiniMax求职进展汇总 #
24134次浏览 309人参与
# 军工所铁饭碗 vs 互联网高薪资,你会选谁 #
7656次浏览 43人参与
# 简历第一个项目做什么 #
31761次浏览 341人参与
# 重来一次,我还会选择这个专业吗 #
433583次浏览 3926人参与
# 巨人网络春招 #
11381次浏览 223人参与
# 当下环境,你会继续卷互联网,还是看其他行业机会 #
187235次浏览 1122人参与
# 牛客AI文生图 #
21453次浏览 238人参与
# 不考虑薪资和职业,你最想做什么工作呢? #
152480次浏览 888人参与
# 研究所笔面经互助 #
118978次浏览 577人参与
# 简历中的项目经历要怎么写? #
310397次浏览 4220人参与
# AI时代,哪些岗位最容易被淘汰 #
63899次浏览 828人参与
# 面试紧张时你会有什么表现? #
30521次浏览 188人参与
# 你今年的平均薪资是多少? #
213162次浏览 1039人参与
# 你怎么看待AI面试 #
180188次浏览 1258人参与
# 高学历就一定能找到好工作吗? #
64340次浏览 620人参与
# 你最满意的offer薪资是哪家公司? #
76557次浏览 374人参与
# 我的求职精神状态 #
448159次浏览 3129人参与
# 正在春招的你,也参与了去年秋招吗? #
363553次浏览 2638人参与
# 腾讯音乐求职进展汇总 #
160687次浏览 1112人参与
# 校招笔试 #
471293次浏览 2964人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务