大模型算法日常实习二面-字节

攒人品中~
1.  项目里最核心的贡献是什么?怎么评估效果?
2.  对比学习中如果负样本和正样本拉不开距离(或太像了),你会怎么修改损失函数或采样策略?
3.  FlashAttention 原理:跟普通 Attention 的差异是什么?实现里 $QK^T$、Softmax、$PV$ 这几步是怎么落地的?
4.  分布式框架3D 并行与通信:怎么理解 DP/DDP?通信瓶颈一般卡在哪些环节?
5.  14B 模型,FP16 权重大概多大?训练时还要加哪些开销?如果用INT8 大概能省多少显存?
6.  `torch.contiguous()` 是干嘛的?为什么推理阶段在意内存连续性?
7.  代码题:井字棋判胜:读取 txt 井字棋(3×3)状态,判断当前玩家是否获胜。
8.  代码题:交叉熵损失:解释原理并手写实现。
9.  代码题:线性回归 SGD:推导更新公式并手写实现。
全部评论

相关推荐

03-11 09:14
已编辑
武汉大学 后端工程师
24年6-8月,我的大三暑假,在鹅厂pcg度过了一段难忘的实习时光。那年的面试很顺利,一共面了3家offer了2家,进了组之后同事们都很好,mt是我的校友,至今仍然保持良好关系。后来我放弃了转正机会,因为觉得保研名额来之不易,我觉得硕士毕业后一定可以有更好的工作,更高的工资。可是之后发生的一切却让我始料未及。一年半过去,我会的东西变多了,却从1月起再难以通过任何一家公司的一场面试。目前的我有客户端的实习经历,有后端的知识储备,有agent相关的项目履历,且因研究生阶段师兄带着做科研对大模型相关的知识也有一定的了解。力扣刷了500题,说多不多,说少不少,反正把hot100和灵神题单1700分以下的都做了遍。但为什么自己就是通不过面试呢?客观分析的话有自己不够专精某一方面的因素,每次面试刚开始被问一个点的时候刚开始还OK,面试官接着深入拷打,我就没啥办法了,临场应变能力也不行。说白了:BFS❤️;DFS💔。另外就是自己没有一套很好的学习体系,总是拆东墙补西墙,因为某次面试被拷打项目,就疯狂准备项目相关的知识,忽略了计算机基础,结果下周的另一场面试被面试官计网OS一通轰炸。说了这么多,聊聊我目前的状态吧。很多大厂最近都开放了春招实习的投递,我目前采取的是海投策略。这周的Timeline大概就是周四要再次征战鹅厂,wxg的面试强度想必大家都了解,我也没有抱希望能过,以学习为主吧。周六的团子笔试应该可以试一下,毕竟有两次机会,而且貌似团子不咋看笔试分数?蚂蚁也发了笔试邀请,但因为阿里系今年笔试的改革,打算观望一下第一场的情况再参加。对自己下阶段的期望,就是不要怀疑自身的能力,然后客观评估自己当前的水准,持续进步。感谢大家能看完哥们的碎碎念,祝各位牛友都早日拿到理想offer,我后面也会持续更新自己的面试记录,也欢迎大家来一起交流呀
钱嘛数字而已:"后来我放弃了转正机会,因为觉得保研名额来之不易"--- 转正机会明显比保研名额更来之不易。从保研的比例和大厂offer的通过率,非常容易判断。
今天你投了哪些公司?
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务