字节 算法 一二三面 面经


一面:
1. QK的放缩因子
2. decoder的mask层是如何设计的
3. 为什么需要多头注意力
4. transformer的Position-wise Feed-Forward Networks为什么需要降维升维。
5. 过拟合、欠拟合怎么处理

笔试:[1,2,3,4,54,56,5] 不能相隔偷,最多能投多少

二面:
1.encoder层介绍一下。
2.dropout介绍一下,训练和推理有什么区别。
3.dropout、normalazation、激活函数的先后顺序。


三面:
先笔试:
括号匹配,三数之和组合数
1.MMoE伪代码
2.attention,相关系数,交叉熵伪代码
3.loss weight调参的经验
4.attention的踩坑经验
5.不确定性加权怎么做,为什么不work。

许愿HR面!!许愿!!!



#字节跳动秋招提前批##面经##字节跳动#
全部评论
希望楼主成功
1 回复 分享
发布于 2021-08-23 16:58
想请教下博主,算法岗笔试是4道编程吗?
点赞 回复 分享
发布于 2021-08-27 14:38
谈钱了吗
点赞 回复 分享
发布于 2021-08-26 11:57
哪个bg
点赞 回复 分享
发布于 2021-08-26 00:22
想问问hr面会问些啥
点赞 回复 分享
发布于 2021-08-24 13:28

相关推荐

2025-12-28 16:32
重庆邮电大学 Java
程序员花海:1.技能放最后,来面试默认你都会,技能没啥用 2.实习写的看起来没啥含金量,多读读部门文档,包装下 接LLM这个没含金量 也不要用重构这种 不会给实习生做的 3.抽奖这个还是Demo项目,实际在公司里面要考虑策略,满减,触发点,触发规则 库存 之类的,不是这个项目这么简单 4.教育背景提前,格式为 教育背景 实习 项目 技能 自我评价
简历被挂麻了,求建议
点赞 评论 收藏
分享
2025-12-31 18:42
复旦大学 Java
点赞 评论 收藏
分享
评论
2
26
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务