字节大模型算法校招一面
1、实习介绍
2、讲述论文内容和细节。
3、对于模型训练过程中,如果出现样本标签数据分布极其不均衡,通常会采取什么方法来解决问题。
4、transformer的感受野encoder中是可以看到所有的token的,你认为感受野越大越好还是越小越好。
5、位置编码:sin cos,正余弦,bert可学习位置编码,rope相比于正余弦编码的优势。
6、欠拟合和过拟合定义,通常如何解决?
7、transformer的位置编码的基底是10000,为什么设置10000
8、手撕:岛屿的数量。
2、讲述论文内容和细节。
3、对于模型训练过程中,如果出现样本标签数据分布极其不均衡,通常会采取什么方法来解决问题。
4、transformer的感受野encoder中是可以看到所有的token的,你认为感受野越大越好还是越小越好。
5、位置编码:sin cos,正余弦,bert可学习位置编码,rope相比于正余弦编码的优势。
6、欠拟合和过拟合定义,通常如何解决?
7、transformer的位置编码的基底是10000,为什么设置10000
8、手撕:岛屿的数量。
全部评论
相关推荐
nlhxq🌱:就这样的就业形势,这些畜牲学校领导还卡着不让去实习。人家秋招你实习,人家入职你打灰 点赞 评论 收藏
分享
01-19 12:48
门头沟学院 C++
只想搞钱的鸽子很喜欢...:混账是很多的,还有那些在自己风华正茂的年纪说风凉话讥讽那些下岗前员工的。这些人都是现在职场环境这么烂的帮凶 点赞 评论 收藏
分享

查看7道真题和解析