字节大模型算法一面-实习面经 1h

1.拷打论文
2.transformer和llama的LN有什么区别,手写RMSNorm
3.FFN有什么不同,写Relu和SwiGLU
4.数据清洗流程
5.质量过滤用什么模型
6.PPL公式是什么
7.BERT的预训练任务、embedding
8.讲讲位置编码
9.你认为好的prompt的范式是什么
10.开放性问题:端到端的大模型和多个小模型,各自的优缺点是什么
11.手撕:两道
全部评论
友友,可以请教下八股看什么资料嘛
点赞 回复 分享
发布于 今天 11:44 北京

相关推荐

2025-12-29 22:46
武汉大学 Java
点赞 评论 收藏
分享
评论
2
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务