字节tiktok搜索算法一面凉经
整体面试还是不错的,但是没后续了,不知道是哪里出了问题
项目拷打
八股
1.transformer结构
2.有哪些归一化的方式,layernorm和batchnorm的区别
3.prenorm和postnorm的区别
4.了解flash attention吗
5.现在大模型里的量化方案一般是什么水平
6.pertoken和perchannel的量化有什么区别
7.接触过fp8量化吗
手撕
给n个数,找位置k,使前k个数+后n-k个数的方差最小
项目拷打
八股
1.transformer结构
2.有哪些归一化的方式,layernorm和batchnorm的区别
3.prenorm和postnorm的区别
4.了解flash attention吗
5.现在大模型里的量化方案一般是什么水平
6.pertoken和perchannel的量化有什么区别
7.接触过fp8量化吗
手撕
给n个数,找位置k,使前k个数+后n-k个数的方差最小
全部评论
相关推荐
昨天 21:06
新疆大学 Java 点赞 评论 收藏
分享
查看12道真题和解析 点赞 评论 收藏
分享
04-09 10:39
University of Huddersfield Java 点赞 评论 收藏
分享
快手公司氛围 688人发布