字节tiktok搜索算法一面凉经

整体面试还是不错的,但是没后续了,不知道是哪里出了问题
项目拷打
八股
1.transformer结构
2.有哪些归一化的方式,layernorm和batchnorm的区别
3.prenorm和postnorm的区别
4.了解flash attention吗
5.现在大模型里的量化方案一般是什么水平
6.pertoken和perchannel的量化有什么区别
7.接触过fp8量化吗
手撕
给n个数,找位置k,使前k个数+后n-k个数的方差最小
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务