智谱Ai infra一面面经

发一下问题给大家参考,攒攒人品!
1.实习拷打
2.简述一下minmax和percentile有什么不同?
3.你还知道什么其他校准算法吗?回答kl和mse,简单讲了一下中心思想
4.在上家公司做vla的量化的时候说用了smoothquant,awq。按照量化粒度说明一下smoothquant是做的什么粒度的?了解gptq吗?他们分别的作用流程
5.上家公司一般量化到什么格式,聊到fp8,nvfp4
6.nvfp4的原理是什么样的,怎么做缩放的,在哪个维度缩放?保存的格式等
7.per-tensor/channel/group,哪个粒度更细?
8.代码实现一下minmax和percentile
全部评论

相关推荐

今天 16:28
已编辑
湖南工商大学 Java
为了实习付出一切:那你就和她说明天你也要面试,没空
点赞 评论 收藏
分享
UtopianYou...:这个简历排版真的不太行哦,去找免费的或者花点小钱,把排版弄整齐一点吧,看着舒服。
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务