发一下问题给大家参考,攒攒人品!1.实习拷打2.简述一下minmax和percentile有什么不同?3.你还知道什么其他校准算法吗?回答kl和mse,简单讲了一下中心思想4.在上家公司做vla的量化的时候说用了smoothquant,awq。按照量化粒度说明一下smoothquant是做的什么粒度的?了解gptq吗?他们分别的作用流程5.上家公司一般量化到什么格式,聊到fp8,nvfp46.nvfp4的原理是什么样的,怎么做缩放的,在哪个维度缩放?保存的格式等7.per-tensor/channel/group,哪个粒度更细?8.代码实现一下minmax和percentile