攒人品中,祝大家都能拿到满意的Offer!1.qwen模型结构2.多头注意力,怎么发挥作用3.kvcache原理作用,为什么不cache q4.vllm深入,batch长度不一样怎么批处理,block不连续访问速度变慢怎么办?5.awg对比GPTQ等等6.awqgroup size怎么设置?做没做过测试校准对比?7.LoRA参数,挂在那些层8.python浅拷贝和深拷贝9.python闭包,装饰器,变量访问10.torch detached是做什么的11.训练时oom可能什么问题12.docker fle有写过吗13.docker启动如何加载自己的目录,环境变了怎么保留配置环境?14.gitrebase,merge,冲突怎么解决,改一半不想改了怎么办15.AIGC相关了解吗