面试很难,还是要多多练习AI coding笔试(30min一些八股:1.Attention的QKV怎么计算,WQ/WK/WV的形状2.MOE的路由机制,稀疏vs稠密3.KV Cache在prefill和decoding阶段的读写差异4.大模型幻觉怎么规避5.微调后出现复读机怎么排查6.SFT够用 vs 必须上DPO/RL怎么判断7.DPO损失函数的潜在问题8.KL散度在模型对齐里的作用9.接着问了google的TurboQuant kv cache10.项目深挖11.灾难性遗忘怎么解决等问题