1. 自我介绍+介绍论文2. attention的计算时间复杂度3. 推荐系统或者NLP领域 有什么方法可以加速attention计算4. 你了解哪些生成式推荐的论文5. 为什么要在推荐系统引入RQ-VAE6. 和VQ-VQE有什么不同7. RQ-VAE怎么解决坍塌问题8. Normalization有哪些,有什么作用9. 什么时候用batch norm什么时候用layer norm,为什么10. 训练和推理的时候的均值和方差都是怎么得到的手撕:lc331 验证二叉树的前序序列化 问复杂度,优化方法