京东大模型算法日常实习一面
1. 实习介绍
2. 看了今年哪些生成式推荐论文,答onerec了
3. 然后聊了半小时onerec,重点在多模态tokenizer和语义id
4. 拷打简历项目(infonce的温度系数作用,faiss ANN索引,正负样本,特征工程,推理测评指标等)
5. RoPE和ALiBi两种相对位置编码的原理
6. SwiGLU原理,比relu好在哪
7. attention常规八股(根号dk,时间复杂度,为什么要分多头)
8. 用过哪些大模型微调方式,LoRA微调原理
9. 了解模型蒸馏吗
10. 了解目前主流多模态模型吗,扩散模型公式怎么推导的
11. 手撕: lc53 最大子数组和改为求出这个子数组
2. 看了今年哪些生成式推荐论文,答onerec了
3. 然后聊了半小时onerec,重点在多模态tokenizer和语义id
4. 拷打简历项目(infonce的温度系数作用,faiss ANN索引,正负样本,特征工程,推理测评指标等)
5. RoPE和ALiBi两种相对位置编码的原理
6. SwiGLU原理,比relu好在哪
7. attention常规八股(根号dk,时间复杂度,为什么要分多头)
8. 用过哪些大模型微调方式,LoRA微调原理
9. 了解模型蒸馏吗
10. 了解目前主流多模态模型吗,扩散模型公式怎么推导的
11. 手撕: lc53 最大子数组和改为求出这个子数组
全部评论
相关推荐
点赞 评论 收藏
分享
华为HUAWEI工作强度 1304人发布