联想算法一面二面面经
1. 项目(背景+亮点+负责的内容+面对问题怎么解决+为啥用这个技术解决+训练数据量+gpu数量和训练时长+业务人员组成)
2. 有了解什么kv优化方法吗
3. deepseek r1有的什么注意力优化?
4. transformer结构介绍?
5. 现在主流大模型架构有什么变化?
6.grpo的改进方法有哪些?了解gspo吗?
7. hrbp业务理解题:你觉得实习项目中某个点有什么更好的实现方式?这样做优缺点是啥?
8. code:手撕mha,进一步问在哪加masked矩阵
2. 有了解什么kv优化方法吗
3. deepseek r1有的什么注意力优化?
4. transformer结构介绍?
5. 现在主流大模型架构有什么变化?
6.grpo的改进方法有哪些?了解gspo吗?
7. hrbp业务理解题:你觉得实习项目中某个点有什么更好的实现方式?这样做优缺点是啥?
8. code:手撕mha,进一步问在哪加masked矩阵
全部评论
相关推荐
查看8道真题和解析 点赞 评论 收藏
分享