联想算法一面二面面经

1. 项目(背景+亮点+负责的内容+面对问题怎么解决+为啥用这个技术解决+训练数据量+gpu数量和训练时长+业务人员组成)
2. 有了解什么kv优化方法吗
3. deepseek r1有的什么注意力优化?
4. transformer结构介绍?
5. 现在主流大模型架构有什么变化?
6.grpo的改进方法有哪些?了解gspo吗?
7. hrbp业务理解题:你觉得实习项目中某个点有什么更好的实现方式?这样做优缺点是啥?
8. code:手撕mha,进一步问在哪加masked矩阵
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务