联想算法一面二面面经
1. 项目(背景+亮点+负责的内容+面对问题怎么解决+为啥用这个技术解决+训练数据量+gpu数量和训练时长+业务人员组成)
2. 有了解什么kv优化方法吗
3. deepseek r1有的什么注意力优化?
4. transformer结构介绍?
5. 现在主流大模型架构有什么变化?
6.grpo的改进方法有哪些?了解gspo吗?
7. hrbp业务理解题:你觉得实习项目中某个点有什么更好的实现方式?这样做优缺点是啥?
8. code:手撕mha,进一步问在哪加masked矩阵
2. 有了解什么kv优化方法吗
3. deepseek r1有的什么注意力优化?
4. transformer结构介绍?
5. 现在主流大模型架构有什么变化?
6.grpo的改进方法有哪些?了解gspo吗?
7. hrbp业务理解题:你觉得实习项目中某个点有什么更好的实现方式?这样做优缺点是啥?
8. code:手撕mha,进一步问在哪加masked矩阵
全部评论
佬,我想请问一下,你是远程面试吗?是用Teams?
相关推荐
02-05 13:16
南京邮电大学 Java 等闲_:其实agent开发和语言没关系,只要能稳定落地可观测,有业务价值的agent就是好agent,而各种语言的agentkit是企业基建必要的,是一些maas平台的agent模块的重要组成,需要提供零代码的能力让M端的同***营agent,所以不要过于纠结这些,真正要看的是模型工程化这整条链路,能做什么,怎么做更方便
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
