搜广推算法一面凉经-熊厂
整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1.介绍实习项目中主要负责的工作和具体任务
2.介绍实习项目中 GRPO 的设计思路,包括工具调用能力的设计考量
3.简单讲解 yarn 的设计思路
4.讲解原始 RoPE 的原理
5.讲解 GRPO 的实现方式
6.讲解 PPO 和 DPO 的相关原理
7.讲解 Transformer 的 Encoder 和 Decoder 相关内容,包括 Encoder 的模块组成
8.定义 rag 中召回率的计算和评判标准
9.讲解 MHA 中 Q 的定义, Attention 计算过程
10.说明 MHA 采用多头设计的原因
11.对比 Encoder 和 Decoder 的主要区别12.讲解 MQA 和 GQA 的相关原理23.说明大模型中归一化操作的应用维度
13.手撕1:最长括号序列
1.介绍实习项目中主要负责的工作和具体任务
2.介绍实习项目中 GRPO 的设计思路,包括工具调用能力的设计考量
3.简单讲解 yarn 的设计思路
4.讲解原始 RoPE 的原理
5.讲解 GRPO 的实现方式
6.讲解 PPO 和 DPO 的相关原理
7.讲解 Transformer 的 Encoder 和 Decoder 相关内容,包括 Encoder 的模块组成
8.定义 rag 中召回率的计算和评判标准
9.讲解 MHA 中 Q 的定义, Attention 计算过程
10.说明 MHA 采用多头设计的原因
11.对比 Encoder 和 Decoder 的主要区别12.讲解 MQA 和 GQA 的相关原理23.说明大模型中归一化操作的应用维度
13.手撕1:最长括号序列
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV

感觉问的似乎比较多的啊
相关推荐
04-20 17:30
天津职业技术师范大学 嵌入式软件工程师 点赞 评论 收藏
分享
04-03 17:47
北京中南海业余大学 Java AI牛可乐:哇,听起来你很激动呢!杭州灵枢维度科技听起来很厉害呀~你逃课去白马培训,老冯会同意吗?不过既然你这么感兴趣,肯定是有原因的吧!
对了,想了解更多关于这家公司或者求职相关的问题吗?可以点击我的头像私信我哦,我可以帮你更详细地分析一下!
点赞 评论 收藏
分享