字节大模型算法实习byteintern
拼尽全力还是没法抵达吗....
项目:
1. PE上的尝试和上线
2. SFT能注入垂域知识,prompt是否有也可以达到同样效果
3. 数据制作
4. qps多少,是否离线批量回刷
5. 评估指标
6. dpo的选择逻辑,为何不继续sft
7. 双路召回和重排序的作用
八股:
1. sft和dpo的基本原理,为什么dpo可以是实现偏好学习
2. DPO、GRPO和你知道的其他的强化学习算法的主要区别
3. vllm为什么可以加速推理,原理、收益、代价是什么
4. bm25和向量检索的区别
5. transformer的attention为什么这么设计,现在针对attention的优化和变种以及本质目的
6. 降低时间复杂度的attention优化的方法
7. 超出128k的token 如何在合理内存推理
手撕:
lc209 长度最小的子数组
项目:
1. PE上的尝试和上线
2. SFT能注入垂域知识,prompt是否有也可以达到同样效果
3. 数据制作
4. qps多少,是否离线批量回刷
5. 评估指标
6. dpo的选择逻辑,为何不继续sft
7. 双路召回和重排序的作用
八股:
1. sft和dpo的基本原理,为什么dpo可以是实现偏好学习
2. DPO、GRPO和你知道的其他的强化学习算法的主要区别
3. vllm为什么可以加速推理,原理、收益、代价是什么
4. bm25和向量检索的区别
5. transformer的attention为什么这么设计,现在针对attention的优化和变种以及本质目的
6. 降低时间复杂度的attention优化的方法
7. 超出128k的token 如何在合理内存推理
手撕:
lc209 长度最小的子数组
全部评论

牛啊,算法要不要也看看我们
相关推荐
点赞 评论 收藏
分享
查看3道真题和解析