秋招面经-京东算法一面

1.llm项目深挖
2.PPO和DPO GRPO的区别
3.on policy和off policy的区别
4.R1的创新点和优化点
5.介绍常见的位置编码
6.介绍MLA和kv cache
7.介绍deepspeed
8.llm推理的框架
9.vllm的原理
10.怎么算ndcg和f1 score

coding:三数之和
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务