字节抖音大模型算法面经-攒人品
发一下问题给大家参考,有面试过同岗的朋友欢迎评论区交流
1.大模型从头到尾的训练过程
2.grpo算法优势在哪里 相较于ppo
3.为什么去掉valuemodel了解他的损失函数么
4.GAE是在做什么 grpo最大的改进是什么
5.agent的定义是什么
6.rag项目中你的例子库是用什么办法匹配的
7.算法题:手撕 MHA
8.算法题:一道改编的动态规划
9.算法题:求一个n分解成k个数字的和如何使得这k个数字的乘积最大
1.大模型从头到尾的训练过程
2.grpo算法优势在哪里 相较于ppo
3.为什么去掉valuemodel了解他的损失函数么
4.GAE是在做什么 grpo最大的改进是什么
5.agent的定义是什么
6.rag项目中你的例子库是用什么办法匹配的
7.算法题:手撕 MHA
8.算法题:一道改编的动态规划
9.算法题:求一个n分解成k个数字的和如何使得这k个数字的乘积最大
全部评论
相关推荐
查看12道真题和解析