百度LLM算法一面挂
项目拷打
1.grpo和gspo等老生常谈问题
2.sft和rl的区别与理解
3.如果想改变某个商品名称,采用sft还是rl?为什么?
4.moe模型和dense模型区别
5.moe模型结构
6.moe的优缺点
手撕 非hot100 求解开根号(精度1e-5)
1.grpo和gspo等老生常谈问题
2.sft和rl的区别与理解
3.如果想改变某个商品名称,采用sft还是rl?为什么?
4.moe模型和dense模型区别
5.moe模型结构
6.moe的优缺点
手撕 非hot100 求解开根号(精度1e-5)
全部评论
如果想改变某个商品名称,采用sft还是rl咋回答的
相关推荐
查看6道真题和解析