滴滴27大模型算法实习一面面经
攒人品中,祝大家都能拿到满意的Offer!
1.归一化为什么不是batch
2.为什么可以用xgb
3.transformer原理结构
4.ppo和grpo的区别
5.lora原理
代码:硬币组合达到目标的最小次数,动态规划
1.归一化为什么不是batch
2.为什么可以用xgb
3.transformer原理结构
4.ppo和grpo的区别
5.lora原理
代码:硬币组合达到目标的最小次数,动态规划
全部评论
相关推荐
点赞 评论 收藏
分享