【25年7月最新大模型面经+答案】网易大模型后训练算法一面面经
【更多内容移步小红书~】
1.问项目
2.问grpo ppo dpo 的演变
3.手撕transformer
4.手撕最短编辑距离
5.八股,attention不除以根号d会有什么后果。梯度消失。
6.反问业务,
1.问项目
2.问grpo ppo dpo 的演变
3.手撕transformer
4.手撕最短编辑距离
5.八股,attention不除以根号d会有什么后果。梯度消失。
6.反问业务,
全部评论
相关推荐
点赞 评论 收藏
分享
09-19 13:59
门头沟学院 Java 点赞 评论 收藏
分享
09-28 17:54
云南大学 C++ 点赞 评论 收藏
分享