百度 LLM算法一面 想当空中飞人了..
面试很难,还是要多多练习...
1.GSPO相对于GRPO最大的区别是什么?
2.LoRA在初始化的时候,有什么特殊设定?
3.LoRA实际训练时,base模型的参数是固定不变的吗?
4.LoRA中A和B都设置成0可以吗?
5.LoRA中A和B都设置成0时,求梯度的时候一直都是0吗?
手撕
6.给定一个数组,求其中逆序对的个数。
7.给定一个包含正数和负数的数组,求其中连续子数组的最大乘积。
1.GSPO相对于GRPO最大的区别是什么?
2.LoRA在初始化的时候,有什么特殊设定?
3.LoRA实际训练时,base模型的参数是固定不变的吗?
4.LoRA中A和B都设置成0可以吗?
5.LoRA中A和B都设置成0时,求梯度的时候一直都是0吗?
手撕
6.给定一个数组,求其中逆序对的个数。
7.给定一个包含正数和负数的数组,求其中连续子数组的最大乘积。
全部评论
相关推荐

查看5道真题和解析