字节大模型算法实习一面 75min
1.自我介绍
2.LoRA 的 rank, alpha, dropout 参数及设置原因
3.Reward Model 的训练(公式解释)
4.Log Likelihood Loss 公式
5.最长公共子序列(LCSS)优化
6.反问环节
2.LoRA 的 rank, alpha, dropout 参数及设置原因
3.Reward Model 的训练(公式解释)
4.Log Likelihood Loss 公式
5.最长公共子序列(LCSS)优化
6.反问环节
全部评论
相关推荐
02-03 23:22
辽宁科技大学 Python 点赞 评论 收藏
分享
