京东日常实习-大模型应用算法 凉经
被横向挂了,希望发出来对大家有帮助!
项目拷打+实习拷打
1. GRPO在线学习策略过程,listwise 数据如何训练reward模型。
2.MOE模型相关原理和微调经验。
3. 逆序对实现和讲解(计算逆序对时如何避免重复计算)
项目拷打+实习拷打
1. GRPO在线学习策略过程,listwise 数据如何训练reward模型。
2.MOE模型相关原理和微调经验。
3. 逆序对实现和讲解(计算逆序对时如何避免重复计算)
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
相关推荐
昨天 00:09
吉林大学 C++ 青年牛马:来了,链接在这:https://github.com/0voice/2026-Computer-Spring-Recruitment-Job-Compilation


点赞 评论 收藏
分享
查看7道真题和解析