美团大模型强化学习一面-实习面经

1.项目八股

1.rmsnorm ,和其他的正则化方法有什么不一样
2.flashattn
3.qwen3技术报告  哪些亮点
4.详细介绍一下 mamba
5.verl 框架了解多少,用过吗
6.llamafactory 框架用过吗
7.简述一下几种强化学习算法

2.手撕
最长公共子串
3.反问
整个部门有多少张卡
洗数据的占比会有多少
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务