面壁智能大模型一面

手撕:MHA 自我介绍+项目提问约30分钟 涉及八股: Sft的损失函数怎样计算 grpo相对于ppo的改进 grpo的缺点以及改进算法 介绍几种并行训练方式(tp.pp等)哪一种最常用 训练的前向和后向过程中有哪些中间值是fp32,哪些是fp16 场景题: 一个2b的小模型,要想提高其在运算方面的数学能力,怎么设计训练方式?
全部评论
同学,瞅瞅我司,医疗独角兽~ 我的主页最新动态,绿灯直达,免笔试~
1 回复 分享
发布于 今天 09:11 广东

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务