阶跃大模型算法实习一面凉经
希望发出来对大家有帮助!
1. 详细讲一下tokenizer的过程
2. sft具体是怎么实现的
3. deepspeed,什么情况用zero1-3?
4. qwen,llama这些模型modeling的代码是怎么实现的?
5. 用大模型合成问题怎么才能保证合成的问题答案是对的?
6. 怎么判断预训练模型的好坏
7. 怎么构造高质量的数据
1. 详细讲一下tokenizer的过程
2. sft具体是怎么实现的
3. deepspeed,什么情况用zero1-3?
4. qwen,llama这些模型modeling的代码是怎么实现的?
5. 用大模型合成问题怎么才能保证合成的问题答案是对的?
6. 怎么判断预训练模型的好坏
7. 怎么构造高质量的数据
全部评论
相关推荐
03-08 17:29
Universiti Kebangsaan Malaysia 运营 点赞 评论 收藏
分享