阶跃大模型算法实习一面凉经
希望发出来对大家有帮助!
1. 详细讲一下tokenizer的过程
2. sft具体是怎么实现的
3. deepspeed,什么情况用zero1-3?
4. qwen,llama这些模型modeling的代码是怎么实现的?
5. 用大模型合成问题怎么才能保证合成的问题答案是对的?
6. 怎么判断预训练模型的好坏
7. 怎么构造高质量的数据
1. 详细讲一下tokenizer的过程
2. sft具体是怎么实现的
3. deepspeed,什么情况用zero1-3?
4. qwen,llama这些模型modeling的代码是怎么实现的?
5. 用大模型合成问题怎么才能保证合成的问题答案是对的?
6. 怎么判断预训练模型的好坏
7. 怎么构造高质量的数据
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV

感觉似乎没问啥东西呢
相关推荐

查看5道真题和解析