阶跃大模型算法实习一面凉经

希望发出来对大家有帮助!
1. 详细讲一下tokenizer的过程
2. sft具体是怎么实现的
3. deepspeed,什么情况用zero1-3?
4. qwen,llama这些模型modeling的代码是怎么实现的?
5. 用大模型合成问题怎么才能保证合成的问题答案是对的?
6. 怎么判断预训练模型的好坏
7. 怎么构造高质量的数据
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 昨天 10:05 广东
感觉似乎没问啥东西呢
点赞 回复 分享
发布于 昨天 18:53 北京

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务