大模型预训练与微调青年研究员/研究工程师

薪资面议
龙文路129号(国际传媒港L1大楼)
2023-09-15










岗位职责
1. 参与AI大模型训练框架研发,面向内部提供混合并行、极致性能、易用好的框架;
2. 负责文本、代码,科学文献等多模态预训练模型的训练、研究和应用;
3. 调研最新技术和性能调优工具,持续提升框架的性能和易用性;
4. 开展多模态知识大模型在对话、推理的前沿研究;
5. 保持算法在工业界和学术界的领先地位,将研发成果投稿顶会论文及申请专利。
任职资格
1.硕士及以上学历, 计算机及相关专业,具有扎实的深度学习、自然语言处理或图像视频处理基础;
2. 具备良好的团队协作能力,热爱钻研技术,善于分析、解决工程问题;
3. 有深度学习基本知识,熟悉Transformer/Bert/GPT等模型结构更佳;
4. 掌握Python/C++编程语言,熟练使用Pytorch训练框架;
5. 具备分布式训练或HPC基础知识,了解集合通信和CUDA编程更佳;
6. 拥有以下经验者优先:
(a) 熟悉Deepspeed / Megatron / Colossal-ai / Ray/MetaSeq等任意一种框架;
(b) 有机器学习平台开发和深度学习框架开发等领域开发经验;
(c) 具有DALL-E、CLIP、GLIDE等相关项目的实践经验者优先;