工作职责1. 参与深度学习框架的代码实现, 支持大模型训练和强化学习,提升系统速度和系统稳定性。2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划。4.调研分析海内外前沿技术实现,探索创新方向。任职要求本科及以上学历、计算机、软件工程等相关专业优先;3年及以上相关工作经验,有扎实的计算机科学知识,熟练掌握Pytorch,具备良好的编程能力和代码风格。对AI大模型相关核心技术原理有完整的认识, 熟悉megatron deepspeed等大模型加速框架。有AI大模型性能调优经验,能够分析...