岗位职责 专注于大规模机器学习的算法研究及工程落地,包括但不限于: 1.大规模分布式机器学习训练的研发工作,基于A100 高性能GPU,针对不同算法业务场景的研发落地及深度性能优化,包括但不限于大规模超稀疏场景的开发和优化、AIGC场景下训练优化。 2.大型分布式在线广告模型计算设计和优化,支撑每日数百亿PV请求的在线高可靠、高并发的CPU/GPU异构系统研发和性能优化; 岗位要求 1. 全日制大学硕士及以上学历,计算机相关专业; 2. 具备良好的计算机基础,了解计算机体系结构、多线程/进程分布式计算,对数据结构、设计模式有深刻的理解,具备良好的Linux 下 C++/Python 编码能力;...