岗位关键词
岗位职责
岗位职责: 1、优化深度学习在线推理服务框架,包括架构设计、系统研发、性能优化,保障模型推理性能与部署效率;​ 2、优化深度学习模型训练框架,包括不限于CPU/GPU的稀疏训练框架、大模型训练加速以及离线模型推理优化,保障模型训练的稳定与高效;​ 3、优化机器学习计算平台,负责构建一站式机器学习解决方案,涵盖从数据集管理、模型训练、模型优化、模型上线以及分布式计算全流程。
岗位要求
任职要求: 1、本科及以上学历,具有扎实的计算机基础, 熟悉操作系统和网络, 精通C/C++和Python编程语言, 对数据结构&算法设计有较深刻的理解;​ 2、精通至少一种主流的深度学习框架,如Tensorflow或Pytorch;​ 3、精通至少一种主流的模型推理框架,如TensorRT或onnxruntime;​ 4、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作。​ 加分项: 1、有大模型如llama、gpt,训练推理以及调优经验者优先;​ 2、熟悉CUDA编程,有算子开发经验者优先;​ 3、熟悉分布式训练框架者优先,包括不限于Parameter Server架构,训练框架Horovod、 DeepSpeed或者Megatron-LM;​ 4、了解底层通信库者优先,比如MPI、NCCL或brpc;​ 5、了解Kubernetes,有相关开发经验者优先;​ 6、有大型互联网系统(广告、搜索、推荐)经验者优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报