智能云laaS-SRE工程师·负责百度万亿级分布式系统稳定性保障·参与智能云架构设计,开发自动化运维平台·精通服务器生命周期管理、故障预测等技术岗位要求:·Linux/Shell高手,Python/Go达人·熟悉OpenStack/KVM/分布式存储等技术优先·计算机/通信/数学等专业优先智能云大模型-SRE工程师·保障千卡/万卡GPU集群稳定运行·定位大模型训练/推理故障,建设运维平台·使用AI技术提升模型训练可靠性岗位要求:·了解CNN/Transformer等深度学习模型·熟悉PaddlePaddle/PyTorch等训练框架·有K8S/云原生经验者优先投递方式(先链接投递,再邮件发送,速度更快)1.投递"北京-SRE工程师"岗位,https://talent.baidu.com/jobs/mobile/main.html#/detail/GRADUATE/fdf1d9bb-6f65-4a24-a1fb-d067b7768280?recommendCode=ISKYAR&orgId=44a9cfc4-2602-4d29-b56b-18287012dcf5,完善基础信息2.发送邮件至wangxin122@baidu.com邮件标题:[姓名]_[学校]_[岗位名称]_校招简历投递附件命名:同邮件标题格式加入百度,与顶尖技术团队共同探索AI与云计算的无限可能!SRE工程师 如何确定求职岗位#