百度 2025 校招（运维）

提前批，免笔试

运维平台研发工程师（北京/上海）
岗位职责:
* 负责智能运维相关产品的架构设计、核心功能研发及技术优化（预案管理、变更管理、容量管理、成本经营分析）
* 参与大语言模型在运维领域落地的相关研发工作，支持智能运维客服、智能故障诊断等产品落地
* 参与大语言模型微调、推理服务建设相关工作，探索构建公域及私域数据相结合的运维模型
* 持续学习和调研先进大模型应用技术和行业动态，关注竞品发展
岗位要求:
* 本科及以上学历，有一定程度的计算机相关专业知识背景
* 优秀的编码能力，熟悉Golang/Python至少一项，有扎实的算法及数据结构基础，有良好的编程习惯。
* 熟悉Vue/React等一种前端JS框架，对其源码有一定研究
* 熟悉kubernetes基本工作原理，对Langchain或其他大语言模型应用开发框架有一定理解者优先，有机器学习实践经验者优先
* 优秀的团队协作能力；具备较强的ownership，以结果为导向，善于思考并积极改进

SRE工程师（业务运维）（北京）
岗位职责:
* Site Reliability Engineer，负责百度公司大规模分布式系统及各类在线服务可靠、稳定、高效运行
* 参与在线系统和各类产品架构设计，主导服务可靠性相关自动化系统的实现，满足严格的质量与效率要求
* 设计研发服务运维解决方案，包括持续交付、容量管理、弹性计算、故障分析、流量分配、性能调优等
* 关注业界前沿技术动态，负责大规模流量接入系统的优化，演进和新接入技术探索和应用
* 使用AI技术解决超大规模互联网应用运维问题
岗位要求:
* 深入理解Linux操作系统；具备较好的计算机网络和体系结构基础
* 熟练掌握C/C++/Python/Go/Shell等至少一种主流编程语言
* 良好的逻辑思维和分析能力，热衷于解决问题、追求极致
* 强烈的责任心、进取心、团队合作精神和Ownership
* 专业不限，但更倾向于计算机、通信、数学等理工学科的应届毕业生
* 有大规模分布式程序设计开发经验优先

SRE工程师（AI大模型运维）（北京）
岗位职责:
* 负责大模型平台的基础设施（GPU/高性能网络等）的稳定性保障，并提升模型训练效率和效果；
* 负责模型训练过程中的硬件、算法、框架等故障定位，并推动对应大模型运维能力平台产品化建设；
* 负责大模型训练任务、基础设施的运维监控数据建设，建设产品可用性大盘；
* 关注业界动态，使用AI技术解决大模型稳定性问题，提升稳定性及训练过程高可用；
岗位要求:
* 了解大模型训练模式，了解ChatGPT/LLaMA等LLM语言模型，了解paddlepaddle/pyorch/tensorflow等一种训练框架；
* 了解GPU架构、cuda编程基础、大模型常用的并行策略和集合通信场景；
* 熟练掌握Python/Golang/Shell等至少一种主流编程语言
* 具有良好的逻辑思维和分析能力，热衷解决问题、追求极致；具有强烈的责任心、进取心、Ownership；
* 有K8S云原生平台的相关系统运维开发和稳定性建设经验者优先，有云产品/平台使用经验者优先；

SRE工程师（智能云运维）（北京）
岗位职责:
* Site Reliability Engineer，负责百度公司大规模分布式系统及各类云服务可靠、稳定、高效运行
* 参与百度智能云系统和各类产品架构设计，主导服务可用性相关平台/自动化系统的实现
* 设计研发智能云规模化运维的技术解决方案，包括服务器生命周期管理、高效交付、故障预测、成本管理等
* 关注业界前沿技术动态，熟悉os/kernel、openstack、kvm、分布式存储、虚拟化网络等相关技术，贡献与引领业界技术趋势
岗位要求:
* 深入理解Linux操作系统；具备较好的计算机网络和体系结构基础
* 熟练掌握Python/Go/Shell等至少一种主流编程语言
* 对云计算、虚拟机等技术有浓厚的兴趣优先，了解OpenStack、虚拟化网络、KVM、分布式存储等相关技术
* 具有良好的逻辑思维和分析能力，热衷解决问题、追求极致；具有强烈的责任心、进取心、Ownership；
* 专业不限，但更倾向于计算机、通信、数学等理工学科的应届毕业生

内推二维码如下：

运维求职圈

全部评论

推荐最新楼层