运维开发工程师

10-11K * 12薪
运维开发工程师
杭州
硕士
2025届
岗位关键词

毕业要求:2025届

投递时间:2025年4月8日-2027年5月8日

岗位职责
政企事业部智算服务工程师
岗位要求
工作职责 1. GPU集群运维与优化 • 负责大规模GPU集群的日常运维,包括硬件监控、性能调优、故障排查及资源调度。 • 设计并实施自动化运维工具和流程,提升集群的可用性和效率。 • 优化GPU计算任务的调度策略,确保资源利用率最大化。 2. 运维运营平台开发 • 参与GPU集群运维运营平台的设计与开发,构建智能化的运维体系。 • 开发和集成监控、告警、日志分析等功能模块,提升平台的可观测性。 • 推动平台的持续迭代,满足业务需求和用户体验。 3. 技术支持与问题解决 • 为内部团队和外部客户提供技术支持,快速响应并解决GPU集群相关问题。 • 编写技术文档、操作手册和培训材料,帮助用户更好地使用平台。 • 定期总结问题案例,提出改进方案,降低问题发生率。 4. 新技术研究与落地 • 跟踪智算领域的最新技术趋势,如AI加速器、分布式计算框架等。 • 研究并引入新的技术和工具,提升集群性能和运维效率。 • 参与公司内部技术分享,推动团队整体技术水平的提高。 任职要求 1. 教育背景 985学校计算机科学、软件工程、电子信息等相关专业211本科及以上学历。 2. 经验要求 • 有GPU集群使用和研究经验优先。 • 有二次训练、模型微调、推理优化等经验优先。
杭州
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报