运维开发工程师
10-11K * 12薪
运维开发工程师 杭州 硕士 2025届

岗位关键词
毕业要求:2025届
投递时间:2025年4月8日-2027年5月8日
岗位职责
政企事业部智算服务工程师
岗位要求
工作职责
1. GPU集群运维与优化
• 负责大规模GPU集群的日常运维,包括硬件监控、性能调优、故障排查及资源调度。
• 设计并实施自动化运维工具和流程,提升集群的可用性和效率。
• 优化GPU计算任务的调度策略,确保资源利用率最大化。
2. 运维运营平台开发
• 参与GPU集群运维运营平台的设计与开发,构建智能化的运维体系。
• 开发和集成监控、告警、日志分析等功能模块,提升平台的可观测性。
• 推动平台的持续迭代,满足业务需求和用户体验。
3. 技术支持与问题解决
• 为内部团队和外部客户提供技术支持,快速响应并解决GPU集群相关问题。
• 编写技术文档、操作手册和培训材料,帮助用户更好地使用平台。
• 定期总结问题案例,提出改进方案,降低问题发生率。
4. 新技术研究与落地
• 跟踪智算领域的最新技术趋势,如AI加速器、分布式计算框架等。
• 研究并引入新的技术和工具,提升集群性能和运维效率。
• 参与公司内部技术分享,推动团队整体技术水平的提高。
任职要求
1. 教育背景
985学校计算机科学、软件工程、电子信息等相关专业211本科及以上学历。
2. 经验要求
• 有GPU集群使用和研究经验优先。
• 有二次训练、模型微调、推理优化等经验优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报