ECS弹性计算 ai-infra 工程师 计算方向 校招求简历
阿里云智能-弹性计算
部门简介:
阿里云弹性计算是飞天平台的核心模块,管理全球200+数据中心和海量服务器资源,为数十亿用户提供可靠的计算服务。我们通过精细化资源管理、精准调度与数据算法驱动,让每一份云资源物尽其用,为客户带来极致弹性体验。
作为AI基础设施的核心底座,弹性计算承载着大模型训练、AI推理、AIGC等关键场景的算力供给。加入我们,你将直接参与超大规模GPU/CPU集群调度与智能算力优化,站在AI基础设施的最前沿,共建全球最强的IaaS服务。
基础平台研发工程师 北京/杭州
岗位职责
● 负责大规模调度系统建设,极速高效响应全球客户不同场景下的资源分配和排布需求,通过调度技术的不断优化演进,保障业务规模、机器规模的高速发展
● 负责大规模集群管理,从宏观的机房、机架、物理机到微观的CPU拓扑结构,通过对资源精细化管理,让每一份资源物尽其用
● 负责云平台的架构设计与技术演进,包括但不局限于调度架构、网络架构、监控架构、大型应用架构
● 负责智能资源规划体系建设,从机型的定制设计、到采购供给、调度搬迁,利用数据分析、智能算法,优化服务器生命周期的每一个环节,优化资源的供给成本
● 负责ECS的售卖产品研发,从资源保障到资源推荐,让用户买得到、买得好,持续提升用户的弹性和购买体验
岗位要求
● Java、Go或Python基础扎实,熟悉常用的开源框架、中间件原理和机制
● 熟悉ai coding和相关AI技能
● 熟悉分布式系统的设计和应用,熟悉分布式缓存、消息通信等机制;能对分布式常用技术进行合理应用,解决问题
● 掌握多线程及高性能的设计与编码,有性能调优实践经验、高并发应用开发经验优先
● 熟悉OpenStack/Kubernetes/Mesos/Borg等平台者优先,有大规模调度系统、资源管理系统、数字供应链系统的实际建设经验者优先
● 具备快速学习能力,较强的团队沟通和协作能力,较强的自我驱动能力
部门简介:
阿里云弹性计算是飞天平台的核心模块,管理全球200+数据中心和海量服务器资源,为数十亿用户提供可靠的计算服务。我们通过精细化资源管理、精准调度与数据算法驱动,让每一份云资源物尽其用,为客户带来极致弹性体验。
作为AI基础设施的核心底座,弹性计算承载着大模型训练、AI推理、AIGC等关键场景的算力供给。加入我们,你将直接参与超大规模GPU/CPU集群调度与智能算力优化,站在AI基础设施的最前沿,共建全球最强的IaaS服务。
基础平台研发工程师 北京/杭州
岗位职责
● 负责大规模调度系统建设,极速高效响应全球客户不同场景下的资源分配和排布需求,通过调度技术的不断优化演进,保障业务规模、机器规模的高速发展
● 负责大规模集群管理,从宏观的机房、机架、物理机到微观的CPU拓扑结构,通过对资源精细化管理,让每一份资源物尽其用
● 负责云平台的架构设计与技术演进,包括但不局限于调度架构、网络架构、监控架构、大型应用架构
● 负责智能资源规划体系建设,从机型的定制设计、到采购供给、调度搬迁,利用数据分析、智能算法,优化服务器生命周期的每一个环节,优化资源的供给成本
● 负责ECS的售卖产品研发,从资源保障到资源推荐,让用户买得到、买得好,持续提升用户的弹性和购买体验
岗位要求
● Java、Go或Python基础扎实,熟悉常用的开源框架、中间件原理和机制
● 熟悉ai coding和相关AI技能
● 熟悉分布式系统的设计和应用,熟悉分布式缓存、消息通信等机制;能对分布式常用技术进行合理应用,解决问题
● 掌握多线程及高性能的设计与编码,有性能调优实践经验、高并发应用开发经验优先
● 熟悉OpenStack/Kubernetes/Mesos/Borg等平台者优先,有大规模调度系统、资源管理系统、数字供应链系统的实际建设经验者优先
● 具备快速学习能力,较强的团队沟通和协作能力,较强的自我驱动能力
全部评论
相关推荐
查看29道真题和解析
