百度 AI Infra校招岗位

百度 AI Infra 校招岗位定向部门内推,hc 多多
扫码投递,我看到会直接联系面试官筛简历

异构计算工程师
-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持AIGC、智算中心、金融、
-结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率
-在自研芯片上适配常见大模型,结合深度学习训推框架特性,开发或调优相关算子,提升模型在芯片上的性能和精度表现,辅助客户进行芯片选型和应用
-针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用
-探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力
职位要求:

-本科及以上学历,有一定程度的计算机相关专业知识背景
-优秀的编码能力,熟悉Golang/Python/Java/C/C++至少一项,有扎实的算法及数据结构基础,有良好的编程习惯。
-熟悉PyTorch,了解Megatron、DeepSpeed、vLLM、SGLang等大模型训推框架,做过测试、开发等工作。
-对GPU芯片架构有一定了解者优先,熟悉CUDA、OpenCL等高性能计算编程经验优先,有大规模训练推理实践经验者优先
-具备推理优化的深度实践经验优先:FlashAttention、PD分离、专家并行、负载均衡、模型压缩(蒸馏/量化)、缓存策略、异构计算加速
-具备训练优化的深度实践经验优先:分布式训练、显存优化(如Zero/Offload)、计算通信Overlap、混合精度、MoE架构调优
- 熟悉Kubernetes工作原理,熟悉调度器、资源扩展机制、容器运行时、容器网络等技术,有Kubernetes开发和维护经验优先
-有独立的分析问题和解决问题的能力,有强烈的责任心,较强的学习能力和沟通能力
全部评论

相关推荐

📍面试公司:美团🕐面试时间:2025-08-14,菜只因秋招处女面💻面试岗位:北斗计划-基座大模型推理引擎工程师BG:末9本,中科院硕,和组内课题不相关❓面试问题:自我介绍:一分钟完事1.介绍一下Transformer的架构,和传统RNN循环神经网络相比有何优势2.Transformer中参数都分布在哪里,参数量最大的是哪部分?计算量最大的是哪部分,为什么?3.了解GPU的cuda core、Tensor core吗,你常用的GPU有哪些,他们的显存和显存带宽有多大4.讲讲大模型的量化5.为什么需要PD分离技术6.讲讲PageAttention和Continous Batching技术7.讲讲cuda编程8.了解DeepSeek 的MLA机制吗?详细介绍一下和MHA、GQA、MQA的区别9.介绍一下DeepSeek MoE架构10.详细介绍一下各种并行方法,TP、PP、DP是什么11.为什么说Prefill阶段是计算密集型的,为什么Decode阶段是内存密集型的?无寿司🍣,感觉是回答的太烂了,30分钟结束。反问:从刚才的面试来看,感觉是不是做底层系统优化比较多,是不是CUDA编程很多?答:也不全是。主要综合来看,不是一定要掌握CUDA编程,但是作为大模型开发而言,CUDA编程肯定要学的,🙌面试感想:和蔼,有几道问题给我解释了;开始开了摄像头,后期关闭了摄像头;大模型八股偏多,依据简历问的,没问项目,我的项目是RAG,可能跟岗位关系不大,所以没问。
查看11道真题和解析
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务