大模型算法工程Co-Design-2026届

薪资面议
算法工程师
北京
不限

投递时间:2025年12月23日-2029年1月27日

岗位职责
寻找深度理解大模型算法,同时具备顶尖系统工程设计能力的专家。你将作为算法研究与工程落地的核心桥梁,主导优化大模型训练/推理效率、性能与成本,确保前沿算法在大规模系统中高效实现。 1. 协同设计与优化: - 深入理解大模型算法(架构、训练/推理技术),评估其工程可行性、性能瓶颈与成本。 - 主导设计下一代训练/推理框架或核心组件,确保原生支持高效算法实现(如高效Attention、通信优化)。 - 系统性解决训练/推理工作负载的性能瓶颈(计算、通信、存储)。 2. 高性能系统实现: - 设计并实现高性能核心(如定制Kernel)、优化通信与数据流水线。 3. 分布式架构: - 设计构建大规模分布式训练系统(DeepSpeed/Megatron-LM/FSDP)。 - 设计构建高并发、低延迟的大模型推理服务平台。 4. 前瞻探索与协作: - 跟踪领域前沿,探索验证新技术(新硬件、非Transformer架构等)。 - 高效沟通,跨团队(算法、工程、平台)协作推动方案落地。
岗位要求
1. 学历/经验: 计算机/人工智能等相关领域本科及以上,或具备同等杰出实践经验。 2. 大模型基础: 深刻理解Transformer架构及大模型训练/推理等相关核心技术。 3. 工程硬实力: - 精通 PyTorch 及其分布式训练(DDP/FSDP),有大规模分布式系统设计开发调优经验 - 扎实的计算机体系结构/操作系统/网络基础。 - 丰富的“性能调优”经验(Nsight Systems, Profiler等)。 加分项 1. 参与 DeepSpeed/Megatron-LM/vLLM/SGLang 等核心框架开发。 3. GPU Kernel优化 (CUDA/Triton) 经验。 4. 千亿参数级模型训练/部署经验。 5. 熟悉云平台大规模AI负载管理。
蓟门壹号大厦8层
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报