戴先生
北京京东世纪贸易有限公司·算法工程师
---
上次在线
86%
反馈率
4天
处理时长
在招职位 (4)
AI Infra推理引擎算法工程师
40-100K * 20薪
北京
硕士
岗位职责
1.负责大模型推理引擎的开发和优化,特别是针对MOE架构专家分布式的推理性能优化;
2.深入研究和实现MOE模型的底层技术优化,包括CUDA/Kernel算子优化、内存/显存管理策略和计算图优化等;
3.设计和优化MOE模型的专家分布式调度策略,实现高效的专家路由和负载均衡;
4.针对MOE架构大模型进行通信优化,包括通信性能和通信/计算策略流程的优化,减少分布式推理中的通信开销;
5.探索和实现大模型推理引擎的前沿技术,推动团队技术能力的持续提升,同时编写高质量的技术文档,参与团队技术分享和知识沉淀。
岗位要求
1.学历要求: 计算机科学、人工智能、软件工程或相关专业,硕士及以上学历;
2.技术背景:
* 熟悉深度学习框架(如PyTorch、TensorFlow等),具有大模型开发和优化的实际经验;
* 深入理解MOE(Mixture of Experts)架构,具备相关模型的设计和优化经验;
* 熟悉GPU/TPU硬件架构,具备CUDA、OpenCL等高性能计算开发经验;
* 熟悉分布式训练和推理技术,了解NCCL、MPI、RDMA等通信库的优化策略;
* 具备底层计算优化经验,如算子融合、内存优化、计算图优化等。
3.编程能力: 精通Python、C++,具备高性能代码开发和调试能力;
4.加分项:
* 在顶级会议(如NeurIPS、ICML、CVPR等)发表过相关论文;
* 有大规模分布式系统开发经验,熟悉Kubernetes、Docker等容器化技术;
* 熟悉大模型推理引擎(如DeepSpeed、vllm和sglang等)的源码和优化策略。
申请
大模型质量测试工程师
40-100K * 20薪
北京
硕士
岗位职责
1、构建大模型质量评测体系: 负责大语言模型(LLM)推理精度评估,涵盖模型在文本生成、问答、推理、代码生成、安全伦理等多维度的能力测评,并推动建立对抗性评测机制。
2、开发性能评测工具: 主导大模型服务性能评测工作,设计、实现、维护核心压测工具与基础设施,为业务场景提供原子化性能保障能力。
3、保障端到端质量: 负责大模型推理引擎核心模块的内部质量验证,并支撑从模型部署到用户交互的全链路端到端功能质量验收和质量门禁把控。
岗位要求
1、教育背景: 计算机科学、人工智能、软件工程或相关理工科(如数学、统计、电子工程等)领域的 硕士及以上 学位。
2、专业技能: 具备扎实的计算机科学基础和工程能力,精通至少一种主流编程语言(如 Python, C++, Java),编码能力强。
3、优先经验:
3a、具备云计算平台、大规模机器学习平台或分布式计算系统的质量测试经验。
3b、深度参与大型开源AI评测项目(如OpenCompass,FastChat等)并有可验证的贡献。
4、软性素质:
4a、沟通协作: 具备出色的沟通表达能力和高效的团队协作精神。
4b、技术追求: 对技术有强烈的好奇心与钻研精神,追求卓越。
4c、解决问题: 具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题。
申请
大模型推理部署工程师
40-100K * 20薪
北京
硕士
岗位职责
1、构建AI云推理架构: 探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战。
2、开发核心推理平台能力: 打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等。
3、参与推理全栈应用实践: 积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等。
岗位要求
1、教育背景: 计算机科学、软件工程、人工智能或相关STEM领域的硕士及以上学历。
2、技术基石:
2a、扎实的计算机科学基础和良好的工程实践能力;
2b、精通至少一种主流编程语言(如Python,C++),具备出色的编码和调试能力。
2c、熟悉主流大模型推理引擎和优化技术(如 vLLM, SGLang, TensorRT-LLM等)。
3、经验优先:
3a、拥有云计算系统、机器学习平台、分布式计算、中间件等领域的相关开发或落地经验者优先。
3b、在机器学习/系统领域顶级会议(如 ATC,ASPLOS, OSDI, MLSys,WWW等)发表论文。
3c、作为核心贡献者深度参与知名开源项目,如 vLLM, SGLang, TensorRT-LLM等。
3d、在相关国际竞赛中取得突出成绩。
4、软性素质:
4a、沟通协作: 具备出色的沟通表达能力和高效的团队协作精神。
4b、技术追求: 对技术有强烈的好奇心与钻研精神,追求卓越。
4c、解决问题: 具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题。
申请
大模型推理性能优化算法工程师
40-100K * 20薪
北京
硕士
岗位职责
1、研发高性能推理算法: 设计并实现自注意力机制优化、并行推理、负载均衡、弹性容量等无损推理服务优化算法,提升服务效率与稳定性。
2、探索轻量化推理技术: 深入研究和应用有损推理加速算法,包括但不限于知识蒸馏、模型量化、网络剪枝、KV-Cache压缩等,实现模型的高效部署。
3、聚焦软硬件一体优化策略: 从计算图优化、算子融合、计算通信重叠、专家并行、vGPU虚拟化等多个维度入手,显著提升端到端推理性能。
岗位要求
1、教育背景: 计算机科学、人工智能或相关 STEM 领域硕士及以上学历,具备扎实的理论基础。
2、技术能力:
2a、优秀的基础: 拥有深厚的计算机科学理论根基与扎实的算法功底。
2b、编程实力: 具备卓越的编程能力和良好的工程实践习惯。
2c、引擎熟悉度: 熟练掌握 vLLM, SGLang, TensorRT-LLM 等主流大模型推理引擎之一,理解其核心原理。
3、经验优先:
3a、在自然语言处理、多模态大模型、扩散模型、图神经网络(GNN)等领域有研究、技术开发或实际落地经验。
3b、作为核心骨干在国际顶会(NeurIPS, ICML, ICLR,CVPR, ACL等)发表过高质量论文。
3c、在知名开源项目(如Hugging Face Transformers, DeepSpeed,vLLM,SGLang,TensorRT-LLM等)中有显著贡献。
3d、在权威人工智能相关竞赛(如Kaggle、天池)中获得优异名次。
4、软性素质:
4a、沟通协作: 具备出色的沟通表达能力和高效的团队协作精神。
4b、技术追求: 对技术有强烈的好奇心与钻研精神,追求卓越。
4c、解决问题: 具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题。
申请
京东 电商 已上市 北京,深圳,上海,西安,成都,南京,苏州,武汉,长沙,重庆
京东于2004年正式涉足电商领域。2014年5月,京东集团在美国纳斯达克证券交易所正式挂牌上市,是中国第一个成功赴美上市的综合型电商平台。2020年6月,京东集团在香港联交所二次上市京东集团定位于“以供应链为基础的技术与服务企业”,目前业务已涉及零售、科技、物流、健康、保险、产发、海外和工业品等领域。