AI GPU 架构性能优化实习生
220-380元/天
人工智能 北京 本科 4天/周 最少6个月

岗位关键词
投递时间:2026年4月30日-2026年6月30日
岗位职责
关于这个岗位
如果你对 GPU 架构、底层性能优化、AI kernel 设计以及软硬件协同设计(HW/SW Co‑Design)充满兴趣,希望参与直接影响下一代 Intel GPU IP和AI加速器性能的核心工程工作,那么这个岗位非常适合你。
作为AI架构性能优化实习生(GPU Architecture 方向),你将加入Intel GPU Compute Architecture团队,深入参与GPU 核心计算 kernel 的分析、优化与验证工作,并通过真实 AI 工作负载,对 GPU IP的功能与性能进行系统性评估。
你将站在AI软件和GPU硬件的交汇点, 理解软件如何“逼出”硬件的极限性能。
你将做什么(实习内容)
在导师和团队的指导下,你将有机会参与:
· 面向 GPU 的核心计算 kernel 优化
o 分析并优化 AI / 数值计算中的关键 GPU kernels(如 GEMM、Attention、算子融合等)
o 研究 kernel 与 GPU 架构(SIMD / memory hierarchy / scheduling)的映射关系
· AI Model 数值特性与高效计算研究(Numeric & Sparse AI)
o 研究 AI 模型的数值特性(numeric behavior),包括数值稳定性、精度‑性能权衡,以及低精度数值计算(FP16 / BF16 / INT8 / FP8 等) 在 GPU 上的表现
o 探索稀疏计算与量化感知技术(Sparsity / Quantization‑aware),分析其对GPU kernel实现、memory access与调度策略的影响,并反馈至架构设计决策
· 基于真实 AI 工作负载的 GPU IP 验证
o 复现和构建具有代表性的AI推理 / 训练工作负载
o 利用workload 验证 GPU IP的功能正确性、性能特征和边界行为
· 面向 GPU 架构的性能建模与分析
o 构建 kernel / workload 的性能画像
o 使用性能分析工具,定位性能瓶颈(compute / memory / pipeline / occupancy 等)
● 分析不同架构设计对性能的影响,并形成可复用的分析方法
· 软硬件协同设计(HW/SW Co‑Design)
o 将 kernel 和 workload 侧的发现反馈给 GPU 架构 / IP 设计团队
o 支持下一代 GPU 架构在 AI 场景下的设计决策
这是一个偏工程实践 + 学习成长型 的实习岗位,而非纯研究或纯应用开发。
不要求你什么都会,但希望你 对底层原理有兴趣、愿意深入、能从数据中找答案。
我们希望你具备
必备条件
● 本科、硕士或博士在读,专业包括(但不限于):计算机科学 / 计算机工程 / 电子工程 / 相关理工科专业
● 熟悉C/C++或Python,有较好的代码能力,能够用于模型、数据或系统分析任务
● 对 GPU / 并行计算 / 性能优化有强烈兴趣
● 对人工智能基础有系统理解,包括常见模型和算法
● 对AI 模型的数值计算特性有基础兴趣或认知
● 对计算机系统有基础认知(如 CPU/GPU、内存、并行执行与性能分析等)
● 具备良好的英语听说读写能力,能够在全球化工程团队中进行有效的技术沟通与协作。
不要求你什么都会,但希望你对底层原理有兴趣、愿意深入、能从数据中找答案。
加分项(有更好,没有也欢迎投递)
● 较强的逻辑分析和问题拆解能力
● 有课程项目、实验室或实习中接触性能优化、系统分析的经历
● 有 GPU kernel / CUDA / OpenCL / SYCL / Triton 等相关经验
● 对 AI 模型的数值计算特性有理解或兴趣,涵盖低精度与量化计算、稀疏计算及其精度‑性能权衡,并关注其对 GPU 执行与性能优化的影响
● 接触过性能优化课程项目/编译器 / 并行计算 / 系统方向研究或实习
● 喜欢动手实验、调参数、看 profiling 数据、分析“为什么慢”,把软件行为和硬件结构对起来理解
● 对 AI 系统方向(而不只是模型本身)有长期兴趣
你能收获什么
● 参与 GPU 架构团队的核心工程工作
● 深入理解:AI workload → GPU Kernel → GPU IP 设计
● 为未来从事 AI Kernel、编译器与并行计算、芯片/软件协同方向 打下基础
岗位要求
关于这个岗位
如果你对 GPU 架构、底层性能优化、AI kernel 设计以及软硬件协同设计(HW/SW Co Design)充满兴趣,希望参与直接影响下一代 Intel GPU IP和AI加速器性能的核心工程工作,那么这个岗位非常适合你。
作为AI架构性能优化实习生(GPU Architecture 方向),你将加入Intel GPU Compute Architecture团队,深入参与GPU 核心计算 kernel 的分析、优化与验证工作,并通过真实 AI 工作负载,对 GPU IP的功能与性能进行系统性评估。
你将站在AI软件和GPU硬件的交汇点, 理解软件如何“逼出”硬件的极限性能。
________________________________________
你将做什么(实习内容)
在导师和团队的指导下,你将有机会参与:
• 面向 GPU 的核心计算 kernel 优化
o 分析并优化 AI / 数值计算中的关键 GPU kernels(如 GEMM、Attention、算子融合等)
o 研究 kernel 与 GPU 架构(SIMD / memory hierarchy / scheduling)的映射关系
• AI Model 数值特性与高效计算研究(Numeric & Sparse AI)
o 研究 AI 模型的数值特性(numeric behavior),包括数值稳定性、精度 性能权衡,以及低精度数值计算(FP16 / BF16 / INT8 / FP8 等) 在 GPU 上的表现
o 探索稀疏计算与量化感知技术(Sparsity / Quantization aware),分析其对GPU kernel实现、memory access与调度策略的影响,并反馈至架构设计决策
• 基于真实 AI 工作负载的 GPU IP 验证
o 复现和构建具有代表性的AI推理 / 训练工作负载
o 利用workload 验证 GPU IP的功能正确性、性能特征和边界行为
• 面向 GPU 架构的性能建模与分析
o 构建 kernel / workload 的性能画像
o 使用性能分析工具,定位性能瓶颈(compute / memory / pipeline / occupancy 等)
o 分析不同架构设计对性能的影响,并形成可复用的分析方法
• 软硬件协同设计(HW/SW Co Design)
o 将 kernel 和 workload 侧的发现反馈给 GPU 架构 / IP 设计团队
o 支持下一代 GPU 架构在 AI 场景下的设计决策
这是一个偏工程实践 + 学习成长型 的实习岗位,而非纯研究或纯应用开发。
不要求你什么都会,但希望你 对底层原理有兴趣、愿意深入、能从数据中找答案。
________________________________________
我们希望你具备
必备条件
• 本科、硕士或博士在读,专业包括(但不限于):计算机科学 / 计算机工程 / 电子工程 / 相关理工科专业
• 熟悉C/C++或Python,有较好的代码能力,能够用于模型、数据或系统分析任务
• 对 GPU / 并行计算 / 性能优化有强烈兴趣
• 对人工智能基础有系统理解,包括常见模型和算法
• 对AI 模型的数值计算特性有基础兴趣或认知
• 对计算机系统有基础认知(如 CPU/GPU、内存、并行执行与性能分析等)
• 具备良好的英语听说读写能力,能够在全球化工程团队中进行有效的技术沟通与协作。
不要求你什么都会,但希望你对底层原理有兴趣、愿意深入、能从数据中找答案。
________________________________________
加分项(有更好,没有也欢迎投递)
• 较强的逻辑分析和问题拆解能力
• 有课程项目、实验室或实习中接触性能优化、系统分析的经历
• 有 GPU kernel / CUDA / OpenCL / SYCL / Triton 等相关经验
• 对 AI 模型的数值计算特性有理解或兴趣,涵盖低精度与量化计算、稀疏计算及其精度 性能权衡,并关注其对 GPU 执行与性能优化的影响
• 接触过性能优化课程项目/编译器 / 并行计算 / 系统方向研究或实习
• 喜欢动手实验、调参数、看 profiling 数据、分析“为什么慢”,把软件行为和硬件结构对起来理解
• 对 AI 系统方向(而不只是模型本身)有长期兴趣
________________________________________
你能收获什么
• 参与 GPU 架构团队的核心工程工作
• 深入理解:AI workload → GPU Kernel → GPU IP 设计
• 为未来从事 AI Kernel、编译器与并行计算、芯片/软件协同方向 打下基础
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报