郑女士
英特尔半导体(大连)有限公司·招聘顾问
昨日
上次在线
55%
反馈率
4天
处理时长
在招职位 (41)
固件验证方向 AI 实习生
240-360元/天
上海
硕士
岗位职责
面向固件领域开发前沿的 AI 智能体和工具, 该岗位专注于构建自治型 AI 系统、智能代理以及开发者工具,并利用最先进的大语言模型技术。你将有机会在多模态环境中亲身参与智能体架构设计、工具集成以及 AI 原生应用开发。
岗位职责:
· AI 智能体开发: 使用 LangChain 等框架, 或自定义智能体架构, 设计并实现自治型 AI 智能体。
· 工具集成与开发: 构建并集成 AI 工具、API 和插件;以增强智能体能力和用户工作流体验。
· RAG 与知识系统: 开发高级的检索增强生成(RAG)系统和知识库,用于智能体的记忆和上下文管理。
· 智能体编排: 构建支持多智能体协作、任务委派和工作流自动化的系统。
· 性能监控: 实现对智能体行为、工具使用效果以及系统可靠性的监控与评估机制。
· 负责高质量测试用例的开发与执行;使用多种调试工具开展问题定位,识别故障并将问题追踪到组件级或代码级。
任职资格:
· 正在攻读计算机科学、人工智能、软件工程或相关专业学位。
· 熟悉智能体框架和工具(如 LangChain、copilot cli、codex、claude code 等),以及工具集成模式。
· 理解大语言模型(LLM)架构、提示工程和函数调用机制。
· 了解 RAG 技术、向量数据库和嵌入系统。
· 具备前端/UI 技能,能够构建智能体界面和仪表盘者优先。
· 对自治系统、工作流自动化以及 AI 与人协作有浓厚兴趣。
· 具备扎实的软件开发能力,熟悉多种编程语言,包括但不限于 C/C++、Rust、Python/Perl、JavaScript、Windows Bat/Linux Shell 等。
· 了解 UEFI/ACPI/SMBIOS/TPM/PCI 和 BIOS 者优先。
· 理解计算机系统架构,包括硬件和软件。
岗位要求
任职资格:
· 正在攻读计算机科学、人工智能、软件工程或相关专业学位。
· 熟悉智能体框架和工具(如 LangChain、copilot cli、codex、claude code 等),以及工具集成模式。
· 理解大语言模型(LLM)架构、提示工程和函数调用机制。
· 了解 RAG 技术、向量数据库和嵌入系统。
· 具备前端/UI 技能,能够构建智能体界面和仪表盘者优先。
· 对自治系统、工作流自动化以及 AI 与人协作有浓厚兴趣。
· 具备扎实的软件开发能力,熟悉多种编程语言,包括但不限于 C/C++、Rust、Python/Perl、JavaScript、Windows Bat/Linux Shell 等。
· 了解 UEFI/ACPI/SMBIOS/TPM/PCI 和 BIOS 者优先。
· 理解计算机系统架构,包括硬件和软件。
申请
固件开发工程师实习生
280-360元/天
上海
硕士
岗位职责
The Role and Impact:
This is an exciting opportunity to join Intel as a Firmware Engineering Intern, where you will contribute to cutting-edge advancements in embedded software development. In this role, you will work on designing, developing, validating, and debugging firmware across diverse domains such as BIOS, microcontrollers, and memory systems. You will collaborate with architects, engineers, and designers to ensure robust and efficient firmware solutions that power Intel's innovations and shape the future of computing. As part of Intel's firmware engineering team, your contributions will directly impact Intel's product success and enable groundbreaking technologies that drive global progress.
As an intern, you will gain hands-on experience and build skills through real-world projects aligned with Intel's business goals. You will be immersed in collaboration, learning opportunities, and development initiatives to explore your potential and grow your career in a supportive and inclusive environment.
Key Responsibilities
● Assist in the design, development, and validation of firmware for BIOS, microcontrollers, and/or memory systems.
● Perform debugging and troubleshooting of firmware-related issues.
● Contribute to system-level modeling, algorithm development, and/or hardware-software integration in environments with timing, memory, and processing constraints.
● Collaborate with architects, engineers, and designers to ensure firmware solutions meet design specifications and quality standards.
● Support architectural decision-making, validation planning, and performance benchmarking initiatives.
● Engage in code reviews and provide constructive feedback to improve firmware quality.
● Participate in the development or enhancement of software build infrastructure and debugging tools.
● Demonstrate commitment to continuous learning and improvement by staying updated on industry trends and best practices.
岗位要求
Minimum Qualifications
Will graduate in 2027 with Master degree of Computer Science or Electronic Engineering or other relevant majors
Proficiency in programming languages such as C, C++, or Python.
Foundational knowledge of embedded software development.
Understanding of computer architecture and microarchitecture fundamentals.
Familiarity with firmware validation and debugging techniques.
Ability to analyze, interpret, and solve complex technical problems.
Exposure to software architecture principles and development workflows.
3 days at office per week and 6 months internship at least
Preferred Qualifications
Experience with software build infrastructure or debugging tools.
Strong problem-solving abilities paired with analytical thinking.
An effective team player with collaborative skills in multidisciplinary environments.
Enthusiasm for learning and expanding skill sets in firmware engineering.
Good verbal and written communication skills are preferred.
Take the first step toward an impactful career at Intel by applying for this role today. Join us in shaping the future of technology while building your expertise and exploring your potential in an environment that values innovation and growth
申请
GPU 软件工程实习生
240-360元/天
上海
硕士
岗位职责
Job Description:
Contributes to the design, development, and validation of system software across one or more layers of the software stack including firmware, drivers, operating systems, and/or middleware to enable Intel platforms and technologies. Engages in cross stack software optimization and contributes to reference platform development for specific domains and market segments. As an intern, learns and applies knowledge, builds skills, and explores future career opportunities through hands on experience and projects that support Intel business goals in a collaborative environment.
Qualifications
● Master candidates, major in Computer Science, Computer Engineering, or Electrical Engineering etc. Windows/Linux software development background with Python/C/C++ programming experience.
● Knowledge of SW developing/testing process, desire and ability to quickly learn and gain new knowledge
● Team player and good communication skills
岗位要求
Master candidates, major in Computer Science, Computer Engineering, or Electrical Engineering etc. Windows/Linux software development background with Python/C/C++ programming experience.
Knowledge of SW developing/testing process, desire and ability to quickly learn and gain new knowledge
Team player and good communication skills
申请
AI GPU 架构性能优化实习生
220-380元/天
上海
本科
岗位职责
关于这个岗位
如果你对 GPU 架构、底层性能优化、AI kernel 设计以及软硬件协同设计(HW/SW Co‑Design)充满兴趣,希望参与直接影响下一代 Intel GPU IP和AI加速器性能的核心工程工作,那么这个岗位非常适合你。
作为AI架构性能优化实习生(GPU Architecture 方向),你将加入Intel GPU Compute Architecture团队,深入参与GPU 核心计算 kernel 的分析、优化与验证工作,并通过真实 AI 工作负载,对 GPU IP的功能与性能进行系统性评估。
你将站在AI软件和GPU硬件的交汇点, 理解软件如何“逼出”硬件的极限性能。
你将做什么(实习内容)
在导师和团队的指导下,你将有机会参与:
· 面向 GPU 的核心计算 kernel 优化
o 分析并优化 AI / 数值计算中的关键 GPU kernels(如 GEMM、Attention、算子融合等)
o 研究 kernel 与 GPU 架构(SIMD / memory hierarchy / scheduling)的映射关系
· AI Model 数值特性与高效计算研究(Numeric & Sparse AI)
o 研究 AI 模型的数值特性(numeric behavior),包括数值稳定性、精度‑性能权衡,以及低精度数值计算(FP16 / BF16 / INT8 / FP8 等) 在 GPU 上的表现
o 探索稀疏计算与量化感知技术(Sparsity / Quantization‑aware),分析其对GPU kernel实现、memory access与调度策略的影响,并反馈至架构设计决策
· 基于真实 AI 工作负载的 GPU IP 验证
o 复现和构建具有代表性的AI推理 / 训练工作负载
o 利用workload 验证 GPU IP的功能正确性、性能特征和边界行为
· 面向 GPU 架构的性能建模与分析
o 构建 kernel / workload 的性能画像
o 使用性能分析工具,定位性能瓶颈(compute / memory / pipeline / occupancy 等)
● 分析不同架构设计对性能的影响,并形成可复用的分析方法
· 软硬件协同设计(HW/SW Co‑Design)
o 将 kernel 和 workload 侧的发现反馈给 GPU 架构 / IP 设计团队
o 支持下一代 GPU 架构在 AI 场景下的设计决策
这是一个偏工程实践 + 学习成长型 的实习岗位,而非纯研究或纯应用开发。
不要求你什么都会,但希望你 对底层原理有兴趣、愿意深入、能从数据中找答案。
我们希望你具备
必备条件
● 本科、硕士或博士在读,专业包括(但不限于):计算机科学 / 计算机工程 / 电子工程 / 相关理工科专业
● 熟悉C/C++或Python,有较好的代码能力,能够用于模型、数据或系统分析任务
● 对 GPU / 并行计算 / 性能优化有强烈兴趣
● 对人工智能基础有系统理解,包括常见模型和算法
● 对AI 模型的数值计算特性有基础兴趣或认知
● 对计算机系统有基础认知(如 CPU/GPU、内存、并行执行与性能分析等)
● 具备良好的英语听说读写能力,能够在全球化工程团队中进行有效的技术沟通与协作。
不要求你什么都会,但希望你对底层原理有兴趣、愿意深入、能从数据中找答案。
加分项(有更好,没有也欢迎投递)
● 较强的逻辑分析和问题拆解能力
● 有课程项目、实验室或实习中接触性能优化、系统分析的经历
● 有 GPU kernel / CUDA / OpenCL / SYCL / Triton 等相关经验
● 对 AI 模型的数值计算特性有理解或兴趣,涵盖低精度与量化计算、稀疏计算及其精度‑性能权衡,并关注其对 GPU 执行与性能优化的影响
● 接触过性能优化课程项目/编译器 / 并行计算 / 系统方向研究或实习
● 喜欢动手实验、调参数、看 profiling 数据、分析“为什么慢”,把软件行为和硬件结构对起来理解
● 对 AI 系统方向(而不只是模型本身)有长期兴趣
你能收获什么
● 参与 GPU 架构团队的核心工程工作
● 深入理解:AI workload → GPU Kernel → GPU IP 设计
● 为未来从事 AI Kernel、编译器与并行计算、芯片/软件协同方向 打下基础
岗位要求
关于这个岗位
如果你对 GPU 架构、底层性能优化、AI kernel 设计以及软硬件协同设计(HW/SW Co Design)充满兴趣,希望参与直接影响下一代 Intel GPU IP和AI加速器性能的核心工程工作,那么这个岗位非常适合你。
作为AI架构性能优化实习生(GPU Architecture 方向),你将加入Intel GPU Compute Architecture团队,深入参与GPU 核心计算 kernel 的分析、优化与验证工作,并通过真实 AI 工作负载,对 GPU IP的功能与性能进行系统性评估。
你将站在AI软件和GPU硬件的交汇点, 理解软件如何“逼出”硬件的极限性能。
________________________________________
你将做什么(实习内容)
在导师和团队的指导下,你将有机会参与:
• 面向 GPU 的核心计算 kernel 优化
o 分析并优化 AI / 数值计算中的关键 GPU kernels(如 GEMM、Attention、算子融合等)
o 研究 kernel 与 GPU 架构(SIMD / memory hierarchy / scheduling)的映射关系
• AI Model 数值特性与高效计算研究(Numeric & Sparse AI)
o 研究 AI 模型的数值特性(numeric behavior),包括数值稳定性、精度 性能权衡,以及低精度数值计算(FP16 / BF16 / INT8 / FP8 等) 在 GPU 上的表现
o 探索稀疏计算与量化感知技术(Sparsity / Quantization aware),分析其对GPU kernel实现、memory access与调度策略的影响,并反馈至架构设计决策
• 基于真实 AI 工作负载的 GPU IP 验证
o 复现和构建具有代表性的AI推理 / 训练工作负载
o 利用workload 验证 GPU IP的功能正确性、性能特征和边界行为
• 面向 GPU 架构的性能建模与分析
o 构建 kernel / workload 的性能画像
o 使用性能分析工具,定位性能瓶颈(compute / memory / pipeline / occupancy 等)
o 分析不同架构设计对性能的影响,并形成可复用的分析方法
• 软硬件协同设计(HW/SW Co Design)
o 将 kernel 和 workload 侧的发现反馈给 GPU 架构 / IP 设计团队
o 支持下一代 GPU 架构在 AI 场景下的设计决策
这是一个偏工程实践 + 学习成长型 的实习岗位,而非纯研究或纯应用开发。
不要求你什么都会,但希望你 对底层原理有兴趣、愿意深入、能从数据中找答案。
________________________________________
我们希望你具备
必备条件
• 本科、硕士或博士在读,专业包括(但不限于):计算机科学 / 计算机工程 / 电子工程 / 相关理工科专业
• 熟悉C/C++或Python,有较好的代码能力,能够用于模型、数据或系统分析任务
• 对 GPU / 并行计算 / 性能优化有强烈兴趣
• 对人工智能基础有系统理解,包括常见模型和算法
• 对AI 模型的数值计算特性有基础兴趣或认知
• 对计算机系统有基础认知(如 CPU/GPU、内存、并行执行与性能分析等)
• 具备良好的英语听说读写能力,能够在全球化工程团队中进行有效的技术沟通与协作。
不要求你什么都会,但希望你对底层原理有兴趣、愿意深入、能从数据中找答案。
________________________________________
加分项(有更好,没有也欢迎投递)
• 较强的逻辑分析和问题拆解能力
• 有课程项目、实验室或实习中接触性能优化、系统分析的经历
• 有 GPU kernel / CUDA / OpenCL / SYCL / Triton 等相关经验
• 对 AI 模型的数值计算特性有理解或兴趣,涵盖低精度与量化计算、稀疏计算及其精度 性能权衡,并关注其对 GPU 执行与性能优化的影响
• 接触过性能优化课程项目/编译器 / 并行计算 / 系统方向研究或实习
• 喜欢动手实验、调参数、看 profiling 数据、分析“为什么慢”,把软件行为和硬件结构对起来理解
• 对 AI 系统方向(而不只是模型本身)有长期兴趣
________________________________________
你能收获什么
• 参与 GPU 架构团队的核心工程工作
• 深入理解:AI workload → GPU Kernel → GPU IP 设计
• 为未来从事 AI Kernel、编译器与并行计算、芯片/软件协同方向 打下基础
申请
AI GPU 架构性能优化实习生
220-380元/天
北京
本科
岗位职责
关于这个岗位
如果你对 GPU 架构、底层性能优化、AI kernel 设计以及软硬件协同设计(HW/SW Co‑Design)充满兴趣,希望参与直接影响下一代 Intel GPU IP和AI加速器性能的核心工程工作,那么这个岗位非常适合你。
作为AI架构性能优化实习生(GPU Architecture 方向),你将加入Intel GPU Compute Architecture团队,深入参与GPU 核心计算 kernel 的分析、优化与验证工作,并通过真实 AI 工作负载,对 GPU IP的功能与性能进行系统性评估。
你将站在AI软件和GPU硬件的交汇点, 理解软件如何“逼出”硬件的极限性能。
你将做什么(实习内容)
在导师和团队的指导下,你将有机会参与:
· 面向 GPU 的核心计算 kernel 优化
o 分析并优化 AI / 数值计算中的关键 GPU kernels(如 GEMM、Attention、算子融合等)
o 研究 kernel 与 GPU 架构(SIMD / memory hierarchy / scheduling)的映射关系
· AI Model 数值特性与高效计算研究(Numeric & Sparse AI)
o 研究 AI 模型的数值特性(numeric behavior),包括数值稳定性、精度‑性能权衡,以及低精度数值计算(FP16 / BF16 / INT8 / FP8 等) 在 GPU 上的表现
o 探索稀疏计算与量化感知技术(Sparsity / Quantization‑aware),分析其对GPU kernel实现、memory access与调度策略的影响,并反馈至架构设计决策
· 基于真实 AI 工作负载的 GPU IP 验证
o 复现和构建具有代表性的AI推理 / 训练工作负载
o 利用workload 验证 GPU IP的功能正确性、性能特征和边界行为
· 面向 GPU 架构的性能建模与分析
o 构建 kernel / workload 的性能画像
o 使用性能分析工具,定位性能瓶颈(compute / memory / pipeline / occupancy 等)
● 分析不同架构设计对性能的影响,并形成可复用的分析方法
· 软硬件协同设计(HW/SW Co‑Design)
o 将 kernel 和 workload 侧的发现反馈给 GPU 架构 / IP 设计团队
o 支持下一代 GPU 架构在 AI 场景下的设计决策
这是一个偏工程实践 + 学习成长型 的实习岗位,而非纯研究或纯应用开发。
不要求你什么都会,但希望你 对底层原理有兴趣、愿意深入、能从数据中找答案。
我们希望你具备
必备条件
● 本科、硕士或博士在读,专业包括(但不限于):计算机科学 / 计算机工程 / 电子工程 / 相关理工科专业
● 熟悉C/C++或Python,有较好的代码能力,能够用于模型、数据或系统分析任务
● 对 GPU / 并行计算 / 性能优化有强烈兴趣
● 对人工智能基础有系统理解,包括常见模型和算法
● 对AI 模型的数值计算特性有基础兴趣或认知
● 对计算机系统有基础认知(如 CPU/GPU、内存、并行执行与性能分析等)
● 具备良好的英语听说读写能力,能够在全球化工程团队中进行有效的技术沟通与协作。
不要求你什么都会,但希望你对底层原理有兴趣、愿意深入、能从数据中找答案。
加分项(有更好,没有也欢迎投递)
● 较强的逻辑分析和问题拆解能力
● 有课程项目、实验室或实习中接触性能优化、系统分析的经历
● 有 GPU kernel / CUDA / OpenCL / SYCL / Triton 等相关经验
● 对 AI 模型的数值计算特性有理解或兴趣,涵盖低精度与量化计算、稀疏计算及其精度‑性能权衡,并关注其对 GPU 执行与性能优化的影响
● 接触过性能优化课程项目/编译器 / 并行计算 / 系统方向研究或实习
● 喜欢动手实验、调参数、看 profiling 数据、分析“为什么慢”,把软件行为和硬件结构对起来理解
● 对 AI 系统方向(而不只是模型本身)有长期兴趣
你能收获什么
● 参与 GPU 架构团队的核心工程工作
● 深入理解:AI workload → GPU Kernel → GPU IP 设计
● 为未来从事 AI Kernel、编译器与并行计算、芯片/软件协同方向 打下基础
岗位要求
关于这个岗位
如果你对 GPU 架构、底层性能优化、AI kernel 设计以及软硬件协同设计(HW/SW Co Design)充满兴趣,希望参与直接影响下一代 Intel GPU IP和AI加速器性能的核心工程工作,那么这个岗位非常适合你。
作为AI架构性能优化实习生(GPU Architecture 方向),你将加入Intel GPU Compute Architecture团队,深入参与GPU 核心计算 kernel 的分析、优化与验证工作,并通过真实 AI 工作负载,对 GPU IP的功能与性能进行系统性评估。
你将站在AI软件和GPU硬件的交汇点, 理解软件如何“逼出”硬件的极限性能。
________________________________________
你将做什么(实习内容)
在导师和团队的指导下,你将有机会参与:
• 面向 GPU 的核心计算 kernel 优化
o 分析并优化 AI / 数值计算中的关键 GPU kernels(如 GEMM、Attention、算子融合等)
o 研究 kernel 与 GPU 架构(SIMD / memory hierarchy / scheduling)的映射关系
• AI Model 数值特性与高效计算研究(Numeric & Sparse AI)
o 研究 AI 模型的数值特性(numeric behavior),包括数值稳定性、精度 性能权衡,以及低精度数值计算(FP16 / BF16 / INT8 / FP8 等) 在 GPU 上的表现
o 探索稀疏计算与量化感知技术(Sparsity / Quantization aware),分析其对GPU kernel实现、memory access与调度策略的影响,并反馈至架构设计决策
• 基于真实 AI 工作负载的 GPU IP 验证
o 复现和构建具有代表性的AI推理 / 训练工作负载
o 利用workload 验证 GPU IP的功能正确性、性能特征和边界行为
• 面向 GPU 架构的性能建模与分析
o 构建 kernel / workload 的性能画像
o 使用性能分析工具,定位性能瓶颈(compute / memory / pipeline / occupancy 等)
o 分析不同架构设计对性能的影响,并形成可复用的分析方法
• 软硬件协同设计(HW/SW Co Design)
o 将 kernel 和 workload 侧的发现反馈给 GPU 架构 / IP 设计团队
o 支持下一代 GPU 架构在 AI 场景下的设计决策
这是一个偏工程实践 + 学习成长型 的实习岗位,而非纯研究或纯应用开发。
不要求你什么都会,但希望你 对底层原理有兴趣、愿意深入、能从数据中找答案。
________________________________________
我们希望你具备
必备条件
• 本科、硕士或博士在读,专业包括(但不限于):计算机科学 / 计算机工程 / 电子工程 / 相关理工科专业
• 熟悉C/C++或Python,有较好的代码能力,能够用于模型、数据或系统分析任务
• 对 GPU / 并行计算 / 性能优化有强烈兴趣
• 对人工智能基础有系统理解,包括常见模型和算法
• 对AI 模型的数值计算特性有基础兴趣或认知
• 对计算机系统有基础认知(如 CPU/GPU、内存、并行执行与性能分析等)
• 具备良好的英语听说读写能力,能够在全球化工程团队中进行有效的技术沟通与协作。
不要求你什么都会,但希望你对底层原理有兴趣、愿意深入、能从数据中找答案。
________________________________________
加分项(有更好,没有也欢迎投递)
• 较强的逻辑分析和问题拆解能力
• 有课程项目、实验室或实习中接触性能优化、系统分析的经历
• 有 GPU kernel / CUDA / OpenCL / SYCL / Triton 等相关经验
• 对 AI 模型的数值计算特性有理解或兴趣,涵盖低精度与量化计算、稀疏计算及其精度 性能权衡,并关注其对 GPU 执行与性能优化的影响
• 接触过性能优化课程项目/编译器 / 并行计算 / 系统方向研究或实习
• 喜欢动手实验、调参数、看 profiling 数据、分析“为什么慢”,把软件行为和硬件结构对起来理解
• 对 AI 系统方向(而不只是模型本身)有长期兴趣
________________________________________
你能收获什么
• 参与 GPU 架构团队的核心工程工作
• 深入理解:AI workload → GPU Kernel → GPU IP 设计
• 为未来从事 AI Kernel、编译器与并行计算、芯片/软件协同方向 打下基础
申请
AI系统与LLM推理优化实习生
280-380元/天
上海
硕士
岗位职责
职位概述
我们正在构建新一代大语言模型(LLM)推理系统,重点聚焦三个核心方向:
● GPU Kernel 与 Triton 类编程模型优化
● 高性能推理框架(Inference Framework)优化
● LLM 与 MoE 模型层优化
这是一个研究 + 工程结合的岗位,你将参与完整技术栈:
模型 → Kernel → 运行时 → 分布式系统,共同打造端到端的AI机架级推理软件系统。
主要职责
1. Triton与Kernel层优化
● 使用以下技术开发高性能GPU算子:
● Triton类编程模型
● CUDA或其他底层框架
● 优化关键计算路径:
● Attention及核心Tensor算子
● 内存访问模式与数据布局
● Kernel融合与执行效率
● 探索面向深度学习的编译器式优化方法
2. 推理框架优化(Inference Framework)
● 使用并优化主流LLM推理框架:
● vLLM、TensorRT-LLM、FasterTransformer等
● 设计和优化:
● batching与调度策略
● runtime执行效率
● 多模型与pipeline推理
● 分析系统瓶颈并进行端到端性能优化
3. 模型层优化(LLM & MoE)
● 实现并评估以下技术:
● KV cache优化与内存管理
● 动态/连续batching
● Speculative decoding
● 量化(INT8 / FP8 / 低比特)
● 探索混合专家模型及推理优化:
● 路由策略与负载均衡
● 专家并行与切分
● 通信与计算开销权衡
4. 研究与系统集成
● 阅读并复现前沿研究成果
● 将论文方法转化为可运行系统模块
● 在以下维度进行协同优化:
● 模型层
● Kernel层
● Runtime与分布式系统
5. 端到端系统开发
● 参与构建完整LLM推理系统:
● 模型执行层
● runtime与调度层
● 分布式推理系统
● 优化方向包括:
● 多GPU / 多节点扩展
● NCCL通信性能
● 系统级性能调优
任职要求
基础要求
● 计算机、电子或相关专业硕士或博士在读(必须)
● 扎实的编程能力(Python 必须,C++加分)
● 熟悉PyTorch及Transformer模型
● 具备良好的算法与系统基础
● 可保证至少6个月实习期
加分项
● 具备以下任一经验:
● GPU编程(CUDA / Triton等)
● LLM推理框架(vLLM、TensorRT-LLM等)
● 分布式系统或并行计算
● 了解以下方向:
● GPU架构或性能分析
● 模型量化或压缩
● MoE或大规模模型系统
我们期待你具备
● 能够完成从论文 → 实现 → 优化的闭环
● 对性能优化与系统问题有强烈兴趣
● 具备解决复杂技术问题的执行力
● 对大规模LLM系统如何高效运行有好奇心
岗位要求
职位概述
我们正在构建新一代大语言模型(LLM)推理系统,重点聚焦三个核心方向:
GPU Kernel 与 Triton 类编程模型优化
高性能推理框架(Inference Framework)优化
LLM 与 MoE 模型层优化
这是一个研究 + 工程结合的岗位,你将参与完整技术栈:
模型 → Kernel → 运行时 → 分布式系统,共同打造端到端的AI机架级推理软件系统。
主要职责
1. Triton与Kernel层优化
使用以下技术开发高性能GPU算子:
Triton类编程模型
CUDA或其他底层框架
优化关键计算路径:
Attention及核心Tensor算子
内存访问模式与数据布局
Kernel融合与执行效率
探索面向深度学习的编译器式优化方法
2. 推理框架优化(Inference Framework)
使用并优化主流LLM推理框架:
vLLM、TensorRT-LLM、FasterTransformer等
设计和优化:
batching与调度策略
runtime执行效率
多模型与pipeline推理
分析系统瓶颈并进行端到端性能优化
3. 模型层优化(LLM & MoE)
实现并评估以下技术:
KV cache优化与内存管理
动态/连续batching
Speculative decoding
量化(INT8 / FP8 / 低比特)
探索混合专家模型及推理优化:
路由策略与负载均衡
专家并行与切分
通信与计算开销权衡
4. 研究与系统集成
阅读并复现前沿研究成果
将论文方法转化为可运行系统模块
在以下维度进行协同优化:
模型层
Kernel层
Runtime与分布式系统
5. 端到端系统开发
参与构建完整LLM推理系统:
模型执行层
runtime与调度层
分布式推理系统
优化方向包括:
多GPU / 多节点扩展
NCCL通信性能
系统级性能调优
任职要求
基础要求
计算机、电子或相关专业硕士或博士在读(必须)
扎实的编程能力(Python 必须,C++加分)
熟悉PyTorch及Transformer模型
具备良好的算法与系统基础
可保证至少6个月实习期
加分项
具备以下任一经验:
GPU编程(CUDA / Triton等)
LLM推理框架(vLLM、TensorRT-LLM等)
分布式系统或并行计算
了解以下方向:
GPU架构或性能分析
模型量化或压缩
MoE或大规模模型系统
我们期待你具备
能够完成从论文 → 实现 → 优化的闭环
对性能优化与系统问题有强烈兴趣
具备解决复杂技术问题的执行力
对大规模LLM系统如何高效运行有好奇心
申请
边缘模型研究优化实习生
280-380元/天
上海
硕士
岗位职责
职位描述
英特尔数据中心网络边缘AI团队致力于构建支持下一代工作负载的AI软件栈,覆盖基于Intel Xeon处理器和Intel
dGPU的边缘AI平台。我们为全球客户提供大规模多模态智能所需的算法、框架及性能优化。
我们正在寻找一名实习生,参与视觉-语言模型(VLM)和视觉-语言-动作模型(VLA)的研究与产品化工作。你将与资深软件工程师合作,推动多模态与具身智能(Embodied AI)的前沿发展,并确保模型能够在英特尔硬件上高效运行。
工作职责
开展VLM / VLA架构、预训练、微调及对齐技术(SFT、RLHF、DPO、GRPO)的应用研究;复现并扩展最新研究成果,如OpenVLA、RT-2、π0.5、PaLI-Gemma、Qwen-VL、InternVL等
设计并实现多模态数据处理流水线,包括图像-文本-动作数据的清洗、合成与增强
研究视觉编码器(ViT、SigLIP、DINOv2)与语言模型(LLaMA、Qwen、Mistral)的高效融合策略,包括连接器设计与视觉token压缩
探索VLA特有模块,如动作头(离散token化、扩散策略、流匹配)、长时序规划与闭环控制
应用模型优化技术(量化:INT8 / FP8 / INT4、AWQ、GPTQ、SmoothQuant;剪枝;蒸馏;KV-cache优化;推测解码)以实现模型在英特尔平台上的高效部署
与基础设施工程师合作,在Intel Xeon、Intel Gaudi、Intel Arc GPU、Intel Core Ultra(NPU)等平台上部署并进行性能评估
使用行业基准(MMBench、MME、SEED-Bench、LIBERO、SimplerEnv)评估模型,并参与内部评测体系建设
撰写技术报告,并在合适情况下投稿至顶级会议(NeurIPS、ICML、ICLR、CVPR、CoRL、RSS)
任职要求
基本要求
候选人需具备在工作所在国家合法工作的资格。
计算机科学、电气工程、人工智能、数学或相关专业在读硕士或博士
可连续实习至少3个月(全职或接近全职)
扎实的深度学习基础,包括Transformer、扩散模型和强化学习
熟练掌握Python和PyTorch;熟悉分布式训练(DeepSpeed、FSDP、Megatron-LM)
在以下至少一个方向有项目或论文经验:多模态大模型、具身智能/机器人学习、模型压缩与推理加速、视觉-语言预训练
加分项
有模型量化、剪枝或蒸馏经验;熟悉推理框架(PyTorch、vLLM、SGLang、TensorRT-LLM、llama.cpp)
有英特尔平台(Xeon、Arc、Core Ultra)部署经验
熟悉机器人仿真(Isaac Sim、MuJoCo、ManiSkill、RoboCasa)或真实机器人系统
在GitHub上有相关AI开源项目贡献
岗位要求
职位描述
英特尔数据中心网络边缘AI团队致力于构建支持下一代工作负载的AI软件栈,覆盖基于Intel Xeon处理器和Intel dGPU的边缘AI平台。我们为全球客户提供大规模多模态智能所需的算法、框架及性能优化。
我们正在寻找一名实习生,参与视觉-语言模型(VLM)和视觉-语言-动作模型(VLA)的研究与产品化工作。你将与资深软件工程师合作,推动多模态与具身智能(Embodied AI)的前沿发展,并确保模型能够在英特尔硬件上高效运行。
工作职责
• 开展VLM / VLA架构、预训练、微调及对齐技术(SFT、RLHF、DPO、GRPO)的应用研究;复现并扩展最新研究成果,如OpenVLA、RT-2、π0.5、PaLI-Gemma、Qwen-VL、InternVL等
• 设计并实现多模态数据处理流水线,包括图像-文本-动作数据的清洗、合成与增强
• 研究视觉编码器(ViT、SigLIP、DINOv2)与语言模型(LLaMA、Qwen、Mistral)的高效融合策略,包括连接器设计与视觉token压缩
• 探索VLA特有模块,如动作头(离散token化、扩散策略、流匹配)、长时序规划与闭环控制
• 应用模型优化技术(量化:INT8 / FP8 / INT4、AWQ、GPTQ、SmoothQuant;剪枝;蒸馏;KV-cache优化;推测解码)以实现模型在英特尔平台上的高效部署
• 与基础设施工程师合作,在Intel Xeon、Intel Gaudi、Intel Arc GPU、Intel Core Ultra(NPU)等平台上部署并进行性能评估
• 使用行业基准(MMBench、MME、SEED-Bench、LIBERO、SimplerEnv)评估模型,并参与内部评测体系建设
• 撰写技术报告,并在合适情况下投稿至顶级会议(NeurIPS、ICML、ICLR、CVPR、CoRL、RSS)
任职要求
基本要求
候选人需具备在工作所在国家合法工作的资格。
• 计算机科学、电气工程、人工智能、数学或相关专业在读硕士或博士
• 可连续实习至少3个月(全职或接近全职)
• 扎实的深度学习基础,包括Transformer、扩散模型和强化学习
• 熟练掌握Python和PyTorch;熟悉分布式训练(DeepSpeed、FSDP、Megatron-LM)
• 在以下至少一个方向有项目或论文经验:多模态大模型、具身智能/机器人学习、模型压缩与推理加速、视觉-语言预训练
加分项
• 有模型量化、剪枝或蒸馏经验;熟悉推理框架(PyTorch、vLLM、SGLang、TensorRT-LLM、llama.cpp)
• 有英特尔平台(Xeon、Arc、Core Ultra)部署经验
• 熟悉机器人仿真(Isaac Sim、MuJoCo、ManiSkill、RoboCasa)或真实机器人系统
• 在GitHub上有相关AI开源项目贡献
申请
CPU算子与内核优化实习生
220-380元/天
上海
本科
岗位职责
职位描述
英特尔数据中心网络边缘AI团队致力于在英特尔架构上提供业界领先的AI性能。从基于Intel Xeon处理器的超大规模数据中心到网络边缘节点,我们的性能工程师持续优化框架与算子库的核心计算路径,为全球数百万开发者和客户提供支持。
我们正在寻找一名实习生加入CPU性能工程团队,针对现代AI工作负载进行算子级优化,包括基于Transformer的LLM、多模态VLM/VLA模型、传统CNN以及MLP等。你将设计、实现并调优高性能CPU内核,将英特尔架构优势(AVX-512、AMX、VNNI)转化为实际性能收益。
工作职责
设计并手工优化Transformer算子(Attention、GEMM、LayerNorm、RMSNorm、RoPE、MoE、Softmax)及经典算子(Conv2D / Conv3D、Depthwise Conv、Winograd、im2col、Pooling、BatchNorm、RNN / LSTM / GRU)
使用Intel AVX2 / AVX-512 /
AMX / VNNI指令进行SIMD优化,并在必要时支持ARM Neon / SVE
应用并行优化策略(OpenMP、TBB、线程池设计),并充分利用CPU微架构特性(缓存分块、NUMA亲和性、预取、内存对齐、避免伪共享)
实现并优化低比特量化内核(INT8 / INT4 / W4A16 /
W8A8),用于LLM / VLM推理,充分利用AMX与VNNI提升性能功耗比
将自定义算子集成到生产级框架与运行时中,如Intel oneDNN、PyTorch CPU后端、ONNX Runtime、llama.cpp、MLC-LLM、XNNPACK
使用Intel VTune Profiler、Linux perf及roofline模型进行系统化性能分析,定位瓶颈并量化优化效果
为英特尔内部性能库贡献可复用内核、优化模板和最佳实践文档
任职要求
基本要求
候选人需具备在工作所在国家合法工作的资格。
计算机科学、电气工程、计算机工程、并行计算或相关专业本科(高年级)、硕士或博士在读
可连续实习至少3个月(全职或接近全职)
熟练掌握C / C++,深入理解计算机体系结构(CPU流水线、缓存层级、内存模型、SIMD执行)
至少具备以下之一的实践经验:
x86 SIMD指令(AVX2 / AVX-512 / AMX)
ARM Neon / SVE
基于OpenMP / TBB的多线程优化
高性能CPU GEMM或卷积实现(如oneDNN、OpenBLAS、XNNPACK、ggml)
熟悉性能分析工具(Intel VTune、perf),并能将分析结果转化为具体优化方案
加分项
在oneDNN、OpenVINO、llama.cpp、ggml、XNNPACK、OpenBLAS、PyTorch或ONNX Runtime等项目中有开源贡献
熟悉CNN推理优化(Winograd、im2col+GEMM、Direct Conv、NCHW / NHWC布局转换)
熟悉LLM推理优化(KV-cache、连续batching、推测解码、低比特量化)
熟悉编译器技术(LLVM、MLIR、TVM)或自动调优框架(AutoTVM、Ansor)
有边缘设备或端侧部署经验(ARM服务器、AI PC、嵌入式SoC)
岗位要求
职位描述
英特尔数据中心网络边缘AI团队致力于在英特尔架构上提供业界领先的AI性能。从基于Intel Xeon处理器的超大规模数据中心到网络边缘节点,我们的性能工程师持续优化框架与算子库的核心计算路径,为全球数百万开发者和客户提供支持。
我们正在寻找一名实习生加入CPU性能工程团队,针对现代AI工作负载进行算子级优化,包括基于Transformer的LLM、多模态VLM/VLA模型、传统CNN以及MLP等。你将设计、实现并调优高性能CPU内核,将英特尔架构优势(AVX-512、AMX、VNNI)转化为实际性能收益。
工作职责
• 设计并手工优化Transformer算子(Attention、GEMM、LayerNorm、RMSNorm、RoPE、MoE、Softmax)及经典算子(Conv2D / Conv3D、Depthwise Conv、Winograd、im2col、Pooling、BatchNorm、RNN / LSTM / GRU)
• 使用Intel AVX2 / AVX-512 / AMX / VNNI指令进行SIMD优化,并在必要时支持ARM Neon / SVE
• 应用并行优化策略(OpenMP、TBB、线程池设计),并充分利用CPU微架构特性(缓存分块、NUMA亲和性、预取、内存对齐、避免伪共享)
• 实现并优化低比特量化内核(INT8 / INT4 / W4A16 / W8A8),用于LLM / VLM推理,充分利用AMX与VNNI提升性能功耗比
• 将自定义算子集成到生产级框架与运行时中,如Intel oneDNN、PyTorch CPU后端、ONNX Runtime、llama.cpp、MLC-LLM、XNNPACK
• 使用Intel VTune Profiler、Linux perf及roofline模型进行系统化性能分析,定位瓶颈并量化优化效果
• 为英特尔内部性能库贡献可复用内核、优化模板和最佳实践文档
任职要求
基本要求
候选人需具备在工作所在国家合法工作的资格。
• 计算机科学、电气工程、计算机工程、并行计算或相关专业本科(高年级)、硕士或博士在读
• 可连续实习至少3个月(全职或接近全职)
• 熟练掌握C / C++,深入理解计算机体系结构(CPU流水线、缓存层级、内存模型、SIMD执行)
• 至少具备以下之一的实践经验:
o x86 SIMD指令(AVX2 / AVX-512 / AMX)
o ARM Neon / SVE
o 基于OpenMP / TBB的多线程优化
o 高性能CPU GEMM或卷积实现(如oneDNN、OpenBLAS、XNNPACK、ggml)
• 熟悉性能分析工具(Intel VTune、perf),并能将分析结果转化为具体优化方案
加分项
• 在oneDNN、OpenVINO、llama.cpp、ggml、XNNPACK、OpenBLAS、PyTorch或ONNX Runtime等项目中有开源贡献
• 熟悉CNN推理优化(Winograd、im2col+GEMM、Direct Conv、NCHW / NHWC布局转换)
• 熟悉LLM推理优化(KV-cache、连续batching、推测解码、低比特量化)
• 熟悉编译器技术(LLVM、MLIR、TVM)或自动调优框架(AutoTVM、Ansor)
有边缘设备或端侧部署经验(ARM服务器、AI PC、嵌入式SoC)
申请
VLA算法工程师
280-360元/天
北京
硕士
岗位职责
职位概述
本职位聚焦VLA(视觉-语言-动作)算法在机器人场景中的研究与应用,承担VLA数据采集、模型微调、性能测试、问题分析及优化的全流程工作,要求熟练掌握VLA算法(例如PI05)及lerobot框架,能够运用Python完成模型训练与优化,推动VLA技术在机器人系统中的高效应用。
岗位职责
● 负责VLA(视觉-语言-动作)相关数据的采集、整理与校验,保障数据质量与完整性,适配模型训练需求,支撑机器人场景下的模型优化工作。
● 基于现有模型进行微调(finetune),结合VLA算法特性与机器人应用场景,优化模型训练流程,提升模型适配性与执行精度。
● 设计合理的测试方案,对微调后的模型进行全面性能测试,量化评估模型准确率、泛化能力等关键指标,详细记录并整理测试结果。
● 深入分析模型测试过程中出现的问题,定位性能瓶颈,结合VLA算法原理与机器人系统特性,提出针对性优化方案并落地实施。
● 持续跟踪VLA领域前沿技术及lerobot框架更新,迭代优化模型性能,确保模型在机器人实际应用场景中稳定高效运行。
任职要求
● 熟练掌握VLA算法原理及应用(例如PI05),深入了解VLA模型核心架构。
● 熟悉lerobot框架的使用,了解其数据采集、模型部署相关功能,能够运用框架完成机器人相关算法的落地与调试。
● 熟悉机器人系统基本原理与运作机制,了解机器人感知、控制相关基础,能够结合机器人场景优化模型性能。
● 精通Python编程语言,熟悉常用的数据处理及机器学习库(如PyTorch、TensorFlow等),具备扎实的代码编写与调试能力。
● 具备良好的问题分析与解决能力、团队协作意识,工作认真负责,对VLA与机器人结合领域有浓厚兴趣和钻研精神
岗位要求
职位概述
本职位聚焦VLA(视觉-语言-动作)算法在机器人场景中的研究与应用,承担VLA数据采集、模型微调、性能测试、问题分析及优化的全流程工作,要求熟练掌握VLA算法(例如PI05)及lerobot框架,能够运用Python完成模型训练与优化,推动VLA技术在机器人系统中的高效应用。
岗位职责
负责VLA(视觉-语言-动作)相关数据的采集、整理与校验,保障数据质量与完整性,适配模型训练需求,支撑机器人场景下的模型优化工作。
基于现有模型进行微调(finetune),结合VLA算法特性与机器人应用场景,优化模型训练流程,提升模型适配性与执行精度。
设计合理的测试方案,对微调后的模型进行全面性能测试,量化评估模型准确率、泛化能力等关键指标,详细记录并整理测试结果。
深入分析模型测试过程中出现的问题,定位性能瓶颈,结合VLA算法原理与机器人系统特性,提出针对性优化方案并落地实施。
持续跟踪VLA领域前沿技术及lerobot框架更新,迭代优化模型性能,确保模型在机器人实际应用场景中稳定高效运行。
任职要求
熟练掌握VLA算法原理及应用(例如PI05),深入了解VLA模型核心架构。
熟悉lerobot框架的使用,了解其数据采集、模型部署相关功能,能够运用框架完成机器人相关算法的落地与调试。
熟悉机器人系统基本原理与运作机制,了解机器人感知、控制相关基础,能够结合机器人场景优化模型性能。
精通Python编程语言,熟悉常用的数据处理及机器学习库(如PyTorch、TensorFlow等),具备扎实的代码编写与调试能力。
具备良好的问题分析与解决能力、团队协作意识,工作认真负责,对VLA与机器人结合领域有浓厚兴趣和钻研精神
申请
高效 AI 解决方案工程实习生
280-360元/天
北京
硕士
岗位职责
Job Description
● The intern will contribute to cutting-edge AI research and engineering at Intel Labs China, working closely with leading researchers to develop efficient algorithm solutions for accelerating large AI models and agentic systems, with an emphasis on deployment in resource-constrained computing platforms.
Qualifications
● 1. Master/PhD candidate in Computer Science, Electrical Engineering, Automation or related;
● 2. Good background on machine learning, deep learning and LLM related areas;
● 3. Matured on Pytorch, C/C++, and script languages (e.g. Shell and Python);
● 4. Experienced in Linux develop environment;
● 5. At least work 3 days per week for 6 months and above.
岗位要求
1. Master/PhD candidate in Computer Science, Electrical Engineering, Automation or related;
2. Good background on machine learning, deep learning and LLM related areas;
3. Matured on Pytorch, C/C++, and script languages (e.g. Shell and Python);
4. Experienced in Linux develop environment;
5. At least work 3 days per week for 6 months and above.
申请
芯片验证实习生
280-360元/天
上海
硕士
岗位职责
工作地点:上海
工作职责:
验证工程师负责IP 或 SOC 上一个或多个功能模块并执行相关的验证任务,包括使用UVM方法搭建测试平台以及创建测试用例。
● 创建测试用例以验证系统是否满足设计要求;
● RTL级和网表级(GLS)仿真;
● 制定验证测试计划,定义和运行系统仿真模型,分析调试各种错误与RTL中设计bug;
● 协助FPGA验证和硅片验证,协助系统的验证和测试工作;
● 搭建回归以及大规模测试用例验证的环境。分析代码覆盖率和功能覆盖率,实现覆盖率和bug曲线的收敛;
● 能读懂并创建不同测试平台的测试计划:IP库/复杂IP以及子系统。
任职要求:
● 本科及以上学历,微电子、计算机、电子信息等相关专业;
● 熟悉Verilog和System Verilog语言和SVA;
● 熟悉UVM验证环境,有使用UVM搭建环境的经验;
● 熟悉Linux/Unix环境,熟悉Perl(或者Python)和Shell脚本语言;
● 良好的英文文献阅读能力和沟通能力;
● 能够在充满活力和以部门为导向的环境中工作。
岗位要求
任职要求:
• 本科及以上学历,微电子、计算机、电子信息等相关专业;
• 熟悉Verilog和System Verilog语言和SVA;
• 熟悉UVM验证环境,有使用UVM搭建环境的经验;
• 熟悉Linux/Unix环境,熟悉Perl(或者Python)和Shell脚本语言;
• 良好的英文文献阅读能力和沟通能力;
• 能够在充满活力和以部门为导向的环境中工作。
申请
云数据中心及人工智能系统实习生
280-380元/天
上海
硕士
岗位职责
职位描述(Job Description)
在该岗位中,你将与系统可靠性研究团队/平台工程团队合作,聚焦于 RAS(Reliability, Availability, Serviceability:可靠性/可用性/可维护性) 以及 静默数据错误 SDE(Silent Data Error) 的特性分析(表征)与缓解(mitigation),覆盖 AI 与通用计算平台,包括异构系统(CPU + GPU/加速器)以及大规模服务器集群。
你将协助在具有代表性的 AI 训练/推理 与 云工作负载下设计并运行实验,分析集群规模(fleet-scale)的日志/遥测数据,并原型化(prototype)检测/诊断方法,以提升贯穿 硬件/固件/操作系统/运行时(HW/FW/OS/runtime) 全栈的端到端数据完整性与平台鲁棒性。
工作职责(Responsibilities,包括但不限于)
● 收集、清洗并分析来自 CPU 服务器及带加速器节点的平台遥测/错误日志(例如:内存 DDR/HBM、存储、互连、PCIe/CXL、fabric 互联等),识别错误特征(error signatures)与失效模式(failure patterns)。
● 设计并执行故障注入(fault injection)、压力测试或工作负载驱动实验,复现 AI 训练/推理与通用计算负载中的静默数据损坏场景,并验证假设。
● 研究并分析生产/在役环境中的 **in-field scan(在役扫描)**与 **lockstep mode(锁步模式)**能力(覆盖范围、局限性、触发条件、对 AI/CPU 工作负载的影响等),并评估如何在量产环境中利用这些能力提升静默错误检测与数据完整性。
● 研究并分析 **SLM(Silicon Lifecycle Management:硅生命周期管理)**方案,并将其与平台遥测结合,实现在线健康监测、退化/趋势分析,以及面向 AI/CPU 平台的主动可靠性提升。
● 开发脚本/工具(优先 Python)以自动化数据处理、实验编排与报告生成;必要时构建仪表盘(dashboard)或可复用的数据流水线(pipeline)。
● 学习并评估 AI + CPU 平台的缓解技术(例如:ECC/CRC/EDAC、scrubbing 策略、重试/恢复、检查点/重启、在数据/通信边界的端到端校验等),并量化其有效性与性能/成本影响之间的权衡。
● 与跨职能团队协作(硬件 HW、固件 FW、操作系统 OS、驱动/运行时 driver/runtime、数据中心运维 datacenter operations),追踪错误传播路径并推动可落地改进;撰写文档并定期汇报进展与结论。
任职资格(Qualifications)
我们优先考虑对 AI 与通用计算平台上的系统可靠性/数据完整性研究感兴趣的候选人。要求包括但不限于:
● 硕士/博士生(PhD):计算机科学/计算机工程/电子工程/数学/统计或相关专业。
● 扎实的 Python 编程能力;具备 Linux 使用经验与基础脚本能力;熟悉 GitHub Copilot者加分。
● 较强的数据分析能力;有 **pandas / numpy / matplotlib、SQL 或日志分析(log analytics)**经验者加分。
● 具备计算机体系结构与系统基础理解(如内存层次、存储、网络等)者优先;熟悉 RAS 相关概念(如 ECC、CRC、奇偶校验 parity、scrubbing、检查点 checkpoints 等)者加分。
● 了解 AI 系统栈者加分:GPU/加速器、驱动/运行时、分布式训练/推理、集体通信(communication collectives)、数据流水线,以及性能与可靠性的权衡。
● 需要具备良好的 中文与英文沟通能力(口头与书面)。
● 具备研究思维:能够提出假设、设计实验,并撰写清晰的技术报告。
岗位要求
职位描述(Job Description)
在该岗位中,你将与系统可靠性研究团队/平台工程团队合作,聚焦于 RAS(Reliability, Availability, Serviceability:可靠性/可用性/可维护性) 以及 静默数据错误 SDE(Silent Data Error) 的特性分析(表征)与缓解(mitigation),覆盖 AI 与通用计算平台,包括异构系统(CPU + GPU/加速器)以及大规模服务器集群。
你将协助在具有代表性的 AI 训练/推理 与 云工作负载下设计并运行实验,分析集群规模(fleet-scale)的日志/遥测数据,并原型化(prototype)检测/诊断方法,以提升贯穿 硬件/固件/操作系统/运行时(HW/FW/OS/runtime) 全栈的端到端数据完整性与平台鲁棒性。
________________________________________
工作职责(Responsibilities,包括但不限于)
• 收集、清洗并分析来自 CPU 服务器及带加速器节点的平台遥测/错误日志(例如:内存 DDR/HBM、存储、互连、PCIe/CXL、fabric 互联等),识别错误特征(error signatures)与失效模式(failure patterns)。
• 设计并执行故障注入(fault injection)、压力测试或工作负载驱动实验,复现 AI 训练/推理与通用计算负载中的静默数据损坏场景,并验证假设。
• 研究并分析生产/在役环境中的 **in-field scan(在役扫描)**与 **lockstep mode(锁步模式)**能力(覆盖范围、局限性、触发条件、对 AI/CPU 工作负载的影响等),并评估如何在量产环境中利用这些能力提升静默错误检测与数据完整性。
• 研究并分析 **SLM(Silicon Lifecycle Management:硅生命周期管理)**方案,并将其与平台遥测结合,实现在线健康监测、退化/趋势分析,以及面向 AI/CPU 平台的主动可靠性提升。
• 开发脚本/工具(优先 Python)以自动化数据处理、实验编排与报告生成;必要时构建仪表盘(dashboard)或可复用的数据流水线(pipeline)。
• 学习并评估 AI + CPU 平台的缓解技术(例如:ECC/CRC/EDAC、scrubbing 策略、重试/恢复、检查点/重启、在数据/通信边界的端到端校验等),并量化其有效性与性能/成本影响之间的权衡。
• 与跨职能团队协作(硬件 HW、固件 FW、操作系统 OS、驱动/运行时 driver/runtime、数据中心运维 datacenter operations),追踪错误传播路径并推动可落地改进;撰写文档并定期汇报进展与结论。
________________________________________
任职资格(Qualifications)
我们优先考虑对 AI 与通用计算平台上的系统可靠性/数据完整性研究感兴趣的候选人。要求包括但不限于:
• 硕士/博士生(PhD):计算机科学/计算机工程/电子工程/数学/统计或相关专业。
• 扎实的 Python 编程能力;具备 Linux 使用经验与基础脚本能力;熟悉 GitHub Copilot者加分。
• 较强的数据分析能力;有 **pandas / numpy / matplotlib、SQL 或日志分析(log analytics)**经验者加分。
• 具备计算机体系结构与系统基础理解(如内存层次、存储、网络等)者优先;熟悉 RAS 相关概念(如 ECC、CRC、奇偶校验 parity、scrubbing、检查点 checkpoints 等)者加分。
• 了解 AI 系统栈者加分:GPU/加速器、驱动/运行时、分布式训练/推理、集体通信(communication collectives)、数据流水线,以及性能与可靠性的权衡。
• 需要具备良好的 中文与英文沟通能力(口头与书面)。
• 具备研究思维:能够提出假设、设计实验,并撰写清晰的技术报告。
申请
软件/固件测试开发实习生
280-360元/天
上海
硕士
岗位职责
工作职责:
该实习生职位正在寻找一位对固件测试开发工作感兴趣的优秀在校学生。候选人预计将从事开发各种测试脚本,自动化,AI 测试等领域。
● 能读懂软件固件架构以及质量控制要求,理解相关测试用例;
● 设计自动化脚本,或者负责无人值守测试的一个或多个管道开发, 提高测试自动化率;
● 维护基于AI的智能验证系统的开发和部署,以及自动化验证。
任职要求:
● 本科及以上学历,就读于计算机、电子工程等相关专业;
● C/C++或者嵌入式系统编程经验,熟悉一种或以上CPU架构如x86, ARM, RISC-V等;
● 有Python自动化开发经验者优先;
● 有软件固件测试开发或windows/Linux软件测试经验者优先;
● 熟悉生成式人工智能算法,有Agent、MCP等大模型应用使用部署经验,熟悉GPT、Claude等大模型应用;
● 良好的自我驱动以及团队合作精神。
每周至少能有3-4天工作时间并能持续半年以上。
岗位要求
本科及以上学历,就读于计算机、电子工程等相关专业;
C/C++或者嵌入式系统编程经验,熟悉一种或以上CPU架构如x86, ARM, RISC-V等;
有Python自动化开发经验者优先;
有软件固件测试开发或windows/Linux软件测试经验者优先;
熟悉生成式人工智能算法,有Agent、MCP等大模型应用使用部署经验,熟悉GPT、Claude等大模型应用;
良好的自我驱动以及团队合作精神。
申请
AI 安全工程师实习生
280-360元/天
上海
硕士
岗位职责
我们正在招聘一名 AI 安全工程师实习生,参与基于 大语言模型(LLM)的 AI Agent 在安全工程领域的设计与开发。该岗位聚焦于使用 AI Agent 技术,提升安全分析和工程流程的自动化与智能化水平。
工作内容
● 设计和开发面向安全工程的 AI Agents,支持以下场景:
● CVE 漏洞分析、分级与初步研判
● 安全公告(Security Advisory)的整理与生成
● SDL(安全开发生命周期)相关任务的自动化支持
● 调研并实践最新的 AI Agent 技术与框架,包括但不限于:OpenClaw、OpenCode 等
● 与安全工程师协作,将 AI Agent 能力集成到实际安全工具与流程中
任职要求
● 计算机科学、网络安全、人工智能或相关专业在读(本科或硕士)
● 具备扎实的 Python 编程能力
● 了解基本的软件安全概念,如:CVE / CWE,安全开发生命周期(SDL)
● 对大语言模型、Prompt 设计或 AI Agent 有学习兴趣和实践经验
● 具备较强的学习,沟通能力和工程实践意愿
加分项
● 使用过 AI Agent / Coding Agent 框架或工具
● 有安全分析、自动化工具、或 AI 相关项目经验(GitHub / 项目展示加分)
● 了解 API 设计或 Agent 作为服务的使用方式
工作地点: 上海
实习周期: 6 个月,每周3天以上
岗位要求
任职要求
• 计算机科学、网络安全、人工智能或相关专业在读(本科或硕士)
• 具备扎实的 Python 编程能力
• 了解基本的软件安全概念,如:CVE / CWE,安全开发生命周期(SDL)
• 对大语言模型、Prompt 设计或 AI Agent 有学习兴趣和实践经验
• 具备较强的学习,沟通能力和工程实践意愿
加分项
• 使用过 AI Agent / Coding Agent 框架或工具
• 有安全分析、自动化工具、或 AI 相关项目经验(GitHub / 项目展示加分)
• 了解 API 设计或 Agent 作为服务的使用方式
申请
Firmware(固件)开发实习生
280-360元/天
上海
硕士
岗位职责
我们是位于上海紫竹的英特尔亚太研发中心的芯片工程团队。我们团队主要负责全球芯片 Firmware(固件)的开发。在这里你将:
- 参与芯片固件和系统软件的开发和测试,芯片功能的验证
- 使用芯片固件开发的工具
- 参与那些重要,复杂,且有趣的问题的分析与解决
- 基于前沿技术开发芯片的功能,提高我们的芯片的质量和性能
- 和全球各个国家的工程师一起工作,了解不同国家的文化。
- 以及学习如何系统化思考,如何进行软件质量管理,如何提高软件质量,如何设计软件开发流程等
- 以及了解intel的文化等
要求:
- 良好的中英文沟通能力,并能独立学习,自主工作。
- 愿意学习新知识并能快速运用
- 基本的脚本及编程基础,比如C++, C, 汇编语言等
- 了解IA32和X64系统架构,操作系统,硬件架构基本知识
- 计算机,电子工程及相关专业研究生2年级的学生,每周至少能有3-4天工作时间并能持续半年以上。
岗位要求
要求:
- 良好的中英文沟通能力,并能独立学习,自主工作。
- 愿意学习新知识并能快速运用
- 基本的脚本及编程基础,比如C++, C, 汇编语言等
- 了解IA32和X64系统架构,操作系统,硬件架构基本知识
- 计算机,电子工程及相关专业研究生,每周至少能有3-4天工作时间并能持续半年以上。
申请
性能优化与验证实习生
280-360元/天
上海
硕士
岗位职责
实习岗位概述
作为 I/O 性能优化与验证实习生,你将参与Intel Xeon 处理器平台级 I/O 性能工作,重点面向中国头部云服务提供商(CSP)的实际系统与工作负载。
在资深 PTP 工程师的指导下,你将参与 平台级 I/O 性能验证、基准测试、分析与优化支持工作,覆盖存储、网络与 AI 系统 I/O 路径,并接触 Xeon 产品开发流程中的关键阶段。
核心职责(实习生职责范围)
1. Xeon 平台级 I/O 性能支持
● 参与 Xeon 平台级 I/O 性能验证与优化支持工作,涵盖:
● CPU / PCIe 设备 / 内存 / 系统拓扑
● BIOS / 固件 / 操作系统 / 驱动栈
● 执行既定测试用例,采集性能数据,协助分析性能差异和潜在瓶颈。
重点能力方向:I/O Benchmark 开发与分段性能评估
I/O 性能基准测试与评估能力(核心能力之一)
实习生将重点培养 I/O 性能基准(benchmark)设计、执行与分析能力,学习如何针对不同 I/O 细分场景进行性能评估。
你将逐步学习:
● 选择和使用 能够代表真实 CSP 工作负载的 I/O benchmarks
● 设计 结构化、可复现的测试方法
● 从 不同 I/O 细分维度(segment) 理解系统行为,而非孤立解读性能结果
I/O 细分方向(以能力 exposure 为主,非强制专精)
A. 存储 I/O(NVMe / 块存储)
● 支持 NVMe 与块存储系统 的性能测试与分析工作。
● 参与评估以下不同维度下的存储性能表现:
● 随机 / 顺序 I/O
● 延迟敏感型 vs 吞吐型负载
● 单设备 vs 多设备扩展场景
● 协助分析 PCIe 拓扑、软件栈配置对存储性能的影响。
能力目标:理解存储性能数字背后的系统原因,而不仅是 IOPS 或带宽结果。
B. 网络 I/O(Ethernet / RDMA)
● 协助执行 网络 I/O 性能测试,支持评估:
● 吞吐、延迟与扩展性
● 网络负载下的 CPU 使用效率
● 学习从以下角度分析网络性能:
● 报文大小
● 并发度与 CPU 绑定
● NUMA / 系统拓扑影响
能力目标:理解 Xeon 平台特性对 CSP 网络 I/O 性能的影响方式。
C. AI 系统 I/O(CPU 为中心的 AI 平台)
● 参与 AI 系统中 I/O 性能特性的分析与评估支持,典型场景包括:
● Xeon 作为 AI Head Node
● Xeon 作为加速器系统的 Host CPU
● 协助分析:
● 数据移动效率
● CPU‑设备 I/O 路径行为
● 系统 I/O 平衡性
能力目标:理解系统 I/O 在 AI 平台整体性能中的作用。
Benchmark 分析与工程表达能力
在各 I/O 方向中,实习生将逐步掌握:
● 性能结果合理性检查(sanity check)
● 不同配置或软件栈下的对比分析
● 以工程视角撰写 技术说明或测试总结
● 向资深工程师清晰表达观察结果与疑问
基本要求
● 在读 本科或硕士,专业包括但不限于:
● 计算机科学
● 计算机工程
● 电子 / 电气工程
● 具备 I/O 相关基础背景(如操作系统、存储、网络、体系结构等)。
● 熟悉 Linux 使用环境。
● 具备一定编程或脚本能力(如 Python、Shell、C/C++)。
● 对 系统级性能分析与优化具有强烈兴趣。
加分项(非必需)
● 有 I/O、系统、存储、网络或性能方向相关的 实习或项目经验。
● 接触过性能测试、benchmark 或系统调试。
● 对云计算或 AI 基础设施有一定认知。
岗位要求
实习岗位概述
作为 I/O 性能优化与验证实习生,你将参与Intel Xeon 处理器平台级 I/O 性能工作,重点面向中国头部云服务提供商(CSP)的实际系统与工作负载。
在资深 PTP 工程师的指导下,你将参与 平台级 I/O 性能验证、基准测试、分析与优化支持工作,覆盖存储、网络与 AI 系统 I/O 路径,并接触 Xeon 产品开发流程中的关键阶段。
核心职责(实习生职责范围)
1. Xeon 平台级 I/O 性能支持
参与 Xeon 平台级 I/O 性能验证与优化支持工作,涵盖:
CPU / PCIe 设备 / 内存 / 系统拓扑
BIOS / 固件 / 操作系统 / 驱动栈
执行既定测试用例,采集性能数据,协助分析性能差异和潜在瓶颈。
重点能力方向:I/O Benchmark 开发与分段性能评估
I/O 性能基准测试与评估能力(核心能力之一)
实习生将重点培养 I/O 性能基准(benchmark)设计、执行与分析能力,学习如何针对不同 I/O 细分场景进行性能评估。
你将逐步学习:
选择和使用 能够代表真实 CSP 工作负载的 I/O benchmarks
设计 结构化、可复现的测试方法
从 不同 I/O 细分维度(segment) 理解系统行为,而非孤立解读性能结果
I/O 细分方向(以能力 exposure 为主,非强制专精)
A. 存储 I/O(NVMe / 块存储)
支持 NVMe 与块存储系统 的性能测试与分析工作。
参与评估以下不同维度下的存储性能表现:
随机 / 顺序 I/O
延迟敏感型 vs 吞吐型负载
单设备 vs 多设备扩展场景
协助分析 PCIe 拓扑、软件栈配置对存储性能的影响。
能力目标:理解存储性能数字背后的系统原因,而不仅是 IOPS 或带宽结果。
B. 网络 I/O(Ethernet / RDMA)
协助执行 网络 I/O 性能测试,支持评估:
吞吐、延迟与扩展性
网络负载下的 CPU 使用效率
学习从以下角度分析网络性能:
报文大小
并发度与 CPU 绑定
NUMA / 系统拓扑影响
能力目标:理解 Xeon 平台特性对 CSP 网络 I/O 性能的影响方式。
C. AI 系统 I/O(CPU 为中心的 AI 平台)
参与 AI 系统中 I/O 性能特性的分析与评估支持,典型场景包括:
Xeon 作为 AI Head Node
Xeon 作为加速器系统的 Host CPU
协助分析:
数据移动效率
CPU‑设备 I/O 路径行为
系统 I/O 平衡性
能力目标:理解系统 I/O 在 AI 平台整体性能中的作用。
Benchmark 分析与工程表达能力
在各 I/O 方向中,实习生将逐步掌握:
性能结果合理性检查(sanity check)
不同配置或软件栈下的对比分析
以工程视角撰写 技术说明或测试总结
向资深工程师清晰表达观察结果与疑问
基本要求
在读 本科或硕士,专业包括但不限于:
计算机科学
计算机工程
电子 / 电气工程
具备 I/O 相关基础背景(如操作系统、存储、网络、体系结构等)。
熟悉 Linux 使用环境。
具备一定编程或脚本能力(如 Python、Shell、C/C++)。
对 系统级性能分析与优化具有强烈兴趣。
加分项(非必需)
有 I/O、系统、存储、网络或性能方向相关的 实习或项目经验。
接触过性能测试、benchmark 或系统调试。
对云计算或 AI 基础设施有一定认知。
申请
平台软件验证实习生
220-300元/天
上海
本科
岗位职责
职位描述
英特尔数据中心部门正在招聘一名软件验证实习生。在此岗位上,您将协助英特尔软件验证工程师或调试工程师创建测试用例并编写自动化脚本。我们希望您能有效地验证平台、定位问题根本原因并与跨职能团队协作。您还将开发AI解决方案,以促进脚本自动化、测试用例执行和问题调试。我们希望您能协助提高英特尔至强产品的质量。
任职资格
能够使用 Python、C++ 或其他编程语言之一编写高质量代码。
熟悉 Linux 和 Windows 的命令行操作以及
Shell 编程。
具备AI意识以及AI解决方案开发的实际经验。
具备专业的英文文档和规范读写能力。
拥有计算机科学或相关工程领域的硕士学位
岗位要求
职位描述
英特尔数据中心部门正在招聘一名软件验证实习生。在此岗位上,您将协助英特尔软件验证工程师或调试工程师创建测试用例并编写自动化脚本。我们希望您能有效地验证平台、定位问题根本原因并与跨职能团队协作。您还将开发AI解决方案,以促进脚本自动化、测试用例执行和问题调试。我们希望您能协助提高英特尔至强产品的质量。
任职资格
能够使用 Python、C++ 或其他编程语言之一编写高质量代码。
熟悉 Linux 和 Windows 的命令行操作以及 Shell 编程。
具备AI意识以及AI解决方案开发的实际经验。
具备专业的英文文档和规范读写能力。
拥有计算机科学或相关工程领域的硕士学位。
申请
AI 软件工程实习生(北京/深圳)
280-360元/天
北京
硕士
岗位职责
加入英特尔技术赋能事业部(Technology Enablement Group, TEG)Client ADC 团队,担任 AI 软件工程实习生。在该岗位中,你将专注于在 AI PC 平台上开发与使能 Agentic AI 系统,支持下一代客户端 AI 体验。
你将参与构建 Agentic AI 工作流,在 AI PC 平台上搭建 AI 环境,探索与验证新的 AI 模型和应用,并使能预训模型调优。本岗位强调动手工程能力,覆盖 AI 基础设施、系统环境搭建,以及面向智能体的 AI 工作负载落地。
你的工作将助力 AI PC 的 Agentic AI 能力与技能栈建设,你的产出将直接支持英特尔客户端 AI 软件生态建设与未来产品就绪。
主要职责
● 在 AI PC 平台上搭建并维护 AI 开发环境(操作系统、驱动、框架、工具链等)。
● 开发并验证 Agentic AI 系统,包括多步推理、工具调用、记忆机制与任务编排等能力。
● 探索并集成与 AI PC 使用场景相关的 新 AI 模型与应用。
● 支持 预训练与微调方法落地,包括数据流水线、训练工作流与模型集成等。
● 在客户端平台上评估 Agentic AI 工作负载的功能、性能与可用性。
● 与跨职能团队协作,推进 AI 软件使能以及软硬件协同集成。
● 记录实验过程、设计决策与最佳实践,支持知识共享与后续规模化推广。
基本要求
● 计算机科学、计算机工程、电气工程或相关技术领域硕士在读。
● 具备扎实的 AI / 深度学习基础,理解神经网络模型与训练相关概念。
● Python 编程熟练。
● 有使用 AI 框架(如 PyTorch 和/或 TensorFlow)的经验。
● 了解基于 LLM 的工作流、AI 智能体或面向任务的 AI 系统。
● 对在 客户端平台 / AI PC 上进行 AI 系统开发有兴趣。
加分项
● 具备 Agentic AI 相关概念经验,例如多智能体系统、工具调用、规划、记忆机制或工作流编排。
● 有大模型 预训练或微调 的实战经验。
● 熟悉 AI 基础设施框架或内部智能体框架(例如 openclaw)。
● 理解系统层相关概念,包括性能、资源利用率,或在本地设备上的部署与交付。
● 具备较强的分析与问题解决能力。
● 能在协作、跨职能的工程环境中高效工作。
岗位要求
基本要求
• 计算机科学、计算机工程、电气工程或相关技术领域硕士在读。
• 具备扎实的 AI / 深度学习基础,理解神经网络模型与训练相关概念。
• Python 编程熟练。
• 有使用 AI 框架(如 PyTorch 和/或 TensorFlow)的经验。
• 了解基于 LLM 的工作流、AI 智能体或面向任务的 AI 系统。
• 对在 客户端平台 / AI PC 上进行 AI 系统开发有兴趣。
________________________________________
加分项
• 具备 Agentic AI 相关概念经验,例如多智能体系统、工具调用、规划、记忆机制或工作流编排。
• 有大模型 预训练或微调 的实战经验。
• 熟悉 AI 基础设施框架或内部智能体框架(例如 openclaw)。
• 理解系统层相关概念,包括性能、资源利用率,或在本地设备上的部署与交付。
• 具备较强的分析与问题解决能力。
• 能在协作、跨职能的工程环境中高效工作。
申请
AI 软件工程实习生(北京/深圳)
280-360元/天
深圳
硕士
岗位职责
加入英特尔技术赋能事业部(Technology Enablement Group, TEG)Client ADC 团队,担任 AI 软件工程实习生。在该岗位中,你将专注于在 AI PC 平台上开发与使能 Agentic AI 系统,支持下一代客户端 AI 体验。
你将参与构建 Agentic AI 工作流,在 AI PC 平台上搭建 AI 环境,探索与验证新的 AI 模型和应用,并使能预训模型调优。本岗位强调动手工程能力,覆盖 AI 基础设施、系统环境搭建,以及面向智能体的 AI 工作负载落地。
你的工作将助力 AI PC 的 Agentic AI 能力与技能栈建设,你的产出将直接支持英特尔客户端 AI 软件生态建设与未来产品就绪。
主要职责
● 在 AI PC 平台上搭建并维护 AI 开发环境(操作系统、驱动、框架、工具链等)。
● 开发并验证 Agentic AI 系统,包括多步推理、工具调用、记忆机制与任务编排等能力。
● 探索并集成与 AI PC 使用场景相关的 新 AI 模型与应用。
● 支持 预训练与微调方法落地,包括数据流水线、训练工作流与模型集成等。
● 在客户端平台上评估 Agentic AI 工作负载的功能、性能与可用性。
● 与跨职能团队协作,推进 AI 软件使能以及软硬件协同集成。
● 记录实验过程、设计决策与最佳实践,支持知识共享与后续规模化推广。
基本要求
● 计算机科学、计算机工程、电气工程或相关技术领域硕士在读。
● 具备扎实的 AI / 深度学习基础,理解神经网络模型与训练相关概念。
● Python 编程熟练。
● 有使用 AI 框架(如 PyTorch 和/或 TensorFlow)的经验。
● 了解基于 LLM 的工作流、AI 智能体或面向任务的 AI 系统。
● 对在 客户端平台 / AI PC 上进行 AI 系统开发有兴趣。
加分项
● 具备 Agentic AI 相关概念经验,例如多智能体系统、工具调用、规划、记忆机制或工作流编排。
● 有大模型 预训练或微调 的实战经验。
● 熟悉 AI 基础设施框架或内部智能体框架(例如 openclaw)。
● 理解系统层相关概念,包括性能、资源利用率,或在本地设备上的部署与交付。
● 具备较强的分析与问题解决能力。
● 能在协作、跨职能的工程环境中高效工作。
岗位要求
基本要求
• 计算机科学、计算机工程、电气工程或相关技术领域硕士在读。
• 具备扎实的 AI / 深度学习基础,理解神经网络模型与训练相关概念。
• Python 编程熟练。
• 有使用 AI 框架(如 PyTorch 和/或 TensorFlow)的经验。
• 了解基于 LLM 的工作流、AI 智能体或面向任务的 AI 系统。
• 对在 客户端平台 / AI PC 上进行 AI 系统开发有兴趣。
4 days at office per week and 5 months internship at least.
________________________________________
加分项
• 具备 Agentic AI 相关概念经验,例如多智能体系统、工具调用、规划、记忆机制或工作流编排。
• 有大模型 预训练或微调 的实战经验。
• 熟悉 AI 基础设施框架或内部智能体框架(例如 openclaw)。
• 理解系统层相关概念,包括性能、资源利用率,或在本地设备上的部署与交付。
• 具备较强的分析与问题解决能力。
• 能在协作、跨职能的工程环境中高效工作。
申请
AI 软件工程研究实习生
220-360元/天
上海
硕士
岗位职责
加入 Intel,担任 AI 软件工程研究生实习生,参与推动人工智能技术的前沿发展。你将参与具有前瞻性的项目开发,打造变革性的用户体验和高性能计算解决方案。实习期间,你将获得设计与优化 AI 软件解决方案的实践经验,涵盖算法、框架和体系结构,并涉及计算机视觉、机器学习和深度学习等关键领域。本岗位支持 Intel 构建端到端 AI 生态系统的使命,致力于提供可扩展、高效率的解决方案,赋能全球客户。
主要职责:
● 针对新兴 AI 技术开展研究与验证,并在 Intel 平台上部署与优化概念验证项目。
● 在 Intel 平台上对大语言模型(LLM)进行性能评估,开发测试工具相关功能模块,确保基准测试的有效性。
● 分析性能测试结果,定位软件瓶颈(如算子延迟、内存使用等),并提出优化策略,以提升推理速度和资源利用效率。
● 协助实现与调优 AI 模型,在性能与精度之间取得平衡,并确保软硬件的高效协同。
● 与内部产品团队及外部合作伙伴协作,开发符合 Intel 业务目标的可扩展 AI 软件解决方案。
Job Qualifications:
基本任职资格:
● 计算机科学、计算机工程、软件工程或相关领域的硕士学位。
● 熟练掌握至少一种编程语言,如 Python 或 C/C++。
● 具备主流 AI 框架使用经验,包括 PyTorch 和 Hugging Face Transformers。
● 具备大语言模型(LLM)和生成式 AI 的实践经验,并展现出较强的学习能力和快速适应能力
优先条件:
● 具备较强的问题解决能力和团队协作意识,有软件性能分析与优化经验者优先
● 主动学习前沿 AI 技术,并能够参与创新性研究工作
● 每周可工作 4–5 天,实习周期不少于连续 3 个月
把握机会,在充满活力、节奏快速的环境中,与优秀团队并肩工作,体验强调协作、创新与职业成长的氛围
岗位要求
基本任职资格:
• 计算机科学、计算机工程、软件工程或相关领域的硕士学位。
• 熟练掌握至少一种编程语言,如 Python 或 C/C++。
• 具备主流 AI 框架使用经验,包括 PyTorch 和 Hugging Face Transformers。
• 具备大语言模型(LLM)和生成式 AI 的实践经验,并展现出较强的学习能力和快速适应能力。
优先条件:
• 具备较强的问题解决能力和团队协作意识,有软件性能分析与优化经验者优先。
• 主动学习前沿 AI 技术,并能够参与创新性研究工作。
• 每周可工作 4–5 天,实习周期不少于连续 3 个月。
把握机会,在充满活力、节奏快速的环境中,与优秀团队并肩工作,体验强调协作、创新与职业成长的氛围
申请
英特尔 研究所 未融资 上海市
英特尔公司是全球领先的半导体芯片设计与制造企业。公司核心业务是研发、设计和制造中央处理器、芯片组、固态存储器、网络接口控制器等计算与连接产品,并为云计算、数据中心、物联网、客户端计算等领域提供平台解决方案。英特尔拥有从半导体工艺研发、芯片设计到制造封测的完整产业链能力,其x86架构处理器在服务器和个人计算机市场占有重要地位。公司建有庞大的研发体系,持续投入于制程技术、芯片架构、人工智能加速及软件生态的创新。其客户与合作伙伴涵盖全球主要的设备制造商、云计算服务商及电信运营商。作为高科技企业,其技术演进面临激烈的市场竞争,公司的发展与全球数字化转型和算力需求增长密切相关。