大模型推理框架实习生

岗位职责：

1.基于 vLLM/SGLang/LMDeploy 等开源推理框架，进行自研推理引擎的功能对比测试

2.基于前沿推理加速技术，在自研推理框架上做功能验证：

动态批处理优化（Continuous Batching）
PageAttention 显存管理
推测解码（Speculative Decoding）
块预填充（Chunk Prefill）
Prefix Caching 优化

3.对 Qwen3 Moe/DeepSeek-R1/Qwen-VL 等模型进行算子级精度验证，确保自研框架输出精度达标

4.编写技术文档，输出自研推理框架在自研硬件上的精度Benchmark报告

岗位要求：

1.深入理解至少1个开源推理框架（vLLM/LMDeploy/SGLang 核心机制）

2.熟悉大模型推理全流程：Tokenization→Prefill→Decoding→Sampling

3.掌握 PageAttention/KV Cache 等显存优化原理，了解 FlashAttention 加速技术

4.具备PyTorch CUDA扩展开发能力，能调试模型计算图

加分项：

1.参与过vLLM、SGLang等实际开发部署项目

2.了解芯片架构（如NPU/GPU）

3.每周保证4天以上，实习周期3个月及以上
我们提供：

1.深入自研AI芯片与大模型协同优化的前沿战场

2.导师1v1指导，接触业界最新大模型推理优化技术

3.表现优异者，可签订正式合同。
联系方式: **********

全部评论

推荐最新楼层

04-25 09:15

蚌埠坦克学院嵌入式软件开发

没有面试的时候，一般就在复习八股文了

没有面试的时候，一般就在复习八股文。把操作系统、计算机网络、C++这些高频知识点过一遍，查缺补漏，保持手感。同时也会简单回顾项目，把细节再梳理一遍，确保面试时能讲清楚、讲深入。这个阶段的重点不是死记硬背，而是保持状态，为下一次面试做好准备。

没有面试的日子里，你在做...

点赞评论收藏

04-21 18:48

已编辑

福建理工大学 golang

杭州Web3厂Go后端面经

1:GMP调度机制2:runtime.GOMAXPROCS核心参数设置逻辑(过大过小会怎么办?)3:go的gc算法4:Go的接口耗时怎么分析获取?5:MySQL索引失效条件?6:SQL调优经验?7:redis分布式锁8:redis缓存三剑客都是很经典的八股......希望一次过(4.21更新,又挂了)

查看8道真题和解析

点赞评论收藏

04-15 14:28

已编辑

Java

27届学院本简历求指点

投的Java岗位，全是已读不回，孩子没招了😭

程序员小白条：学院+两段经典项目+技术栈，最大众的简历，纯看运气

点赞评论收藏

03-19 17:53

武汉大学算法工程师

唉每每看到这张截图总是意难平

为什么面了八次次次都是一面挂，次次都不说原因，问了面试官就是插科打诨，为什么别人一面就过呢，真的没有缘分呀。不考编程就是脑筋急转弯的概率题，考了编程a了也不过没a也不过 总之就是不过，没一次二面，深深的怨念。觉得我不够资格就直接拉黑简历呗，每次都捞起来重新拷打一顿什么意思呢。

暴杀流调参工作者：春招又试了一些岗位，现在投递很有意思，不仅要精心准备简历，投递官网还得把自己写的东西一条一条复制上去，阿里更是各个bu都有自己的官网，重复操作无数次，投完简历卡完学历了，又该写性格测评、能力测评，写完了又要写专业笔试，最近还有些公司搞了AI辅助编程笔试，有些还有AI面试，对着机器人话也听不明白录屏硬说，终于到了人工面试又要一二三四面，小组成员面主管面部门主管面hr面，次次都没出错机会，稍有不慎就是挂。卡学历卡项目卡论文卡实习什么都卡，没有不卡的😂

点赞评论收藏