谦合益邦云内推

2025-06-14 21:22 已编辑谦合益邦_AI框架部_框架优化工程师

发布于北京

关注

大模型算子开发实习生

岗位职责：

1.基于PyTorch框架与HuggingFace生态，参与大语言模型（LLaMA4、Qwen3、DeepSeek-R1等）及多模态模型（Qwen-VL、mLlama）的适配、优化与部署

2.探索图像/视频生成模型（Stable Diffusion、Flux）在自研芯片上的高效推理方案

3.实现模型算子融合、量化（INT8/FP16）及精度验证，确保模型在自研硬件上的性能与精度达标

4.完成开源模型与自研芯片的兼容性验证及性能对比

岗位要求：

1.熟悉主流大模型架构（Transformer/MoE）及计算原理（注意力机制、位置编码、扩散过程）

2.熟练使用PyTorch、Transformers、Diffusers库，具备HuggingFace模型部署、微调实战经验

3.掌握模型优化技术：算子融合、ONNX静态图导出等

4.理解多模态模型（视觉-语言对齐）或生成式模型（Diffusion/自回归）的工作机制

5.精通Python，具备CUDA/OpenCL等异构计算基础者优先

加分项：

1.参与过LLM/Multimodal开源项目

2.熟悉ONNX/TensorRT等模型编译工具链

3.了解芯片架构（如NPU/GPU）

4.每周保证4天以上，实习周期3个月及以上

我们提供：

1.深入自研AI芯片与大模型协同优化的前沿战场

2.导师1v1指导，接触业界最新大模型技术

3.表现优异者，可签订正式合同。

联系方式: **********

全部评论

推荐最新楼层

03-12 10:26

广西大学算法工程师

满帮集团大模型应用开发一面

1. xgboost 为什么叫梯度提升树因为它本质上就是：树：基学习器是 CART 回归树提升：一棵一棵往上加梯度：每一轮拟合的是损失函数对当前预测的负梯度普通提升树可以理解成拟合残差，XGBoost 是把“残差”推广成了更一般的梯度下降框架，而且用了二阶导信息，所以比传统 GBDT 更强。2. 知道什么概率模型？朴素贝叶斯，说一下贝叶斯的思想概率模型就是用概率分布描述数据和变量关系的模型，比如：朴素贝叶斯HMMCRFGMM贝叶斯网络贝叶斯思想就一句话：先验 + 数据 = 后验。公式：[P(A|B)=\frac{P(B|A)P(A)}{P(B)}]朴素贝叶斯做分类时，假设特征在给定类别下条件独...

AI-Agent面试实战...

点赞评论收藏

分享

03-02 15:04

北京大学算法工程师

我是如何准备大模型算法岗面试的？

很多人问我如何准备大模型的面试，分享下我的经验，针对两种情况：1. 有大模型实习2. 无大模型实习针对无大模型实习的情况，我建议先找一段中厂实习为主，比如 zhipu、Minimax （当然有大厂进大厂）这些，相对容易进，尽量积累大模型实习经历。针对有大模型实习的情况，复习内容为：1. 常规八股（transformer、bert 等）2. 最新八股（GQA 等）3. 技术报告（一定要自己看原PDF，目前推荐 DeepSeekV3, R1, kimi1.5, Minimax-01, Qwen2.5, Qwen2.5-VL）4. 手撕 Leetcode：Hot1005. 手撕模型，比如 MHA 这些首先是常规八股和最新八股，这一部分可以自己找找网上资料，整理好的，背。然后是技术报告，目前推荐的内容有：1. DeepSeekV3：必读2. DeepSeekR1：必读3. Kimi1.5：选读4. Minimax-01：选读，据我所知最长上下文模型（外推到 4M，不过好像被 LLama4 的 10M 超过了）5. Qwen2.5：必读6. LLama3.1：必读7. Qwen2.5-VL（如果简历有多模态内容）：选读重点关注：1. 阶段训练（预训练几段、Post-training 几段？上下文用了多少？数据配比是什么？）2. 模型创新点（MHA 创新是什么？作用是什么？）3. 上下文优化创新点（一般是优化显存和阶段训练）4. 多模态优化创新点（简历有多模态内容）5. 几个模型不同之处（比如 Qwen2 和 Qwen2.5 的不同之处）最后是手撕，Leetcode 只刷 Hot100 够了，模型手撕建议关注（我目前会的）：1. MHA2. LayerNorm3. Transformer Encoder (MHA+LayerNorm+FFN)4. PE（绝对位置编码）5. ROPE6. SwiGLU7. RmsNorm每次面试前快速过一遍就 ok 了。

喜欢吃卤蛋的托尼of...：大佬想问下项目该怎么准备

查看19道真题和解析

点赞评论收藏

分享

03-14 09:54

广西大学算法工程师

科大讯飞 AI Agent开发一面

1、自我介绍2、实习介绍, 遇到过什么困难,有什么提升3、如果现在就是开发的话，一般用什么 IDEPython 开发我一般用 PyCharm 或者 VS Code。如果项目偏工程化、代码量比较大、需要比较强的调试和项目管理能力，我更倾向用 PyCharm，因为它对 Python 项目结构、虚拟环境、断点调试、调用链查看支持比较完整。如果项目需要同时处理前后端、脚本、配置和容器文件，我会用 VS Code，因为插件生态更灵活，远程开发也比较方便。如果涉及服务部署和 Linux 环境排查，我也会结合终端、vim、tmux 一起用。4、项目介绍5、上线后出现 bug，一般怎么处理线上出现 bug 时...

AI-Agent面试实战...

点赞评论收藏

分享

03-09 15:13

广西大学算法工程师

AI-Agent 面试题汇总 - 大模型篇

一、大语言模型基础1. 目前主流的开源模型体系有哪些？主流开源模型体系包括：LLaMA 系、Qwen 系、GLM/ChatGLM 系、Mistral/Mixtral 系、Baichuan 系、DeepSeek 系、InternLM、Yi 等。面试里建议从以下维度比较：参数规模（7B/13B/70B…）上下文长度（8K/32K/128K…）多语言能力工具调用能力（function calling / agent）推理成本与部署难度开源协议（是否可商用）2. Prefix LM 和 Causal LM 区别是什么？Causal LM：严格自回归，token 只能看左侧历史（下三角 mask）。Pr...

AI-Agent面试实战...

点赞评论收藏

分享

03-04 18:37

北京邮电大学 Python

搜狐畅游一面

ai算法实习生2026.03.04，下午14:00，一面，线上，1h左右，都开摄像头了1.自我介绍2.多策略微调这个项目是什么类型的？在 910B3 服务器上微调Qwen-3-8B 模型，使用全量微调、lora 微调和 freeze 微调三个策略做对比，是自己为了学习模型微调自主开展的项目。3.这个项目最终成果和目的是什么？目的是提升模型在中文语义理解方面的能力，最终用中文逻辑推理、中文语理解、知识相关三个数据集完成了测试。4.可以举例说一下中文语言理解的实现过程吗？选用中文逻辑推理、中文语理解、知识方面的三个数据集，基于Qwen-3-8B 模型用三种微调策略训练后，用这三个数据集对模型进行中...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你和你的mentor相处模式是__ #

3211次浏览 19人参与

# 如果公司降薪，你会跳槽吗？ #

160166次浏览 938人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

25981次浏览 320人参与

# 实习第一天，你在干什么 #

2141次浏览 14人参与

# 华为工作体验 #

322095次浏览 1409人参与

# 你会因为行情，降低找工作标准吗？ #

2401次浏览 19人参与

# 非技术2024笔面经 #

501915次浏览 5038人参与

# 机械人与华为的爱恨情仇 #

158489次浏览 1055人参与

# 0offer互助地 #

773049次浏览 4756人参与

# 你是怎么和mt相处的？ #

103026次浏览 507人参与

# 联想求职进展汇总 #

356393次浏览 2262人参与

# 运营人求职交流聚集地 #

247214次浏览 1124人参与

# 实习/项目/竞赛奖项，哪个对找工作更重要？ #

113550次浏览 1196人参与

# 我的成功项目解析 #

531946次浏览 8611人参与

# 打工人的工作餐日常 #

97012次浏览 558人参与

# 26年哪些行业会变好/更差 #

66194次浏览 534人参与

# 蚂蚁求职进展汇总 #

170973次浏览 1291人参与

# 今年秋招还有金九银十吗 #

82769次浏览 514人参与

# 工作两年想退休了 #

271619次浏览 2048人参与

# 你总挂在第__面？ #

14751次浏览 162人参与

# 简历上如何体现你的“AI”能力？ #

20126次浏览 405人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务