不愿吃饼的少年很活泼

03-16 19:00 同济大学算法工程师发布于上海

关注

蔚来大模型强化学习训练一面

📍面试公司：蔚来

🕐面试时间：2026.03.16

💻面试岗位：大语言模型强化学习算法实习生

❓面试问题：

自我介绍
项目经历1，拷打项目动机，方法细节，评测方式，遇到的难点和解决方式，提出的方法为什么有效
强化学习算法理论基础，介绍PPO算法，算法计算公式，优点，训练流程，介绍GRPO算法，特点，优势
有关强化学习算法的代码库，TRL，VERL，Ray等
询问对于Agentic RL 的认识，其中可能存在的难点，答了算法侧的稀疏奖励问题和工程实现上各类工具的稳定性
编程题，word1->word2的最小操作次数

🙌面试感想：

自我介绍吟唱时间太长，适当压缩为教育背景，研究背景，项目/实习经历的简单介绍
项目介绍不够顺畅，需要处理好实验细节的介绍
有关RL的理论知识需要再巩固下，一时忘了广义优势估计
蔚来的该岗位主要是搭建Agentic RL的训练pipeline，面向语音控制的智能座舱积累经验。

#面试问题记录##发面经攒人品#

全部评论

推荐最新楼层

北京航空航天大学算法工程师

请问有没有推荐的RL学习资料

点赞回复分享

发布于 03-17 19:41 北京

04-12 19:42

广西大学算法工程师

哔哩哔哩大模型算法一面

1. 自我介绍2. 为什么推荐系统里要做多目标优化，而不是只优化点击率只优化点击率会把系统推向强刺激、短反馈的内容，短期看 CTR 好看，长期可能损伤时长、留存、消费深度和用户满意度。推荐系统真正面对的是一个多目标约束问题，点击、时长、转化、留存、内容生态健康、创作者收益往往都重要，而且这些目标之间存在天然冲突。多目标优化的核心不是把几个 loss 简单加权，而是处理目标尺度不一致、梯度冲突和业务优先级变化。很多系统前期用静态加权，后期会演进到门控式任务塔、动态权重、MMoE、PLE，甚至通过因果或强化学习方式做长期目标建模。优化的是用户长期价值，而不是某一个表层指标。3. 当业务里同时有视频...

AI-Agent面试实战...

点赞评论收藏

分享

04-30 18:53

门头沟学院算法工程师

腾讯暑期实习，到hr面试环节了，先发了云证，但是还没约面，有uu一样的情况吗

我的求职进度条

点赞评论收藏

分享

04-09 09:03

浙江大学算法工程师

蔚来 C++ 一面面经

1. 什么是 Agent 和 MCP？它们在 AI 系统中如何协同工作？答案：MCP（Multi-Component Planner）：将复杂任务拆解为多个子任务，负责调度和协调任务顺序，优化资源使用。Agent：执行具体子任务的实体模块，通常独立完成计算或操作。协同工作流程：用户输入 → 系统理解意图 → MCP 拆解任务 → 分配给 Agent → Agent 执行 → MCP 汇总结果 → 输出给用户。特点：MCP 负责宏观规划，Agent 负责微观执行，可实现多任务并发处理和自动化。2. 请设计一个 Prompt，让 LLM 生成一个支持多线程并发、异步 I/O 的 C++11 服务器...

查看10道真题和解析

点赞评论收藏

分享

04-12 13:25

门头沟学院算法工程师

阿里淘天llm算法日常实习一面

攒人品中！ 1.minimind数据集怎么来的?预训练数据集是什么形式的?为什么这样设计?2.项目指标提升多少?3.了解qlora吗?4.dpo和grpo区别?项目指标上又有什么区别?数据上呢?5.为什么要做强化学习?为什么不能直接把想要的直接加sft里面从而不用rl6.moe介绍?架构?7.多模态模型了解过吗?8.了解dapo吗?9.手撕moe

查看9道真题和解析

点赞评论收藏

分享

04-30 20:45

湖南农业大学产品经理

2026求职季：AI简历工具正在让HR失业？

在当今时代，AI技术正以迅猛之势席卷各领域新闻写作早已有AI的身影，它能快速整合信息，生成稿件，大大提高了效率而在安防领域，人脸识别等技术的应用，也让许多安保工作不再完全依赖于人力如此广泛的渗透，不禁让人产生担忧，HR这个岗位是否也会被AI取代？毕竟在招聘等环节，AI已展现出高效筛选简历的能力，这无疑给HR从业者带来巨大的职业危机感，也让无数应届生对未来的求职之路充满焦虑。面对激烈的求职竞争，一份出色的简历至关重要。而AI简历工具恰如救命稻草，能轻松解决简历制作难题。它拥有海量简历模板，无论你是应届生、留学生还是职场人，都能找到合适的选择。只需简单输入个人信息，它就能一键生成简历初稿。无论是社...

实习如何「偷」产出？

点赞评论收藏

分享

评论

点赞

8

招聘动态

上海人工智能实验室

2026年春季校园招聘

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

快手

27届实习超多转正机会

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

17703次浏览 167人参与

# 字节开奖 #

148120次浏览 654人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

47071次浏览 513人参与

# 如果春招能重来，我会___ #

18741次浏览 200人参与

# 刚工作的你，踩过哪些坑？ #

46319次浏览 295人参与

# 除了线上，还能去哪些地方投简历 #

10452次浏览 110人参与

# HR问：你期望的薪资是多少？如何回答 #

99007次浏览 830人参与

# 薪资爆料 #

421213次浏览 2219人参与

# 一份好的简历长什么样？ #

41728次浏览 505人参与

# 你面试被问到过哪些不会的问题？ #

122150次浏览 1944人参与

# 今年形式下双非本找得到工作吗 #

328338次浏览 1774人参与

# 你觉得实习能学到东西吗 #

153790次浏览 1491人参与

# 滴！实习打卡 #

844738次浏览 6876人参与

# 实习最晚的一次下班是几点 #

35716次浏览 171人参与

# 秋招疯了，看什么都像offer #

65119次浏览 362人参与

# 大家每天通勤多久？ #

119512次浏览 1656人参与

# 26届秋招投递记录 #

124688次浏览 690人参与

# 影石Insta360求职进展汇总 #

190079次浏览 1384人参与

# 面试官拷打AI项目都会问什么？ #

16524次浏览 519人参与

# 金三银四，你的春招进行到哪个阶段了？ #

36523次浏览 340人参与

# 你的公司给实习生发中秋礼物吗 #

17405次浏览 55人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务