蔚来笔试算法岗

#蔚来#

5单选+3不定项选择+3道编程

选择都是机器学习深度学习、概率和矩阵很基础的东西,奈何我根本没复习,只能说有印象,看分值不高光速蒙完了

3道编程
其实是两道,一道是纯纯的签到题
剩下两道很普通的mid难度,题目清晰,思路很直接,做完还剩半个多小时

一、消消乐:
给定h行,每行5个数,水平方向有3个及以上相同的数字的会被消除,然后会下落,求总共能消除的字数总和

主要是只有水平方向,数据量也不大,所以直接模拟即可;

二、选人
输入整数n和m,n代表有n位队员站成一排,之后输入n个整数代表n位队员的能力值,有AB教练轮流选人,每次选队员中能力值最高的队员以及其左右两边各m个人,以AB字符串形式输出这一排队员的归属;

感觉数据量也不大,排序加模拟直接过了;

昨天的科大讯飞笔试直接被干碎(只做出来一道签到题,一道题目都看不懂,一道超时爆零),感谢蔚来今天给我涨了涨自信
顺便纪念一下秋招第一次ak😭😭
全部评论
感谢分享
3 回复 分享
发布于 2024-08-05 13:25 黑龙江
题不难,但是后俩题改了好久都超时了
1 回复 分享
发布于 2024-10-16 19:38 美国
老哥投的什么岗
点赞 回复 分享
发布于 2024-08-08 22:06 北京
感谢分享,请问这个做完还有什么性格测试、题库这些吗
点赞 回复 分享
发布于 2024-08-06 09:54 上海
是双机位吗?
点赞 回复 分享
发布于 2024-08-05 23:50 广东
笔试限制几小时啊,是两小时吗
点赞 回复 分享
发布于 2024-08-05 18:08 北京
这个笔试不限编程语言嘛😳
点赞 回复 分享
发布于 2024-08-05 17:00 上海
佬投递多久后笔试的
点赞 回复 分享
发布于 2024-08-04 21:44 上海

相关推荐

05-12 20:52
已编辑
蚌埠坦克学院 算法工程师
【帮转,自己实习过的团队,技术和氛围都很好的,适合有兴趣的新手入门】我们是晞德求索,主要做数学求解器和工业软件核心计算引擎相关研发。目前正在招一位算法实验实习生,协助团队做求解器和算法实验相关工作。岗位类型:实习 / 远程薪资:3000 元/月时间:每周 3–4 天,具体时间可沟通主要工作:1. 运行求解器和算法实验,整理实验结果2. 协助分析算法或系统运行中的性能瓶颈3. 对实验数据做对比、归纳和简单总结4. 参与调参、benchmark、case 分析等实验支持工作5. 如果感兴趣,也可以参与算法优化和性能改进,但不是必须我们希望你:1. 是在校本科生或研究生,有一定编程基础2. 熟悉至少一门编程语言,如 Python / C++ 等3. 能看懂基本的实验说明,愿意动手跑实验、整理数据4. 做事认真、细心,能够稳定投入每周 3–4 天5. 对算法、求解器、优化问题感兴趣6. 不要求你已经很有经验,愿意学习和沟通更重要加分项:1. 接触过求解器、组合优化、数学规划、启发式算法等相关内容2. 使用过 Gurobi、OR-Tools、SCIP、CPLEX、MiniZinc 等工具3. 熟悉 Linux、命令行、脚本自动化或实验管理4. 做过算法、科研、竞赛或课程项目相关经历以上加分项都不是硬性要求,有相关经验更好,没有也可以边做边学。你将获得:1. 参与真实算法实验和研发工作的机会2. 接触求解器、优化算法和性能分析相关任务3. 远程灵活协作,适合在校生参与4. 如果感兴趣,可以进一步参与算法优化和核心问题分析有意向可以私聊我发送简历,并简单说明你做过的编程、算法、实验、求解器或相关项目经历。
点赞 评论 收藏
分享
点赞 评论 收藏
分享
一、自我介绍二、实习相关八股1. 实习业务场景负责大模型对话对齐、指令微调、强化学习优化,提升模型生成准确性、合规性与指令遵循度,落地垂类对话/问答业务。2. SFT数据筛选、采样及处理3. 选择GRPO的原因、优化目标及数学原理- 选型原因:相比PPO显存占用低、无需价值网络、训练更稳定,对齐效率高- 优化目标:最大化模型生成优势,约束KL散度防止策略突变- 原理:分组优势归一化、截断策略比率、近端约束,降低训练方差4. 奖励函数设计(重点)围绕有用性、准确性、合规性、流畅性设计,分维度打分;加入KL惩罚,避免单一奖励过拟合,区分正负奖励权重。5. 判断RL训练质量达标方法- 奖励值收敛、KL散度稳定;- 离线评测:指令遵循率、幻觉率达标;- 人工抽检生成内容,无退化、无套路化输出6. 是否遇到Reward Hacking遇到过,模型生成空洞话术、固定模板刻意刷高奖励值。7. 其他奖励作弊类型刻意迎合奖励规则、答非所问、重复安全话术、回避核心问题、策略坍缩同质化输出。8. PPO和DPO了解- PPO:在线强化学习,近端策略优化,带价值网络,训练复杂度高- DPO:离线偏好优化,基于成对偏好数据,无需交互采样,训练简单稳定三、基础八股1. Attention计算时间复杂度标准自注意力:O(n²d)(n为序列长度,d为特征维度)2. KV Cache原理推理时缓存历史token的KV矩阵,避免重复计算,降低算力开销,提升推理速度。3. GQA、MLA原理- GQA:分组查询注意力,Q分组共享KV,平衡推理速度与效果- MLA:融合局部+全局注意力,适配长上下文,降低显存占用4. vLLM原理基于PagedAttention分页管理KV Cache,提升显存利用率,支持高并发推理。5. Flash Attention原理分块计算注意力,优化显存IO,减少HBM访问,提速同时降低显存开销。6. 稀疏注意力原理仅计算局部/关联token注意力,舍弃全局无关token,将复杂度降至O(n),适配长文本。7. 模型推理慢排查思路检查序列长度、batch大小;确认KV Cache、量化、FlashAttention开启;排查GPU显存、算子优化问题。四、编程题1. rand7()实现rand10()拒绝采样:rand7()*rand7()生成1-49数,保留1-40,映射为1-10,超出则重新生成。2. 浮点数组取整最小变化和贪心思路:每个数选上/下取整中差值更小的,累加最小总误差。3. 最长无重复子串
查看19道真题和解析
点赞 评论 收藏
分享
评论
6
18
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务