蔚来一面面经

数据开发岗

秋招第一个面试,被狠狠拷打了

1.spark和flink有哪些共性和区别
2.你说到flink是一条数据一条数据的处理,那我们要对以前数据做聚合会怎么处理(状态机制)
3.状态怎么进行恢复和使用(checkpoint机制,下游二阶段提交)
4.为什么会有二阶段提交
5.了解过二阶段提交机制怎么实现吗
6.两阶段提交是保证卡夫卡提交和checkpoint机制同时完成,怎么去保证这个事情,状态保存在哪里
7.flink针对kafka是怎么去传递两阶段结果的
8.对spark有哪些自己的理解
9.spark为什么能处理大规模数据集(高并发)
10.多台机器处理,内存是比较宝贵的,数据过大,内存放不下怎么处理(写盘)
11.spark当中结点分为那些类型
12.大规模数据集,不断落盘,是写到同一个磁盘文件还是多个磁盘文件
13.spark中间会一直生成小文件,如何处理
14.什么是OOM,什么时候会出现OOM
15.怎么去定位OOM出现在哪
16. jvm, 内存模型
17.spark SQL怎么执行(任务调度)
18.底层资源调度是什么资源
19.程序运行,内存放的什么东西,怎么管理内存,内存分配
20. MySQL执行引擎
21.什么是聚簇索引
22.为什么要回表,什么样的操作会回表
23.介绍什么是b+树
24.知道平衡二叉树吗,什么是二叉树
25.精准一次语义,kafka中有那些语义
26.java这一块熟悉哪些内容,对java这块实现数据结构了解那些
27.hashmap底层怎么实现,怎么去实现不可重复的,如果重复了怎么处理。hashcode和equals方法有什么区别和联系,如何判断是否和现有的key相同
28.线程安全问题,什么是线程安全
29.主要课程包括哪些
30.大模型这块,transform架构了解过吗,用来做什么
31.SQL题,求班级TOP5学生信息
32.SQL锁机制,多个用户同时去写一条数据
33.锁机制和事物区别
34.什么是悲观锁什么是乐观锁
35.乐观锁怎么实现
36.进程和线程有什么区别,怎么去调度线程/进程运行,了解过协程吗
37.一个进程中包含哪些部分,哪些数据
38.讲一下堆和栈,栈有哪些应用
反问

后续,9.26约二面

#数据人的面试交流地# #发面经攒人品# #26届秋招投递记录# #数据开发面经#
全部评论
感觉蔚来出结果好慢啊。一面自我感觉很好,面试官也给予肯定,但是10天了都没后文。
2 回复 分享
发布于 2025-09-26 13:49 安徽
不是,八股盛宴吗这
1 回复 分享
发布于 2025-09-21 10:41 广东
一个零经验小白被吓鼠惹
点赞 回复 分享
发布于 05-19 22:15 福建
求问是数仓岗还是数据平台岗呀
点赞 回复 分享
发布于 2025-10-09 19:43 山东
一面hr会主动说什么时候给通知吗,我没问,感觉聊的挺好的
点赞 回复 分享
发布于 2025-09-22 15:46 安徽
蔚来这么逆天
点赞 回复 分享
发布于 2025-09-22 08:36 安徽
这是按照简历写的问的吗
点赞 回复 分享
发布于 2025-09-21 22:56 上海

相关推荐

04-30 08:02
东南大学 C++
一、项目与经历1.你先做一下自我介绍。2.你做的两个小项目分别是什么?3.你之前做的这个高并发 AI 聊天系统,具体是一个什么产品?4.它和 ChatGPT 这类聊天产品相比,有什么不同?5.你当时在设计这个聊天系统时,上下文管理和 prompt 注入时机是怎么设计的?________________________________________二、AI IDE / AI 工具使用经验6.你用过 Claude Code、Codex 这类 AI IDE / AI 编程工具吗?7.你主要是用它们的 CLI、桌面端,还是网页版?8.在用这些 AI IDE 之前,你主要是用什么开发 C++?9.市面上常见的 AI IDE 工具你都用过哪些?10.你觉得这些 AI IDE 对 C++ 的支持怎么样?11.有没有什么让你特别不满意的地方?12.当这些工具帮你生成 C++ 代码后,你会怎么做验证?会直接接受,还是会 review / 测试?________________________________________三、Agent / ReAct / Claude Code / Skill / MCP13.你有调研过这些 AI IDE 背后的 Agent 模式和基础原理吗?14.你怎么理解 ReAct 这种 Agent 模式?15.你有了解过 Claude Code 的源码或整体架构设计吗?16.你觉得 Claude Code 的整体架构是不是基于 ReAct?17.从 Claude Code 这类产品里,你觉得有哪些设计思路是值得你自己的聊天系统借鉴的?18.你有了解过它里面常用的工具吗?比如 grep 这类。19.你自己用过哪些 MCP?20.你对 MCP 协议、安装方式、使用方式有了解吗?21.你觉得 skill 和 MCP 的区别是什么?22.你觉得 skill 算不算一种“渐进式披露”的能力组织方式?23.你在 Trae 或类似工具里,主要是怎么使用这些能力的?________________________________________四、聊天系统能力设计:读 / 写 / 调工具24.如果现在要让你的聊天系统具备“读文件”的能力,你会怎么设计?25.如果文件不在本地,而是在 GitHub 仓库路径下,你会怎么让系统读取它?26.如果系统本身还不具备调浏览器的能力,那你会怎么设计这部分能力?27.如果现在你的聊天系统已经具备了读、写和调 batch 工具的能力,那从系统实现角度,你要做哪些事情,才能真正让它具备这些能力?28.batch / 读 / 写这些能力,你会怎么做工具封装和调用适配?________________________________________五、投资分析系统如何抽成 Skill29.如果要把你的 AI 投资分析系统抽成一个 skill,挂到你的聊天系统里,让用户在聊天中直接调用,你会怎么设计?30.你的投资分析系统里,多 Agent 是核心吗?31.如果要 skill 化,多 Agent 这一层要不要保留?32.你的投资分析系统里不是还有知识库检索吗?如果做成 skill,这部分怎么处理?________________________________________六、回退机制 / 安全性 / 编排失败处理33.你刚才说的“回退机制”具体是什么意思?34.如果 AI 修改文件改到一半报错了,怎么保证用户原来的代码安全?35.你说的回退,是写日志、写操作记录,还是别的什么?36.如果是写操作记录,你会记录什么内容?37.这种回退是按行级别做,还是按块级别做?38.如果是编辑已有文件,而不是新建文件,回退机制怎么保证安全?39.你简历里写的“通过编排回退机制保障服务稳定性”,这里的“编排回退”具体指什么?40.你怎么定义一个工具调用或检索是“失败”的?41.你为什么要对失败结果做标记?42.如果检索结果本身不准确,你有做过效果评估吗?________________________________________七、语言迁移与学习能力43.如果 IDE 产品所需要的编程语言不是你熟悉的语言,你会怎么快速融入?44.你觉得在现在这个阶段,编程语言本身还是最核心的难点吗?45.你怎么看“学语言的术”和“学系统设计的道”这件事?46.你之前用我们那个 AI IDE 做笔试时,整体体验怎么样?47.你觉得在 AI coding 场景下,语言本身重要,还是方案设计更重要?
点赞 评论 收藏
分享
04-23 17:30
门头沟学院 Java
继续来分享下最近的面经~欢迎友好讨论,信息共享1. 你有没有接触过自动化测试?了解哪些测试框架(Python 或其他语言)?2. 你在A公司做的 AI 平台整体是干什么的?3. 你说的孤儿资源清理具体是怎么实现的?4. 你是怎么判断一个资源是孤儿资源的?5. 这个过程是基于全量扫描,还是事件驱动?具体怎么做的?6. Watch 和数据库同步这一套是怎么设计的?有没有一致性问题?7. 你的事件处理链路是怎样的?有没有用 Kafka?为什么用 / 不用?8. 你在B公司做的 Agent 核心是做什么的?解决了什么问题?9. 这个 Agent 实际是在部署什么?是服务、脚本还是其他东西?10. Agent 是中心化部署还是每台机器一个?为什么这么设计?11. Agent 和 Jenkins 的关系是什么?谁负责调度,谁负责执行?12. Agent 的所有动作是不是最终都是通过 Jenkins 来执行的?13. Jenkins 执行完之后,怎么和 Agent 做状态同步或结果回传?14. 既然 Jenkins 本身就能做自动化,为什么还要做一个 Agent?15. 用户在 Jenkins 上最容易填错哪些参数?为什么?16. 能不能完全不让用户填参数,让系统自动完成?为什么做不到?17. 如果 Jenkins 已经可以完成这些事情,引入 Agent / AI 的价值在哪里?18. 如果让你设计一个自动拉日志的 Agent,你整体流程是怎样的?19. 有3台Linux机器,日志路径不统一,而且是二进制日志,需要解析,你怎么设计?20. IP/Port 固定,但 SSH 密码会随软件版本变化,这个你怎么处理?21. 不同业务的人要不同日志路径,你怎么做管理?22. 用户不愿意维护配置表,你怎么让用户输入,同时系统自动沉淀规则?23. 日志解析涉及不同格式、工具、版本,这一块怎么设计?24. 如果这个 Agent 要扩展到自动检测、排障、自动化能力,架构怎么演进?25. 在完全没有规范流程、系统很混乱的情况下,你怎么落地这个 Agent?手撕:第二大的数字,不能用既有函数。
查看26道真题和解析
点赞 评论 收藏
分享
04-22 10:34
已编辑
门头沟学院 Java
base上海 岗位是工具链云平台全栈开发实习生大概面了一个小时左右 前后端以及ai都有涉及后端:用户点击下单后,库存是什么时候扣的?下单和支付分别处于什么阶段?是不是在用户还没支付时就先扣掉库存了?如果有人恶意下单、不付款、不取消,会不会长期占用库存?你怎么处理库存释放问题?你们为什么用 Kafka,为什么不用 RabbitMQ 或其他更轻量的 MQ,你理解里 Kafka 和 RabbitMQ 的最大区别是什么?什么是缓存击穿、穿透?布隆过滤器的作用是什么、底层结构是什么、大小一般怎么设置,布隆过滤器大小和商品量 、用户量、 订单量有什么关系?在 Spring Boot 启动完成后,如果想自动做缓存预热,怎么实现,怎么监听容器启动完成这个事件?Java 线程池一般用哪个类、在 Spring Boot 里怎么配置线程池?配完线程池后,线程会不会立刻创建?没有任务后线程是否一直保留?常用 Linux 命令、git命令前端:你的前端是自学的,还是在项目里真实做过?为什么学 Vue,没学 React?你对 Vue / Vue3 了解深不深?Vue3 生命周期有哪些?除了 Element UI 还用过哪些组件库?你知不知道栅格系统?什么是响应式单页面?ai闲聊 20分钟职业规划闲聊10分钟
Hannnnnnnn...:oc了 主包已经没有别的offer了 先接了
查看18道真题和解析
点赞 评论 收藏
分享
评论
3
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务