小米大数据开发实习面经

1. 自我介绍
2. 问了一下简历上的项目(研一在国电做的)
3. Spark有没有过调优 
4. 基于我对Spark调优的一些回答进行追问:
● 我提到了利用RDD缓存进行RDD复用,追问Spark缓存一般可以用什么函数做到(cache,presist)
● 追问并行度的设置方法(配置文件或在代码中)
● 并行度的值一般根据什么设置(CPU核数的2-3倍)
5. Hive执行原理(SQL到MR的过程)
6. 问了ElasticSearch(因为我简历写了这个,介绍了倒排索引)
7. 问了离线数仓的项目
8. 问了Flink和Spark Streaming的区别(一个微批次,一个面向流)
9. 追问两者在API的使用上怎么体现面向微批次和面向流
10. 什么算子会导致Spark产生Shuffle
11. MySQL有哪些引擎,之间有什么区别
12. 算法题(最长上升子序列 力扣题号300)
13. 翻转链表(面试官问能否用递归的形式实现,只要当前不为空,就继续调用即可)

整体过程还算顺利,后面有俩八股问题答得不是很完美,面试官问能不能尽快到岗,我因为导师项目在出差,3月没法回北京,就说得4月份,他说他们需要尽快到岗的,希望我考虑考虑,所以估计吹了,挺可惜的
#我的实习求职记录#
全部评论
jyx😳?
1 回复 分享
发布于 2023-03-19 15:28 北京
你好,请问这个小米大数据笔试考sql还是考编程呀。
点赞 回复 分享
发布于 2023-09-20 16:36 江苏
问一下研一的项目是自己找的还是实验室的项目呀
点赞 回复 分享
发布于 2023-08-07 21:39 北京
佬,数仓开发对算法题要求高吗。。大概得刷多少题感觉刷完就忘,没什么效果。自己还写不出来
点赞 回复 分享
发布于 2023-04-08 04:57 安徽
佬 是自动驾驶部门嘛
点赞 回复 分享
发布于 2023-03-13 20:42 北京
这是二面吗
点赞 回复 分享
发布于 2023-03-13 18:24 山西
感谢大佬分享
点赞 回复 分享
发布于 2023-03-13 18:06 山东
兄弟小米实习有笔试吗,面了几轮啊
点赞 回复 分享
发布于 2023-03-13 15:16 河北

相关推荐

08-07 21:10
已编辑
门头沟学院 C++
7.16 投递8.1 一面全程八股,一点实习都不问啊😅,简历上有智驾实习都没问1、C++虚函数和多态实现原理2、C++智能指针3、编译和链接的区别4、链接阶段链接的是什么5、栈和堆区别,大小是多少6、malloc 分配内存7、malloc了100M,实际上物理内存有100M吗8、虚拟地址到物理地址怎么映射9、内存分配回收策略10、系统调用是什么,有哪些11、怎么进行线程切换12、用户态线程怎么切换(因为我上一个答的都是内核态切换)13、数组和链表的区别14、红黑树和平衡二叉树区别,为什么map用红黑树15、vector  reserve 和 resize 的区别16、TCP 怎么保证可靠17、什么时候用TCP,什么时候UDP代码:共享屏幕写 lc:78.6 二面1.  聊实习,主要是聊 momenta 实习2. 聊项目3. epoll实现4.读数据的时候新来一个就绪事件会发生什么5.读数据从哪里读6.fopen和open区别7.fwrite写到用户态还是kernel8.一个业务场景用线程和用协程有什么区别9.线程切换的过程,怎么保存上下文怎么切换10.什么时候发生线程切换11.tcp拥塞窗口12.建立连接第三次握手丢失发生什么13.某端crash了,对端能感知到吗代码:memcpy+单例14. 我的实现把拷贝放到private下,问有没有什么办法发生拷贝15.单例类会发生内存泄露吗16.会调析构吗8.7 已挂
秋招笔面试记录
点赞 评论 收藏
分享
1、自我介绍➕项目2、TCP和UDP有什么区别,底层和应用场景(偏常规的八股就正常回答)3、追问,你们之前做的直播相关的业务用的是tcp还是udp?为什么不用tcp,你确定不用tcp吗? Tcp可能会有延迟,那缓存为什么不能解决延迟的问题呢?4、传输层协议中的端口有什么作用,不同的应用能共用一个端口吗,服务器可以监听同一个端口吗?如果连ip和端口都一样,可以吗?如果ip端口和协议类型都一样,可以吗?(灵魂追问这里其实挺复杂的,建议大家去小林coding那边好好研究一下)5、发送数据的时候从磁盘中取出数据到发送经历了什么样的过程,几次拷贝,几次系统调用,零拷贝是怎么实现的6、什么是内存对齐,有什么好处?内存对齐是操作系统层面的东西,还是每个编程语言层面的东西?(当时讲了一会儿内存碎片和空闲链表,后来发现应该是扯远了,不过面试官也没有当场指出错误,可能背地里暗暗减分了吧,hhh)7、算法题,找到一个数组的中位数(一开始考虑使用两个堆(想成了leetcode中的寻找数据流的中位数),其实不用那么麻烦,本质上是数组中的Top k(所谓中位数就是Top2/n),可以使用一个堆或者快排),后来又问了一下建堆的时间复杂度和快排查找的时间复杂度(这里没答好,建议大家去研究一下,好像涉及一些数学证明,现在考算法不手撕,不仅仅看你能不能写出来,对时间复杂度,空间复杂度的证明和优化也考)8、延伸了一下,如果有多个文件,没有办法将所有的文件数据都读入内存,如何寻找多个文件的中位数?9、反问业务,偏底层的音视频传输,技术栈主要是cpp,如果面试通过可能需要好好学一下cpp
查看8道真题和解析
点赞 评论 收藏
分享
评论
9
82
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务