小米大数据开发二面面经

前天面一面之前就牛客好多人在说小米劝退面,都招满了走流程,一面面的确实时间也很短,所以本来都觉得没有然后了,发了一面的凉经。没想到昨天收到了二面的通知,发一下面经造福一下大众,攒攒人品,希望早日突破0offer。

二面:

1、自我介绍

2、Hive里面count的用法?count(*)和count(列名的区别)。一般算数量怎么算。

3、Hive里面union和union all的区别?

4、join操作,left join、right join、inner join、outer join的异同?

5、where、having、group by、order by出现在同一个语句中的执行顺序是什么?having和where除了执行顺序还有什么的区别?where中能否用聚合的数,例如count(*)作为条件?

6、hive语句的运行机制,例如包含上面的where、having、group by、order by,整个的执行过程?

7、MapReduce作业执行的过程中,中间的数据会存在什么地方?不会存在内存中么?

8、MapReduce和Spark各自的优缺点?

9、若Spark要保存数据到HDFS上,要用什么算子?

10、Spark的***()和persist(),他们的区别是什么?他们和上面问题里的saveAsTextFile的区别又是什么?

11、Spark里面的transform和action你都用过哪些?列举一下。

12、Spark里的map和flatMap的区别?

13、将RDD中”1\t2\t3\t4\t5”这样的数据用flatMap展平。

14、HDFS若要将本地文件拷贝到远程的HDFS上用什么命令?答-put。还有没有其他的方法?从远程往本地拉文件用什么?若有一个文件夹d1,d1下有很多文件,将d1下所有文件聚合起来拉到本地的一个文件中。

15、HBase里面的RowKey的设计。

①有哪些要遵循的原则?不会,扯了一下项目里的RowKey设计。能不能写几个例子看一下?9位”id” + “timestamp”。

②若现在遇到id前缀基本一样的话在HBase里存储的话,会引发什么问题,例如“4009192~4010000”?

③如果让你去设计一下均匀分布,或者说优化一下这个rowkey的设计,你有什么好的方法么?扯了一下设计新key值使Hash尽量均匀。面试官说Hash有32位,原本id是9位,问会不会增加rowkey占用的空间大小。如果限制一下空间大小也要和之前尽可能的接近,还有没有其他的设计?

④如果从某一天开始,id增加了一位变成了10位,此时再用之前的规则是否会有问题,若继续增加位数呢?

16、算法题:有一个int数组{1,-5,6,5,0,2,-1,9,6,7},用最优的时间和空间复杂度,得到一个二元组a+b=0。求所有这样的a、b数据对。

①先用了HashMap实现。问时间复杂度?

②如果不允许使用工具类呢?考察底层的算法知识。扯了下先排序,然后双指针,问时间复杂度?问面试官得知数据有可能存在重复。然后让写双指针遍历的过程。说一下思路吧?

17、你有什么要问我的么?






#小米##大数据开发工程师##面经##校招#
全部评论
昨天小米二面,面了一个多小时,求offer~
点赞 回复 分享
发布于 2019-09-27 10:56
哎,二面之后就没信了。渴望上岸啊。求小米offer
点赞 回复 分享
发布于 2019-09-27 10:54
老哥的每一个面经都是我学习的课件
点赞 回复 分享
发布于 2019-09-25 16:07
楼主是视频面还是电话
点赞 回复 分享
发布于 2019-09-25 15:54
楼主拿到 小米大数据的offer了吗
点赞 回复 分享
发布于 2019-09-24 16:26
11号二面的话现在收到恭喜函或者oc了吗?武汉还是北京呢?
点赞 回复 分享
发布于 2019-09-19 10:59
大佬,北京大数据开发工程师应届生刚进月薪一般多少啊😂
点赞 回复 分享
发布于 2019-09-12 02:20

相关推荐

不愿透露姓名的神秘牛友
06-30 18:19
点赞 评论 收藏
分享
05-11 11:48
河南大学 Java
程序员牛肉:我是26届的双非。目前有两段实习经历,大三上去的美团,现在来字节了,做的是国际电商的营销业务。希望我的经历对你有用。 1.好好做你的CSDN,最好是直接转微信公众号。因为这本质上是一个很好的展示自己技术热情的证据。我当时也是烂大街项目(网盘+鱼皮的一个项目)+零实习去面试美团,但是当时我的CSDN阅读量超百万,微信公众号阅读量40万。面试的时候面试官就告诉我说觉得我对技术挺有激情的。可以看看我主页的美团面试面经。 因此花点时间好好做这个知识分享,最好是单拉出来搞一个板块。各大公司都极其看中知识落地的能力。 可以看看我的简历对于博客的描述。这个帖子里面有:https://www.nowcoder.com/discuss/745348200596324352?sourceSSR=users 2.实习经历有一些东西删除了,目前看来你的产出其实很少。有些内容其实很扯淡,最好不要保留。有一些点你可能觉得很牛逼,但是面试官眼里是减分的。 你还能负责数据库表的设计?这个公司得垃圾成啥样子,才能让一个实习生介入数据库表的设计,不要写这种东西。 一个公司的财务审批系统应该是很稳定的吧?为什么你去了才有RBAC权限设计?那这个公司之前是怎么处理权限分离的?这些东西看着都有点扯淡了。 还有就是使用Redis实现轻量级的消息队列?那为什么这一块不使用专业的MQ呢?为什么要使用redis,这些一定要清楚, 就目前看来,其实你的这个实习技术还不错。不要太焦虑。就是有一些内容有点虚了。可以考虑从PR中再投一点产出
投递美团等公司9个岗位
点赞 评论 收藏
分享
评论
3
75
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务