小米未来星数据算法研究员一面凉

提前批就此结束,安心转正了,我太菜了。给大家一个建议,如果在实习期间没准备好真的没必要参加提前批,浪费双方时间。别到最后竹篮打水一场空。

一面,很多问题忘了,过程中完全被碾压
1 自我介绍

2 Hive与Spark区别,为什么使用Spark而不使用Hive

3 Spark常使用的参数,当读取HDFS时有一个文件过大,读取报错,添加什么参数可以解决,小文件使用的参数,如何解决数据倾斜,主要想问源码。

4 常使用的spark参数,spark源码中一些groupbykey,aggregateByKey,groupbykey源码及其区别

5 怎么保证在spark运行阶段动态分配所需的资源,需要添加什么参数,这里问题太多,很多新版本参数我根本不会

6 Flink与Spark的区别,Flink的源码相关,各自的容错机制,基本思想,一次语义,源码如何实现

7 Hadoop,Spark都使Yarn,介绍一下YARN,执行过程。

8 DBSCA,NLP相关算法知识,Elasticsearch倒排索引,给一篇论文如何存储

9 数据结构各种排序问题,堆排序,快排序,二分查找问题,完全二叉树相关问题

10 实习的时候主要负责的工作,用到了什么算法,数据挖掘相关,模型的设计

11 手撕代码,计算两个整数的差的绝对值,不能使用减法、负号、位运算(固定时间写完,并进行优化)。

12 反问环节,个人总结基本问的都是大数据源码,数据挖掘算法相关,没准备好,很多问题我也给忘记了。

#提前批##小米##算法工程师##校招##面经#
全部评论
刚面完未来星,感觉面试官人很好,不仅读了我的论文,还读了我论文对比方法的论文,太顶了。
1 回复 分享
发布于 2020-07-16 16:10
应该凉了
1 回复 分享
发布于 2020-07-14 15:25
你这个建议也不一定呀,小米未来星属于比正式批难的,有些提前批就是多一次机会并不是找要求更高的人。
点赞 回复 分享
发布于 2020-07-16 07:42
lz已经很强了
点赞 回复 分享
发布于 2020-07-14 11:29
大数据算法研究员么?我也是为什么一点都没问我分布式的东西。。。
点赞 回复 分享
发布于 2020-07-14 11:21
这个差的绝对值,我想到的就是先判断哪个大,然后for循环,小的每次加1,再和大的数比较。这种思路对吗?😂
点赞 回复 分享
发布于 2020-07-13 15:49
面过多久后知道凉了?
点赞 回复 分享
发布于 2020-07-13 14:02
楼主是什么岗呀
点赞 回复 分享
发布于 2020-07-13 11:00

相关推荐

小厂面经,也是我的处女面(30min)1.自我介绍2.spring boot的自动装配原理(好多类和接口的单词都忘了全称是啥了,就说了记得的单词,流程应该说对了吧)3.有用过redis吗?主要是用在实现什么功能(说了技术派用redis的zset来实现排行榜)5.有了解过Redisson吗?讲一下对于分布式锁的了解以及在什么场景下应用(说了秒杀场景)6.对mysql有了解吗?包括它的索引优化和创建(把想起来的全说了)7.了解设计模式吗?比如单例模式,为什么要使用单例模式,它的优点是什么(昨天刚看的设计模式)8.工厂模式有了解吗?主要的使用场景是?(也是昨天刚看的)9.场景题:有7个服务器,需要在早上十点定时的向数据库中的用户表中的用户发短信,如果做到发送的消息不重复,且如果发送失败了需要知道是到哪个用户失败了,这样下次就直接从这个用户开始(我答了用spring task来实现定时,用分布式锁来保证只有一份服务器可以发送消息,用消息队列来存储消息,然后用消息确认机制来保证错误信息的记录,以及在数据库或者业务层面完成消息消费的幂等性)10.场景题:如果在系统启动的时间就将数据库的所有用户相关的信息都读到一个hashmap中(这个没啥思路,没答好)27届的投了一个星期终于有一个面试了,大部分公司都只招26的
inari233:已oc,拒了
查看9道真题和解析
点赞 评论 收藏
分享
评论
6
12
分享

创作者周榜

更多
牛客网
牛客企业服务