北京河狸家+北京元安物联大数据开发面经(社招)

北京河狸家+北京元安物联大数据开发面经~社招


1. spark运行时并行度的设置

2. spark小文件太多怎么处理?

3. hive on spark动态解决小文件太多的办法

4. Hive,Hive on Spark和SparkSQL区别?

5. Hive,Hbase,HDFS等之间的关系

6. 大数据平台架构技术选型与场景运用,你能讲解一下嘛!?

7. 用户画像建模的过程

8. case when函数你会用吗!?写一条sql

9. sql的分析函数有哪些?

10. sql的存储过程你理解嘛!?

11. hive的开窗函数有哪些!?

12. hive的udf函数你写过哪些!

13. row_number相关排序函数!你了解嘛!?


北京元安物联大数据开发面经汇总

1. 关于店铺网站页面访问流分析这一块,里面的基础的数据需求是怎么来的?

2. 你们这些指标力度主要是在pv、uv、ip是嘛?在哪些维度上会产生?

3. 数据提取是怎么提取的?有没有用比如一些第三方的一些服务?

4. 这个PIO模式是怎样?PIO入库

5. 你们在数据清洗的过程是怎样做的?

6. 14)除了产品外,会提一些数据方面的要求,还是你们自己制定?

7. 广播变量的使用及为何使用,原理

8. 数据清洗和入库这一块是怎么去做计算的

9. hbase的热点问题怎么形成的

10. kafka为什么要设5个分区

11. sparkstreaming的开窗函数

12. 产生shuffle的算子

13. hashMap与hashtable的区别

14. redis集群宕机的问题

15. 创建scalaMap有—>和元组两种

16. spark的collect收集的数据在DriverJVM内存中

17. hdfs的存储格式:parquet压缩使用snappy

18. hive的存储格式以及对集合的操作

19. sparkStreaming的容错

20. spark缓存的数据放到哪里,计算的数据放到哪里

21. 项目中遇到的问题,以及解决思路

22. Hbase存放那些数据,多大量

23. 创建DataFream有几种方式,他与DataSet还有RDD区别和优缺点

24. ArrayList与LinkedList区别

25. Kafka的数据积压和数据倾斜问题


公司在北京朝阳望京,没有融资,几十人规模。创业型公司,技术人才很多,对于刚入行来说是个不错选择~

#河狸家##社招##面经##数据开发工程师#
全部评论
您这面的是离线吗?
点赞 回复 分享
发布于 2021-11-18 01:23

相关推荐

来,说点可能被同行“骂”的大实话。🙊当初接数字马力Offer时,朋友都说:“蚂蚁的“内包”公司?你想清楚啊!”但入职快一年后的今天,我反而对他有了不一样的看法!🔹 是偏见?还是信息差!之前没入职之前外面都在说什么岗位低人一等这类。实际上:这种情况不可至否,不能保证每个团队都是其乐融融。但我在的部门以及我了解的周边同事都还是十分好相处的~和蚂蚁师兄师姐之间也经常开一些小玩笑。总之:身份是蚂蚁公司给的,地位是自己挣的(一个傲娇女孩的自述)。🔹 待遇?玩的就是真实!试用期工资全额发!六点下班跑得快(早9晚6或者早10晚7,动态打卡),公积金顶格交。别听那些画饼的,到手的钱和下班的时间才是真的(都是牛马何必难为牛马)。🔹 能不能学到技术?来了就“后悔”!我们拥有权限直通蚂蚁知识库,技术栈多到学不完。说“学不到东西”的人,来了可能后悔——后悔来晚了(哈哈哈哈,可以不学但是不能没有)!💥 内推地址:https://app.mokahr.com/su/ueoyhg❗我的内推码:NTA6Nvs走我的内推,可以直达业务部门,面试流程更快速,进度可查!今天新放HC,之前挂过也能再战!秋招已经正式开始啦~机会就摆在这,敢不敢来试一试呢?(和我一样,做个勇敢的女孩)
下午吃泡馍:数字马力的薪资一般哇,5年经验的java/测试就给人一万出头,而且刚入职第三天就让人出差,而且是出半年
帮你内推|数字马力 校招
点赞 评论 收藏
分享
评论
6
33
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务