百度大数据一面面经

0:自我介绍必不可少的

1:数仓的数据从哪里来的?多少数据?

2:数仓分层

3DWD层如何保证和ODS层的一样的数据粒度,如何提供数据质量保证?

4:什么阶段进行数据清洗?

5:数据量很大的时候每层都进行数据清洗吗?如何解决

6ETL过程中,数据出现问题了如何预警?

7:团队合作的时候如何保证数仓分层的规范?

8Hive的调优(项目写到了这个)

9:什么是zookeeper

10zookeeper实现hdfs的高可用,你在项目中是怎么操做的?(项目写到了这个)

11zookeeper如何保证数据的一致性?
到这里大概聊了五十分钟,口干舌燥,百度问的很专业

手撕代码:

第一题(请大佬赐教,不太会写,窗口函数理解的不好):
HQL:查找出公司每个部门中薪资最高的员工名

假设表名称为department,列名为:Idnamesalary

(先用SQL写出来了,但是要求是HQL,不太会写,面试官提示row_number窗口函数,没写出来,换了第二题)

第二题:Java:单链表,删除单链表的倒数第n个节点(比较简单)

欢迎大家评论区讨论,大家一起交流进步.....


#百度大数据开发工程师面经#
全部评论
select name,salary ,dept_name from (select name,salary,dept_name, row_number() over(partition by dept_name order by salary desc )  as rk from dept ) tmp where tmp.rk=1;
4 回复 分享
发布于 2022-08-14 16:42
rownumber() over(order by salary desc)
1 回复 分享
发布于 2022-07-31 15:06
老哥 请问你是什么学历呀 研究生吗
点赞 回复 分享
发布于 2022-08-29 20:54 北京
老哥用的什么项目啊
点赞 回复 分享
发布于 2022-08-28 02:49 江苏
太牛了大佬,投百度大数据直接简历被挂了😶
点赞 回复 分享
发布于 2022-08-12 18:27
这个进去是平台开发还是写数仓sql诶,
点赞 回复 分享
发布于 2022-07-28 09:54
大佬的项目是有实习的吗还是哪里做的
点赞 回复 分享
发布于 2022-07-27 16:28
老哥,,想请教下第三个问题的答案是啥?
点赞 回复 分享
发布于 2022-07-26 20:11
社招校招呢
点赞 回复 分享
发布于 2022-07-24 22:55
我也写个面经
点赞 回复 分享
发布于 2022-07-22 21:36

相关推荐

评论
5
62
分享

创作者周榜

更多
牛客网
牛客企业服务