百度提前批_数据基建专员_深圳 一面
1.自我介绍
2.实习平时对接的业务方是谁
3.spark的数据倾斜优化
4.有用过python或者scala写过rdd级别的代码吗
5.spark调优的参数有哪些
6.报表用的什么数据库
7.spark的执行过程
8.是否用到过数据湖
9.sql题:region(地区,字符串类型)
department(部门,字符串类型)
product_line(产品线,字符串类型)
amount(金额,数值类型,如 Double) 如何用一个sql实现将这个三个维度的任意组合都实现的聚合
10.反问,这个部门是百度销售体系的数据开发团队,虽然岗位名字叫数据基建专员但其实和数据开发工程师干的活是一样的
2.实习平时对接的业务方是谁
3.spark的数据倾斜优化
4.有用过python或者scala写过rdd级别的代码吗
5.spark调优的参数有哪些
6.报表用的什么数据库
7.spark的执行过程
8.是否用到过数据湖
9.sql题:region(地区,字符串类型)
department(部门,字符串类型)
product_line(产品线,字符串类型)
amount(金额,数值类型,如 Double) 如何用一个sql实现将这个三个维度的任意组合都实现的聚合
10.反问,这个部门是百度销售体系的数据开发团队,虽然岗位名字叫数据基建专员但其实和数据开发工程师干的活是一样的
全部评论
提前批还有kpi面吗
没有算法吗
总结下,面试是两个人一起面的,一男一女。流程挺正常的,当然感觉对面意向也不是很大,估计一轮游了😤。不过也还好,毕竟都没想到百度的提前批能给我面,虽然估计是kpi面了
sql题参考答案
SELECT
region AS 地区,
department AS 部门,
product_line AS 产品线,
SUM(amount) AS 总金额
FROM
sales
GROUP BY
CUBE(region, department, product_line) -- 自动生成小计和总计
ORDER BY
地区, 部门, 产品线;
相关推荐

点赞 评论 收藏
分享