百度提前批-数据基建专员-深圳

1.自我介绍
2.实习平时对接的业务方是谁
3.spark的数据倾斜优化
4.有用过python或者scala写过rdd级别的代码吗
5.spark调优的参数有哪些
6.报表用的什么数据库
7.sql题:region(地区,字符串类型)
department(部门,字符串类型)
product_line(产品线,字符串类型)
amount(金额,数值类型,如 Double) 如何用一个sql实现将这个三个维度的任意组合都实现的聚合
全部评论
补充一下 8.spark的执行过程 9.是否用到过数据湖 10.反问,这个部门是百度销售体系的数据开发团队,虽然岗位名字叫数据基建专员但其实和数据开发工程师干的活是一样的
点赞 回复 分享
发布于 08-06 16:52 北京

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务