百度面试2024数据开发岗位

#软件开发2024笔面经#
百度面试2024数据开发岗位
1.结合以往经历,谈谈项目管理哪些过程域,你认为更重要?原因是啥?你的弱势点有哪些?
2.讲一个项目,完整介绍下项目,你的职责,具体咋做的,成效业绩。
3.总结讲一下你主导过的数据分析应用类项目中痛难点有哪些?怎么解决的?
4.横向讲一下几个etl工具的优缺点?cdm,kettle,infa
5.数据共享服务怎么做的?过程中如何做到的安全合规?
6.数据要素相关工作做过哪些?有过哪些接触?
7.招投标工作,文档材料编写汇报,做过哪些? #offer#  #大数据#   
全部评论

相关推荐

点赞 评论 收藏
转发
美团数据开发转正实习面经总结:美团效率,完全没准备好就面试了。问了很多八股,兼具深度广度,知道的不知道全问了。学习之路道阻且长啊。数仓分层:为什么不能直接建DWD,DIM层,ODS层的必要性是什么?DWS层的作用是什么,为什么不能直接建ADS层?完全同上乱答SQL考查:统计每个科目各等级的人数,写的很艰辛,面试的时候脑子经常短路,干着急。菜就多练分组topN,窗口函数。left join where中的条件写在where里和写在on里面有什么区别,查询结果一样吗?Java考查:HashMap底层组成,怎么减少扩容次数,答扩大初始容量,增加扩容因子。说说面向对象。了解的数据类型。Hive:什么情况会导致倾斜,怎么解决。写了一个HQL语句,问从提交到MR的整个详细执行过程,答的很粗略。hive 怎么根据表名去找表数据,metastore。MySQL 常见内存引擎,什么时候适合用哪种引擎。事务隔离级别。银行应该用哪种隔离级别。为什么用B+树,而不是B树或者其他。行列存储优缺点。常见的压缩格式。MR:切片规则,100个文件前面99个小文件,最后一个文件150M,默认切几片。顺势问到小文件的危害,怎么解决。分区器问题,疯狂拷打,但没什么印象了环形缓冲区调大调小有什么问题,纯乱答。写个快排,没注意有重复元素,好像陷入死循环了。问了为什么选择走数据开发这条路,有看过什么大数据类型的书吗。最后问你的亮点是什么,一直都不知道这些问题怎么答然后详细描述。其他的想不起来了。
点赞 评论 收藏
转发
1 2 评论
分享
牛客网
牛客企业服务