大数据工程师面经

👥 面试题目
hadoop的三个核心组件,以及hdfs的读写原理
hive的内部表与外部表有什么区别
hive里面的数据倾斜是什么?怎么去处理?该怎么去预防?
数据仓库的分为几层?每一层是做什么的?是根据什么进行分层的?
hive里面的窗口函数有没有用过?rank(),,dense_rank(),row_number()这三个有什么区别?
hive里面数据表合并是怎么合并的?
​hive里面的列转行是怎么转的?
全部评论
那家公司问那么简单
点赞 回复 分享
发布于 2024-06-11 15:48 安徽
就问些这个啊!好简单啊
点赞 回复 分享
发布于 2024-06-04 09:14 北京
现在学大数据还好找工作吗?硕士毕业想转行
点赞 回复 分享
发布于 2024-05-09 21:44 广东

相关推荐

📍面试公司:北大软件(郑州)🕐面试时间:2026.3💻面试岗位:JAVA开发实习❓面试问题:1.自我介绍2.介绍项目的背景,你为什么要做这个项目?3.根据项目内容进行功能具体是如何实现的的追问3.如何进行性能优化的?3.部分模块的实现流程4.为什么选择这些技术栈?在引入新技术时,你的具体学习路径和验证方法是什么?5.如果代码上线后出现接口404错误,但本地和测试环境都是正常的,你会如何快速定位和解决?6.如何排查“文件删除失败”的问题?7.如何排查“接口响应慢”的问题?8.考察SQL复杂查询、高级关键字(如列转行、递归查询)的掌握程度。9.解释DELETE和DROP操作的本质区别。10.你在项目中写过的最复杂的SQL是什么?如何实现自定义查询(如SQL拼接)?11.解释TCP和UDP的核心区别。12.描述HTTPS的握手过程。13.解释常见的HTTP状态码14.常用的Linux命令有哪些?15.对HTML、DOM、JavaScript的掌握程度如何?16.如何处理前后端联调中的参数校验和异常?17.在项目中是如何进行异常处理的?18.如何使用MyBatis的标签(如<where>)来优化动态SQL,避免冗余的AND/OR?19.如何实现权限控制?前后端在权限控制上如何协作?20.你似乎经常使用AI来解答技术问题,你如何看待这一点?如何平衡AI工具的使用和深入理解底层原理?21.在项目中遇到一个具体的技术难题(如爬虫代码过时、被反爬)时,你的解决思路是什么?22.在项目中,你是如何决定一个功能应该放在前端还是后端实现的?考量的因素有哪些?23.请分享一个你通过自学成功掌握并应用一项技术的具体案例。🙌面试感想:这是我的第一个面试,面试时间一个小时左右,问的还可以不偏也不算难,感觉主要在意自学能力以及对于问题的处理思路,“为什么”比“是什么”更重要:不仅问技术点,更追问选型动机、设计考量和问题背后的原因。关注点赞私信给答案
查看25道真题和解析
点赞 评论 收藏
分享
评论
10
32
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务