11-13 17:10 门头沟学院大数据开发工程师

关注

阿里云大数据数仓面经

1.对 Hadoop 各组件之间通信所使用的 RPC协议的具体内容
2.Hadoop 中读数据的完整流程(包括客户端发起请求、与 NameNode 交互、与 DataNode交互等各环节)
3.在数据传输过程中，若 DataNode 突然挂掉，Hadoop 系统会如何处理(包括任务重试、数据副本恢复等机制)
4.HBase 源码的核心模块、关键类及底层实现窪捞轶货嶍瑛冶辑(如数据存储、读写流程等相关源码细节)
5.在 HBase 中构建二级索引时，通过何种方式或机制保证索引数据与原始数据的一致性(如事务控制、同步更新策略等
6.JVM 的具体架构(包括程序计数器、方法区虚拟机栈、本地方法栈、堆等组成部分);堆内存的划分的原理及适用场景;以及平时实际工作中是否会调整GC算法调整的依据是什么
7.JVM 参数中，-Xms(初始堆大小)和-Xmx(最大堆大小)仅设置其中一个，与同时设置两个且值相同的情况下，对 JVM 运行产生的具体区别
8.如何通过命令或工具查看当前 Java 进程中内存各代(新生代的 Eden 区、Survivor区，老年代等)的内存占比情况
9.用于查看 Java 进程中线程堆栈信息的具体命令(如 jstack 等)及使用方法
10.如何查看 Java 进程中某个对象的具体大小包括对象本身及引用的对象所占用的内存)，可使用的命令或工具及操作步骤
11.排查堆内存泄露的方法，除了将堆内存Dump 出来用MAT(Memory AnalyzerTO01)分析之外，还有哪些更简单直接的排查方式

全部评论

推荐最新楼层

努力提升自己l

科大讯飞_核心研发平台_数据开发(实习员工)

都在我的知识盲区

点赞回复分享

发布于今天 00:50 安徽

11-13 13:10

门头沟学院大数据开发工程师

26秋招快手大数据开发一面

1.目前所在地在哪?现在有课程安排?2.面试官介绍面试的流程。3.自我介绍。4.sq1题(口述回答):要取年至今所有用户的首次及未次下单时间。5.如果在此基础上，还要求出首次及未次下单时间对应的订单 id、商品id等，应该如何处理?6.了解row_number吗?7.介绍一下实习公司的业务/产品?8.讲一下你做过的任何一个优化案例?9.有其它关于计算资源、存储的具体优化案例吗?10.介绍-下spark问题定位的流程?11.介绍一下项目涉及的核心指标?12.项目中部分指标是怎么做的(计算逻辑)?13.有没有考虑过为啥要做这些指标?14.有接触过实时项目吗?15.为什么要数仓分层?16.维度建模有哪些模型?17.有了解过大模型吗?有做过算法题吗?18.sq1题:求出所有成绩均大于80分的学生姓名?19.讲解一下代码的思路?你写的代码可以如何优化20.知道distinct和group by的区别吗?21.什么时候能到岗?22.反问环节。

查看20道真题和解析

点赞评论收藏

分享

10-22 15:09

中国科学技术大学大数据开发工程师

阿里云CIO数开三面1022

主管面，50分钟1.问项目1是干什么的2.问项目2的技术栈3.问实习的数仓维度建模4.慢sql优化5.为什么选择数据开发而不是前后端测试6.为什么不去美团7.做过数据治理和实时计算吗，讲解8.美团的mafka和kafka的优势9.分布式计算mapreduce过程10.集群发生故障怎么样保证数据安全？11.如何跨集群保证数据安全？两个手撕12.要求c语言，不能用函数，问字符串中最长不重复子串，滑动窗口 哈希表（用数组设置）13.多个用户多个行程id，每条记录是一个用户某一个行程，有起始时间 结束时间 起始地点 结束地点 费用，统计用户和航班的起始时间地点和目标时间地点 总费用输入 用户 ID 行...

查看13道真题和解析

点赞评论收藏

分享

11-13 16:10

四川大学大数据开发工程师

京东数据仓库校招面经

1.列举几种数据倾斜的情况，并解释为什么会倾場咏，以及如何解决?2.解释一下 SQL 运行步骤，是否有优化空间如果有，如何优化:SELECT a.id,b.nameFROM a LEFT OUTER JOIN bON a.id =b.idWHERE a.dt='2016-01-01'AND b.dt='2016-01-01';3.已知表 a 是一张内部表，如何将它转换成外部表?请写出相应的 Hive 语句4.用 select 做查询时，用哪个函数给值为null的数据设置默认值?5.Hive 中，建的表为压缩表，但是输入文件为非压缩格式，会产生怎样的现象或者结果?6.订单详情表 ord_det(order_id 订单号，sku_id 商品编号，sale_qtty 销售数量，dt 日期分区)，任务计算2016年1月1 日商品销量的 Top100，并按销量降序排序7.某日志的格式如下:pin|-lrequest_tm|-url|-|sku_id|-|amount，分隔符为"-'，数据样例为:张三-|q2013-11-2311:59:30-www.jd.com-100023-110.15。假设本地数据文件为 sample.txt,先将其导入到 hive的test 库的表t_sample 中，并计算每个用户的总消费金额写出详细过程包括表结构8.test.log 日志中内容如下左列所示，使用awk 输出右列 4行数据:左列:10-3-jd-dv、2-4-jd-dv、5-7-pv-click、36-24-pv-uv、37-24-pv-uV、24-3-uv-mq右列:10-4-jd-dv、5-7-pv-click、37-24-pv-uv、24-3-uv-mq9.Storm 的分组策略有哪些?

点赞评论收藏

分享

11-05 10:50

门头沟学院大数据开发工程师

干货满满！大数据核心101问

找大数据工作八股到底要背到什么程度？首先就是不要死记硬背，要理解记忆，弄懂其中的细节；其次就是找到面试重点，因为你面试完很多场后会发现，经常被问到的题目就那些！如果你还没有参加过面试或者不知道大数据面试重点有哪些，我这里整理了一份面试必背的101道大数据题目，一定会对你有所帮助HDFS的架构HDFS的读写流程小文件过多有什么危害，你知道的解决办法有哪些Secondary NameNode 了解吗，它的工作机制是怎样的简述MapReduce整个流程join原理yarn 的任务提交流程是怎样的简述Hadoop1.0 2.0 3.0区别简述什么是CAP理论，zookeeper满足CAP的哪两个zoo...

大数据开发面试笔记

点赞评论收藏

分享

11-13 11:10

门头沟学院大数据开发工程师

腾讯校招大数据开发面经

1.WordCount 具体是怎么跑的?比如怎么分片、map 阶段做了啥、shuffle 是咋回事、reduce 最后怎么汇总的2.MapReduce和Spark 到底差在哪儿?适用场景这些都得对比着说3.Spark 提交任务时，Client模式和集群模式有啥不一样?比如 Driver 在哪跑、日志在陖瞎圈看、适合啥场景4.同一条 SQL，为啥 SparkSQL 跑起来比HiveSQL 快?得从执行引擎、优化器这些底层说说原因5.自定义 UDF 怎么实现?比如在 Hive 或Spark 里，具体步骤是啥，有没有踩过坑6.设计 HBase 表得注意啥?rowkey 怎么设计才合理、列族要不要分、版本数怎么设，这些睪腘狐旨を曽斷纰可能问到7.HBase 里的 HLog 是干嘛的?跟数据持久化、故障恢复有关系吗8.都是存在 HDFS 上的数据，为啥 HBase 能支持在线实时查询，Hive 就不行?底层存储结构不一样在哪9.用 SparkSQL 操作 Hive 数据时，有没有縈区堠浓ゴ壮攥到过兼容性问题?比如某些函数不支持、数据格式读不对之类的，怎么解决的10.Spark Streaming、Storm、Flink 这几个流处理框架，区别在哪?各自的优缺点和适用场景得搞明白场景题:11.数据量特别大，要用三个 Map 和一个Reduce 来做 Top10，哪种方法效率最高?得考虑怎么减少数据传输、避免倾斜

查看11道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 第一次找实习，我建议__ #

20220次浏览 274人参与

# 韶音科技求职进展汇总 #

59984次浏览 505人参与

# 从mentor身上学到了__ #

17698次浏览 282人参与

# 你怎么评价今年的春招？ #

141841次浏览 1386人参与

# 什么样的公司千万别去 #

15896次浏览 114人参与

# 外出实习被同学举报 #

3552次浏览 31人参与

# 你投递的公司有几家约面了？ #

149377次浏览 982人参与

# 秋招暂停，我将对以下公司做出处罚__ #

29031次浏览 134人参与

# 秋招结束之后的日子 #

105746次浏览 1017人参与

# 你听到的“最没用”的秋招建议 #

20257次浏览 231人参与

# 如果今天是你的last day，你会怎么度过？ #

47638次浏览 298人参与

# 秋招我要惩罚这些公司 #

2700次浏览 22人参与

# 你认为工作的意义是什么 #

202625次浏览 1287人参与

# 打工人的至爽时刻or至暗时刻 #

41646次浏览 221人参与

# 2025秋招体验点评 #

46541次浏览 475人参与

# 工作以后，你父母对你啥态度 #

9063次浏览 95人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

4017次浏览 18人参与

# 在国企工作的人，躺平了吗？ #

375161次浏览 3930人参与

# 面试被问期望薪资时该如何回答 #

311190次浏览 1787人参与

# 实习生的蛐蛐区 #

835524次浏览 4101人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务