快手数仓凉经
1. 介绍项目,
2. 询问项目中的难点
3. hbase 的读流程 : zk获取元数据,region,
4. hbase 的rowkey的设计: 加盐,反转,哈希
1. 哈希 基于 RowKey 的完整或部分数据进行 Hash,而后将Hashing后的值完整替换或部分替换原RowKey的前缀部分,对scan不友好
2. 反转都可以分散写的压力,但是对scan操作不友好,对get 不影响
3. 加盐,加盐的原理是在原RowKey的前面添加固定长度的随机数,也就是给RowKey分配一个随机前缀使它和之间的RowKey的开头不同。 对写友好。 对查询不友好
5. 列族和列的关系 子集
6. Spark的宽依赖和窄依赖
7. Stage 是怎么划分的
8. MR的执行过程
9. Spark的执行过程
10. Hive 的计算过程
11. Doris 的什么量级查询不了。
sql题
1. 连续登陆三天的用户
2. 将用户登录的天数合并为一行。 concat_ws(',',to_date(login_time) );
很菜,sql没写出来,对spark和mr的基础知识也不太熟
面试官还是很nice的
2. 询问项目中的难点
3. hbase 的读流程 : zk获取元数据,region,
4. hbase 的rowkey的设计: 加盐,反转,哈希
1. 哈希 基于 RowKey 的完整或部分数据进行 Hash,而后将Hashing后的值完整替换或部分替换原RowKey的前缀部分,对scan不友好
2. 反转都可以分散写的压力,但是对scan操作不友好,对get 不影响
3. 加盐,加盐的原理是在原RowKey的前面添加固定长度的随机数,也就是给RowKey分配一个随机前缀使它和之间的RowKey的开头不同。 对写友好。 对查询不友好
5. 列族和列的关系 子集
6. Spark的宽依赖和窄依赖
7. Stage 是怎么划分的
8. MR的执行过程
9. Spark的执行过程
10. Hive 的计算过程
11. Doris 的什么量级查询不了。
sql题
1. 连续登陆三天的用户
2. 将用户登录的天数合并为一行。 concat_ws(',',to_date(login_time) );
很菜,sql没写出来,对spark和mr的基础知识也不太熟
面试官还是很nice的
全部评论
相关推荐
10-12 19:23
重庆邮电大学 Java
敢逐云霄志:你打招呼语怎么能这么长,hr都没看下去的欲望,简明扼要说重点,就读于某某学校某某专业,26届应届毕业生,学信网可查,先后在某某公司实习过(如有),然后做过什么项目,想找一份什么样的工作,可实习几个月以上,期待您的回复。 点赞 评论 收藏
分享


