知乎 数据仓库 凉经
写在前面:这段时间经过了一段高强度笔面,但还是颗粒无收
面试
面试官进来就说:你不会flink?
我:了解的不多
那我们这次可能通过概率不大,但我们仍然可以就大数据来一波交流
实时:
Flink的checkpoint
Flink的反压
Flink的状态后端
离线:
Kafka的有序性(不可全局有序,但可分区有序)面试官说不对??我让他下去再好好看看
Kafka一定不会丢数据嘛?
Spark的内存模型(yarn-client,yarn——cluster)
数据仓库的意义
怎么衡量一个好的数仓(一致,质量,复用,统一口径。。。。)数据治理相关知识
Hive的执行计划看过没?看过,通过stage,定位数据倾斜。
维度建模方法:雪花,星型
拉链表
三个sql:连续登录,互相关注,最大直播间人数(全秒了)
无奈啊,面试官说你这离线这边很扎实,但知乎的数仓只用实时,主要做实时推荐。寄!
面试
面试官进来就说:你不会flink?
我:了解的不多
那我们这次可能通过概率不大,但我们仍然可以就大数据来一波交流
实时:
Flink的checkpoint
Flink的反压
Flink的状态后端
离线:
Kafka的有序性(不可全局有序,但可分区有序)面试官说不对??我让他下去再好好看看
Kafka一定不会丢数据嘛?
Spark的内存模型(yarn-client,yarn——cluster)
数据仓库的意义
怎么衡量一个好的数仓(一致,质量,复用,统一口径。。。。)数据治理相关知识
Hive的执行计划看过没?看过,通过stage,定位数据倾斜。
维度建模方法:雪花,星型
拉链表
三个sql:连续登录,互相关注,最大直播间人数(全秒了)
无奈啊,面试官说你这离线这边很扎实,但知乎的数仓只用实时,主要做实时推荐。寄!
全部评论
知乎怎么看挂没挂,官网也看不到流程啊
相关推荐
点赞 评论 收藏
分享
03-15 18:50
中南林业科技大学 Web前端 Ryan188:我觉得你简历最核心的问题就是太大众化。
你要有一个认知就是,如果你是面试官,你是HR,其实他们每天都会收到非常多大量重复的像你这种简历。
就是说你的项目不是一个真实的上线的项目,可能是从网上学习而来的,或者是直接copy别人的项目,没有新意,没有展现出你自己对技术的思考,而且你的学历也不占优,自然而然就很难有人去选择你。
所以要做的实际上是差异化方向的工作,也就是“给我一个选择你的理由”,比如最近很火的ai,你可以写一个ai相关项目比如问答应用或者mcp编写或者agent搭建,需要你先花点时间学习,34天吧,展现你对这方面相较于其他人特有的思考; 或者写相关技术博客输出一些技术内容,有具体可以量化的成果等等去增加你的竞争力。
但以上这些都是后话,我去年在你这个时候也是没人理我,咱们双非学历也没实习,难找也正常,我当时整个3月份都没人鸟我,直到有个新招的岗位,很缺人很急,流程很快,所以我一下子进去了,所以运气方面也很重要,需要你一直坚持喝复盘,直到看到光明,加油兄弟
点赞 评论 收藏
分享
查看12道真题和解析