首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
鱼街
华南农业大学 数据仓库
关注
已关注
取消关注
顶
@最不牛的牛客:
数仓方向实习或求职需要准备什么?(小白向)
前情提要:本文主要面向想在数仓方向求职的牛油,仅是我的个人理解和想法,欢迎提出建议和修改意见 近期有周围同学和个别牛友有问我:“数据仓库岗位需要准备什么才能找到实习或工作”,我在牛客上没有找到面向小白的比较清晰的解答,所以试着回忆一下我的去年春招(实习)和今年秋招我做的准备,并试着做一点总结,看能不能解决大家的部分疑惑。 首先,实习和秋招都面过多个互联网大厂,发现实习和正式的难度差距不是很大的。不要抱着“我随便学学就能找到实习”或“实习应该不需要会许多技术栈吧,我大概了解一下大数据组件就好”的想法。我大概觉得实习是秋招的70%难度(感觉日常实习跟暑期实习难度差不太多),都是需要手撕算法和背八股的,实习需要至少提前2个月准备比较稳妥,而秋招/春招则需要更多的时间,相关方向实习是求职最好的敲门砖。实习和求职所需准备(每一项我会列举几个面试常问的问题,可以对比一下自己的情况)1、编程语言 由于很多大数据组件都是由Java编写,所以Java是必须要学会的,而且要较为深入。这里的深入并不是指工程能力,而是要把Java SE学明白,这里就有很多八股需要背。sql也需要非常熟练,不过这部分基本都是使用,八股不多。Scala和Python我觉得是锦上添花,可学可不学。八股例:Java的GC有哪些,有什么特点?Java多线程和线程池?hashmap的底层实现?列表扩容机制?sql执行流程?2、算法能力 这个没得说,最简单的办法就是刷lc或牛客,至少要刷完面试高频的题,很多面试都有手撕算法,在会写的同时也要有一定的理解,不熟练的话面试紧张很容易写不出来。在数仓方向与后端不同,也需要对sql熟练,面试基本上都会手撕sql,个人理解sql比算法要简单不少,但也需要一定的积累。偶尔也会遇到一点非算法的手撕,比如写个饿汉单例,或写个分词计数(MapReduce或Spark)。3、大数据组件 hadoop系列要背一些面经的,hdfs、MapReduce、yarn、hive、zookeeper等,这里有不少面经需要背,也是最能体现你熟悉大数据领域的地方。其次离线数仓要学好spark,实时数仓要学spark stream和flink。其他的像MySQL(很重要)、redis、Kafka(mq)、clickhouse等等也是体现你能力的地方,体现你的专业。八股例:mr中shuffle的具体流程?三次排序?分别是什么排序?spark的宽窄依赖?如何划分stage?比mr优势在哪?hdfs的容灾策略?读写流程?fsimage和editlog?MySQL版本链?为什么使用B+树?数据倾斜?怎么解决?怎么设计表redis雪崩?4、数仓模型 这是一个非常重要的部分,以至于我单独拿出来。因为这是考察面试者到底懂不懂数仓最直接的问题。至少学好阿里的one data数仓模型,至少要懂每层是在干什么,为什么要这么设计。八股例:讲一下数仓模型?为什么这么分层?维度是什么?维度建模是什么?数仓建模的流程步骤?给你一个场景,你会怎么设计?星型、雪花、星座模型?5、相关项目 需要做至少一个数仓的项目,b站上很多,找一个至少看明白,写在简历上(面试官问一些刁钻问题的时候能清晰回答不露馅)。项目是必须要有的,即使你的项目在面试官看来像个玩具,但如果连相关项目都没有,面试官也没有办法(许多公司面试时都明确要求要问项目)。6、计算机基础 很多同学注重语言和大数据组件的学习,忘记了计网、操作系统等这些才是学生最该熟练掌握的,这是体现个人知识扎实程度的部分,非常关键。这里也会有一些八股需要背,对于科班同学来说,学好课上的知识就基本OK,但对非科班的同学来说就稍微麻烦一些,需要花些时间。八股例:TCP与udp?三招四挥?http与https?七层模型?页?线程与进程?7、面试技巧 略(网上太多了)但一定注意不要问不该问的,一定不要过于谦卑,要自信但不要自傲。如果你能跟面试官聊一些他都感兴趣的东西,那就基本上成功了!总结 如果上面的一些八股你都差不多能答上来,那很有机会找个不错的实习,我找实习的时候也就差不多这样(不过今年不知道会不会更卷,不敢打包票[尴尬]) 如果是实习,可以根据情况少学一些,但也要至少对Java,mr,hdfs等有较为深刻的认识,算法sql也要过关。 求职则可以根据想投的职位jd,深入学习一下,我认为知识深度大于广度,与其去把所有OLAP都涉猎一点,不如深入钻研一下某组件,让面试官眼前一亮。
点赞 37
评论 8
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-25 23:03
门头沟学院 Java
2026.4.25 面经学习第三天
雪花算法 主要用于生成全局唯一ID,并且长用来作为数据表主键 雪花算法=符号位+时间戳+机械码+序列号 优点是性能高,不依赖数据库,天然支持分布式 缺点是会有时钟回拨产生重复ID和序列号溢出的风险 时钟回拨问题怎么解决? 检测并阻塞 当检测到当前时间 < 上一次时间时,直接拒绝或阻塞,等待时间追平。这里的等待时间追平是指系统时间追上一次生成ID的时间 多时钟序列 引入“时钟版本号”(clockId),时间回拨时切换 clockId 保证不同时间段生成的 ID 不冲突(类似逻辑分片) 序列号溢出怎么解决 等待下一毫秒 当序列号用完,阻塞到下一毫秒再继续生成这是默认实现,简单且可靠 扩展序列...
每日面经记录
点赞
评论
收藏
分享
04-22 16:32
广西大学 算法工程师
快手 大模型算法 一面
1. 自我介绍2. 为什么要用 DPO,你的 DPO 数据从哪里来DPO 主要用来做偏好对齐,让模型在两个候选答案中更倾向于选择符合业务偏好的回答,而不是只学会复现标准答案。SFT 解决的是“会不会做”,DPO 更偏向解决“更喜欢哪种做法”。数据一般不是直接从线上拿一问一答就能用,而是先用上一版 checkpoint 对同一批 prompt 做多候选采样,再经过规则、模型评审和人工复核构造 chosen/rejected。这里不用商业 API 蒸馏正反样本,是因为不同模型的输出分布和本地模型不一致,直接蒸馏会让偏好边界偏到外部模型的风格上,最后 DPO 学到的是别人的分布,不一定能提升当前模型...
AI-Agent面试实战...
点赞
评论
收藏
分享
04-23 00:20
字节跳动_全栈开发(实习员工)
入职成功!
大愣子衰哥:
老哥,是正式还是实习
点赞
评论
收藏
分享
04-14 17:09
西南交通大学 C++
原来平均泡这么久,我又可以等了
腾讯校招公众号的数据,估计那77%都在横向
没见过C:
我感觉还有23%没发还差不多
我的求职进度条
点赞
评论
收藏
分享
04-20 22:37
广西大学 算法工程师
美团 Agent开发 一面
群里小伙伴投稿的时候 我也懵了一下 ,纯八股1. 自我介绍,着重讲讲你的履历2. 讲讲 HashMap 和 Hashtable 的区别,为什么现在工程里几乎不用 HashtableHashtable 的方法基本都是同步的,粒度重,性能差,而且不支持高并发场景下的细粒度优化。HashMap 本身不是线程安全的,但它更轻量,配合外部同步、ConcurrentHashMap 或更合理的并发设计更适合现代工程。Hashtable 还有一个问题是历史包袱重,API 设计也比较老旧,所以现在一般不作为首选。3. 设计一个线程安全的“批量删除 HashMap 中符合条件的 value”功能不能直接在遍历时删...
AI-Agent面试实战...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
前端手撕总结
1.4W
2
...
放弃其他大厂,我为什么选择携程机票BU?
7055
3
...
第一次面试被压力了,以为是kpi
3194
4
...
得物后端AI面
2839
5
...
地狱四月
2690
6
...
我的前途全被学校毁了!!!
2200
7
...
28届双非本oc鹅厂
1924
8
...
25届入职互联网大厂的老登,总结了几点心里话
1663
9
...
最近在做Agent面试,我发现了很多共性的问题...
1611
10
...
暑期完结!
1406
创作者周榜
更多
正在热议
更多
#
实习第一天,你在干什么
#
101次浏览
1人参与
#
如果公司降薪,你会跳槽吗?
#
159649次浏览
929人参与
#
华泰星战营,提前锁定校招offer
#
14798次浏览
595人参与
#
你和你的mentor相处模式是__
#
109次浏览
1人参与
#
简历上如何体现你的“AI”能力?
#
17980次浏览
385人参与
#
工作不开心辞职是唯一出路吗
#
18444次浏览
60人参与
#
你总挂在第__面?
#
13024次浏览
153人参与
#
哪些AI项目值得做?
#
27999次浏览
664人参与
#
找不到大厂实习可以去小厂吗?
#
23742次浏览
280人参与
#
实习时最怕听到的一句话
#
24891次浏览
227人参与
#
拼多多集团-PDD笔试
#
87680次浏览
595人参与
#
26年哪些行业会变好/更差
#
65954次浏览
533人参与
#
你是怎么和mt相处的?
#
102275次浏览
502人参与
#
没有面试的日子里,你在做什么
#
15385次浏览
389人参与
#
打工人的工作餐日常
#
96333次浏览
556人参与
#
你知道最慷慨和最抠的公司分别是
#
12202次浏览
119人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
200931次浏览
1192人参与
#
0offer互助地
#
770828次浏览
4729人参与
#
网易游戏雷火笔试
#
11694次浏览
109人参与
#
你想吐槽公司的哪些规定
#
48102次浏览
239人参与
#
选择和努力,哪个更重要?
#
207498次浏览
1554人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务