数据开发学习路径(本人亲测)

分享一下我在大数据方向的学习路线,列出的基本上是必须掌握的内容。对于项目方面,建议先离线后实时项目,再之后便是数据湖等项目。
另外推荐《大数据之路》这本书,里面涉及到的理论和企业中的白皮书基本一样。平常也可以多翻看各个公司公开分享的技术文章,源码等。比如:阿里的学习文档、美团的技术文档等,在没有实际生产经验时可以了解各个场景下技术选型、底层调优、内存调整、资源配置、数据治理等各个重要环节和内容。

1. Java:JAVA SE、JVM、JUC
(刚开始只需要看Java基础就可以,不要花太多时间在Java的学习上,也不需要学习一些web框架,因为不管是源码二次开发,UDF开发,还是数仓都不需要用到这些框架,除非涉及到数据平台开发。
2. Linux+Shell,熟悉基本操作即可
3. Git、Maven(了解会用,如果需要使用能快速学习上手使用即可)
4. Hadoop(重点,HDFS,MapReduce,Yarn)
5. Zookeeper
6. Hadoop高可用(了解即可)
7. Flume
8. Kafka(重点,时间紧张的话可以大致了解用途,后面可以和Flink一起学,主要用来处理实时数据)
9. Hive(重点,需要熟练了解原理,并且会写HQL,以及一些优化,是基础)
10. Spark(重点,大部分公司都是写SparkSQL,并且调优,需要明白底层原理,内存结构,SparkUI等,来不及的话可以先跳过Java API编写Spark代码的学习)
11. Maxwell、DataX、DolphinScheduler(项目中数据同步、模拟日常调度工作)
12. 离线数仓项目:sgg电商数仓6.0(跟着做完这个项目,就知道数仓、维度模型、指标体系等等,以及生产中一些内容。这套教程比较全面,若来不及可以选择sgg其它离线数仓项目)。学到这里可以去找实习,实时数仓等技术可以在实习中抽空学
13. Flink(重点)
14. MPP架构(如:Doris、Clickhouse、StarRocks)
15. 实时数仓项目
16. 数据治理
17. 数据湖、湖仓一体
18. 刷算法、刷sql、刷场景题
#数据开发工程师#
#秋招#  #春招#  #实习#  #大厂#
全部评论
求资料
点赞 回复 分享
发布于 03-04 16:39 天津
求资料
点赞 回复 分享
发布于 01-16 16:47 广东
求资料
点赞 回复 分享
发布于 2025-12-29 14:58 北京
求资料
点赞 回复 分享
发布于 2025-12-15 09:53 西藏
求资源
点赞 回复 分享
发布于 2025-12-10 11:09 陕西
求资料
点赞 回复 分享
发布于 2025-12-03 13:54 浙江
求资料
点赞 回复 分享
发布于 2025-12-01 10:42 广东
求资料
点赞 回复 分享
发布于 2025-10-11 11:43 湖北
求资料
点赞 回复 分享
发布于 2025-09-22 11:07 安徽省
求分享资料
点赞 回复 分享
发布于 2025-09-08 08:34 江苏
求分享资料~~~
点赞 回复 分享
发布于 2025-08-23 04:50 上海
求分享资料
点赞 回复 分享
发布于 2025-08-04 10:37 北京
求分享资料
点赞 回复 分享
发布于 2025-08-02 15:09 广西
mark
点赞 回复 分享
发布于 2025-07-10 10:41 广东
求分享资料
点赞 回复 分享
发布于 2025-06-29 16:37 四川
mark一下
点赞 回复 分享
发布于 2025-06-26 10:36 北京
求大佬分享资料
点赞 回复 分享
发布于 2025-06-19 10:18 四川
求资料
点赞 回复 分享
发布于 2025-06-13 08:13 安徽
求资料
点赞 回复 分享
发布于 2025-06-10 20:42 江苏
求资料
点赞 回复 分享
发布于 2025-05-31 23:31 北京

相关推荐

首先叠个甲,以下内容是我本人的经历以及总结下来大学期间对自己校招进互联网有帮助的一些方向,包括[一]成绩、[二]证书、[三]竞赛、[四]实习[一]大学成绩绩点不是互联网面试的必需品。经历过几十场互联网的面试,我发现并没有面试官去追问成绩,这主要是因为互联网行业的特殊性,大家更关注你和岗位的匹配度,而非是单纯的优绩主义,但是注意一点别挂科或者说秋招的时候不要再有挂科。[二]证书证书是你学习能力的证明。我在大学本科通过的证书包括四六级、计算机二级、普通话、初级会计师资格证、初级数据分析,面试的时候会有面试官问我为什么会想考这些证书,我的回答统一是:我认为不同的证书代表了我是否具备学习能力。看到这里很多人会评价这些证书没有用,或者对于你以后的工作用不上,但是要注意只有考上的人才有资格评价有没有用。[三]竞赛竞赛体现个人能力与团队精神。我参与过很多的团队类竞赛,从一开始的重在参与到最后冲击各种奖项,这些也都体现在了我的简历当中,在团队竞赛中我常作为队长寻找各种优秀的同学一起努力,也在竞赛里学会如何理解规则、协调统筹等,在多次互联网校招面试中面试官提问过类似的问题,比如“你在竞赛中扮演什么角色,发挥什么作用”“你认为在团队配合中最重要的有哪些,做个排序”实习实习是校招进入互联网的核心竞争力。我在正式入职前一共有过四段实习,一段是五百强教培的营销部,一段是五百强外企的市场部,剩下两段为现任东家的运营岗实习(从大二开始实习,顺序与表述一致),每次实习都是我找到下段实习的跳板,在所有的面试中实习经历都是最多考验的部分,因为现在互联网对用人的要求高,所以在大学期间一定要丰富实习经历,而且这个经历请务必垂直
开工第一帖
点赞 评论 收藏
分享
评论
19
94
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务