大数据研发实习生(货拉拉科技深圳总部)

大数据平台研发实习生(货拉拉科技深圳总部)
职位描述:
参与大规模企业级大数据平台的系统研发和维护相关工作,主要包含以下两个方向:
1、平台系统:包含实时和离线数据研发平台/分布式工作调度系统/数据治理平台/数据集成平台等。
2、基础架构:基于开源Hadoop生态构建的大数据基础架构,包括但是不限于HDFS、MapReduce、Yarn、Hive、Flink, Spark、OLAP(Clickhouse/Druid/Doris/Kylin)等。
 职位要求: 
1、计算机、软件工程或相关专业,编程能力强悍者专业可放开;
2、扎实的计算机理论基础,包括操作系统、计算机网络、算法和数据结构、数据库等;
3、熟悉linux开发环境,熟悉至少一门编程语言,如java、shell、python等;
4、对数据敏感,热爱大数据技术,喜欢探索未知事物(表现优秀者有转正机会)。  
在这里你会学习到:
1、业界一线互联网企业大数据平台建设实践经验。
2、大规模分布式系统(存储/资源管理/计算框架等)原理和应用
3、成熟的研发体系和SRE体系。
全部评论
有转正名额吗
点赞 回复 分享
发布于 2024-09-25 14:35 广东
一天多少钱捏
点赞 回复 分享
发布于 2024-09-24 16:25 河北
我我我,我要去
点赞 回复 分享
发布于 2024-09-24 15:01 广西
想问一下大佬,一面二面这种的会有算法编程题or sql题吗?
点赞 回复 分享
发布于 2024-09-19 14:31 广东
😍
点赞 回复 分享
发布于 2024-09-16 20:13 广东

相关推荐

09-25 18:40
已编辑
河北大学 Unity3D客户端
点赞 评论 收藏
分享
08-28 11:37
已编辑
华东师范大学 Java
Sigma777:本来想说师弟怎么把我这个老东西卷没了,仔细一看是师兄 简历不错,但是得准备好选型话术,比如我举个例子你为什么要用caffeine,一般我们的小项目不会有这么hot的key需要本地缓存,你要说明你是如何发现有这么hot的key连redis都兜不住的,引入后优化了多少时间,然后还有本地缓存大小设置为多少,这个大小能保证热点key不会因为太小而淘汰也不会因为太大影响服务吗,为什么不用guava,引入本地缓存同步问题怎么解决。 然后分库分表,为什么你觉得要分表,数据量多少,分多少张表几个库,分片键选择依据,你的所有查询能不能准确定位到某一张避免全库扫描,有没有数据倾斜问题就是分的每张表数据量差距特别大,你是一开始分库分表还是后期发现瓶颈才分,如果后期才分你如何把旧表的数据搬过去同时还能确保业务正常运行。 然后是消息队列,你说缓存高并发请求,却选择了吞吐量较小的rabbit,有什么原因吗,为什么不选Kafka。 然后你说分布式锁解决集群环境并发安全,也就是说你是集群部署的,请问是怎么部署的,docker还是k8s,部署几台,配置是多少,jvm参数设置是多少,有监控吗,线上遇到故障吗,怎么解决的,有做负载均衡吗,数据是怎么压测的等等。 zset缓存本月实时排行数据具体怎么做的,会有大key问题吗。 其他本小渣暂时想不到了,留给其他大神点评
点赞 评论 收藏
分享
评论
3
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务