- 岗位职责
● 建设公司级大数据平台,解决规模增长带来的技术和业务问题;
● 负责各类开源组件的性能改进,故障分析,功能扩展包括Kafka,Hadoop, Presto, HBase, Spark, Hive, Druid等;
● 设计开发数据平台组件,包括通用实时数据计算框架,统一sql查询平台,集群管理系统,机器学习平台,数据可视化平台等;
● 设计开发数据仓库相关的工具链,提升数据应用的开发效率并且解决海量数据治理难题;
● 运用大数据平台技术栈,根据业务需求负责公司级数据集市的模型设计和开发,优化数据处理流水线。
- 岗位要求
● 计算机或相关专业本科及以上学历;
● 熟练掌握和理解至少一种编程语言,如Java、Scala、C++、 Python ;
● 全面深入理解计算机基础知识,包括数据结构与算法、操作系统、网络、数据库等;
● 熟悉Linux/Unix开发环境, 熟悉 Sql;
● 使用过 Hadoop,Spark,Kafka,Presto,Airflow等大数据开源系统或读过源码者优先;
● 有大规模分布式系统的设计与开发经验优先;
● 喜欢使用和开发开源系统;
● 对工作有热情,主人翁意识,热爱数据。