首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
牛客图书馆
>
读书笔记
开通博客写笔记
读书笔记
全部
第1章
第2章
第3章
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
第六章——Spark进阶编程(三)
基于分区进行操作 基于分区对数据进行操作可以让我们避免为每个数据元素进行重复的配置工作。例如打开数据库连接或创建随机数生成器等操作,都是我们应当尽量避免为每一个元素都配置一次的工作。 Spark提供基于分区的map和foreach,让部分代码只对R...
君一时一迈
编辑于 2019-07-05 23:07:39
第六章——Spark进阶编程(二)
累加器——共享变量之一,用来对信息进行聚合。 例:在Python中累加空行 file = sc.textFile(inputFile) #创建Accumulator[Int]并初始化为0 blankLines = sc.accumulator(0)...
君一时一迈
编辑于 2019-06-28 17:19:19
第六章——Spark进阶编程(一)
累加器——共享变量之一,用来对信息进行聚合。 例:在Python中累加空行 file = sc.textFile(inputFile) #创建Accumulator[Int]并初始化为0 blankLines = sc.accumulator(0)...
君一时一迈
编辑于 2019-06-22 18:12:14
热门图书
费恩曼物理学讲义(第1卷)
集体智慧编程
计算机程序设计艺术(第2卷)
笛卡儿几何
用TCP/IP进行网际互连
反应式设计模式
查看全部