首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
牛客图书馆
>
读书笔记
开通博客写笔记
读书笔记
全部
第1章
第2章
第3章
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
《Spark快速大数据分析》——第三章(下)
3.2创建RDD Spark提供了两种创建RDD的方式:读取外部数据集。以及在驱动器中对一个集合进行并行化。 创建RDD最简单的方式就是把程序中一个已有的集合传给SparkContext的parallelize()方法。 例如: #pyho...
君一时一迈
编辑于 2019-04-26 18:14:50
《Spark快速大数据分析》——第三章(上)
Spark对数据的核心抽象——弹性分布式数据集(Resilient Distributed Dataset,简称RDD)。RDD其实就是分布式的元素集合。在Spark中,对数据的所有操作不外乎创建RDD,转化已有RDD以及调用已有RDD进行求值。而在这一切的背...
君一时一迈
编辑于 2019-04-19 17:18:33
热门图书
灭绝的哺乳动物图鉴
集体智慧编程
C语言程序设计
The Little Schemer - 4th Edition
量子力学
市场营销
查看全部