首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
牛客图书馆
>
读书笔记
开通博客写笔记
读书笔记
全部
第1章
第2章
第3章
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
《Spark快速大数据分析》——第三章(下)
3.2创建RDD Spark提供了两种创建RDD的方式:读取外部数据集。以及在驱动器中对一个集合进行并行化。 创建RDD最简单的方式就是把程序中一个已有的集合传给SparkContext的parallelize()方法。 例如: #pyho...
君一时一迈
编辑于 2019-04-26 18:14:50
《Spark快速大数据分析》——第三章(上)
Spark对数据的核心抽象——弹性分布式数据集(Resilient Distributed Dataset,简称RDD)。RDD其实就是分布式的元素集合。在Spark中,对数据的所有操作不外乎创建RDD,转化已有RDD以及调用已有RDD进行求值。而在这一切的背...
君一时一迈
编辑于 2019-04-19 17:18:33
《Spark快速大数据分析》读书笔记_第二章
2.1下载Spark 使用Spark的第一步 是下载和解压缩。我们先从下载预编译版本的Spark开始。访问htp:/spark.apache.org/downloads.html。 具体情况见读书笔记第一章 2.2 Spark...
君一时一迈
编辑于 2019-04-09 22:46:53
《Spark快速大数据分析》读书笔记_第一章
初识Spark: spark是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室 开发的通用内存并行计算框架,用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的MapReduce计算 模型。高效的支撑更多计算...
君一时一迈
编辑于 2019-03-24 21:09:13
《Spark快速大数据分析》读书笔记
Scala语言初步 Scala 教程在线写一段入门代码 object HelloWorld{ def main(args: Array[String]): Unit={ println("Hello, world!"); } }...
牛客992211932号
编辑于 2019-03-15 22:08:25
首页
上一页
1
2
3
下一页
末页
热门图书
编程的修炼(中英双语)
希腊黄金时代的古代科学
物理学与生活
道藏(1-36册)
Principles of Neural Science, Fourth Edition
More Effective C++(中文版)
查看全部