读书笔记_牛客图书馆

牛客图书馆 > 读书笔记

开通博客写笔记

读书笔记

全部第1章第2章第3章第4章第5章第6章第7章第8章第9章第10章第11章

《Spark快速大数据分析》——第三章（下）

3.2创建RDD Spark提供了两种创建RDD的方式：读取外部数据集。以及在驱动器中对一个集合进行并行化。创建RDD最简单的方式就是把程序中一个已有的集合传给SparkContext的parallelize（）方法。例如： #pyho...

君一时一迈编辑于 2019-04-26 18:14:50
《Spark快速大数据分析》——第三章（上）

Spark对数据的核心抽象——弹性分布式数据集（Resilient Distributed Dataset，简称RDD）。RDD其实就是分布式的元素集合。在Spark中，对数据的所有操作不外乎创建RDD，转化已有RDD以及调用已有RDD进行求值。而在这一切的背...

君一时一迈编辑于 2019-04-19 17:18:33
《Spark快速大数据分析》读书笔记_第二章

2.1下载Spark 使用Spark的第一步是下载和解压缩。我们先从下载预编译版本的Spark开始。访问htp:/spark.apache.org/downloads.html。具体情况见读书笔记第一章 2.2 Spark...

君一时一迈编辑于 2019-04-09 22:46:53
《Spark快速大数据分析》读书笔记_第一章

初识Spark： spark是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室开发的通用内存并行计算框架，用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的MapReduce计算模型。高效的支撑更多计算...

君一时一迈编辑于 2019-03-24 21:09:13
《Spark快速大数据分析》读书笔记

Scala语言初步 Scala 教程在线写一段入门代码 object HelloWorld{ def main(args: Array[String]): Unit={ println("Hello, world!"); } }...

牛客992211932号编辑于 2019-03-15 22:08:25

读书笔记

《Spark快速大数据分析》——第三章（下）

《Spark快速大数据分析》——第三章（上）

《Spark快速大数据分析》读书笔记_第二章

《Spark快速大数据分析》读书笔记_第一章

《Spark快速大数据分析》读书笔记

热门图书