牛客图书馆 > 读书笔记
  • HBase原理

    从HBase的架构图上可以看出,HBase中的组件包括Client、Zookeeper、HMaster、HRegionServer、HRegion、Store、MemStore、StoreFile、HFile、HLog等,接下来介绍他们的作用。 Client ...
    牛客大数据入门菜鸡 编辑于 2020-11-09 20:08:02
  • Flink 源码阅读笔记(10)- State 管理

    状态 State 是 Flink 中用于构建复杂逻辑的重要组件。本文将从源码角度来分析 Flink 的状态管理是如何实现的。状态 (State)需要配合检查点(Checkpoint)机制来保证 Flink 作业失败后能正确地进行错误恢复。由于Flink的 St...
    牛客大数据入门菜鸡 编辑于 2020-12-08 15:58:55
  • Hive学习之路 (一)Hive初识

    Hive 简介什么是Hive1、Hive 由 Facebook 实现并开源 2、是基于 Hadoop 的一个数据仓库工具 3、可以将结构化的数据映射为一张数据库表 4、并提供 HQL(Hive SQL)查询功能 5、底层数据是存储在 HDFS 上 6、Hive...
    牛客大数据入门菜鸡 编辑于 2020-11-11 15:44:50
  • Flink 源码阅读笔记(2)- JobGraph 的生成

    前面的文章我们介绍了 StreamGraph 的生成,这个实际上只对应 Flink 作业在逻辑上的执行计划图。Flink 会进一步对 StreamGraph 进行转换,得到另一个执行计划图,即 JobGraph。 JobVertex 在 StreamGraph...
    牛客大数据入门菜鸡 编辑于 2020-11-26 16:40:36
  • Hive学习之路 (二)Hive安装

    Hive的下载下载地址http://mirrors.hust.edu.cn/apache/ 选择合适的Hive版本进行下载,进到stable-2文件夹可以看到稳定的2.x的版本是2.3.3Hive的安装1、本人使用MySQL做为Hive的元数据库,所以先安装M...
    牛客大数据入门菜鸡 编辑于 2020-11-11 15:54:26
  • Flink 源码阅读笔记(8)- Task 之间的数据传输

    在这篇文章中,我们将探讨一个 Flink 作业在实际运行时,不同的 Task 之间是如何进行数据交换的。由于不同的 Task 可能并非运行在同一个 TaskManager 中,因而数据传输的过程中必然涉及到网络通信,文中也会对 Flink 的网络栈的实现,包括...
    牛客大数据入门菜鸡 编辑于 2020-12-04 15:52:21
  • Hive学习之路 (三)Hive元数据信息对应MySQL数据库表

    概述Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理。上一篇hive的安装也是将元数据信息存放在MySQL数据库中。 Hive的元数据信息在MySQL数据中有57张表一、存储Hive版本的元数据表(VERSION) VERS...
    牛客大数据入门菜鸡 编辑于 2020-11-11 16:00:57
  • Hive学习之路 (五)DbVisualizer配置连接hive

    一、安装DbVisualizer下载地址http://www.dbvis.com/ 也可以从网上下载破解版程序,此处使用的版本是DbVisualizer 9.1.1 具体的安装步骤可以百度,或是修改安装目录之后默认安装就可以 回到顶部二、配置DbVisuali...
    牛客大数据入门菜鸡 编辑于 2020-11-11 16:07:27