牛客图书馆 > 读书笔记
  • Mysql

    为什么要使用数据库 数据保存在内存 优点: 存取速度快 缺点: 数据不能永久保存 数据保存在文件 优点: 数据永久保存 缺点:1)速度比内存操作慢,频繁的IO操作。2)查询数据不方便 数据保存在数据库 1)...
    牛客大数据入门菜鸡 编辑于 2021-01-05 16:07:33
  • Hive学习之路 (十九)Hive的数据倾斜

    1、什么是数据倾斜?由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点 回到顶部2、Hadoop 框架的特性  A、不怕数据大,怕数据倾斜   B、Jobs 数比较多的作业运行效率相对比较低,如子查询比较多   C、 sum,count,max,min...
    牛客大数据入门菜鸡 编辑于 2020-11-11 17:22:13
  • flink原理

    一、Flink 流处理简介1、Flink 是什么2、Flink全球热度3、Flink目前在国内企业的应用4、为什么要使用Flink5、哪些行业需要处理流数据6、传统数据处理架构7、流处理演变8、Flink主要特点9、Flink的其他特点10、Flink VS ...
    牛客大数据入门菜鸡 编辑于 2020-11-17 13:53:20
  • JAVA基础

    Java概述 何为编程 编程就是让计算机为解决某个问题而使用某种程序设计语言编写程序代码,并最终得到结果的过程。 为了使计算机能够理解人的意图,人类就必须要将需解决的问题的思路、方法、和手段通过计算机能够理解的形式告诉计算机,使得计算机能够根...
    牛客大数据入门菜鸡 编辑于 2020-12-25 16:07:47
  • JAVA集合

    集合容器概述 什么是集合 集合框架:用于存储数据的容器。 集合框架是为表示和操作集合而规定的一种统一的标准的体系结构。 任何集合框架都包含三大块内容:对外的接口、接口的实现和对集合运算的算法。 接口:表示集合的抽象数据类型。接口允许我们...
    牛客大数据入门菜鸡 编辑于 2020-12-25 16:34:16
  • Hive学习之路 (六)Hive SQL之数据类型和存储格式

    一、数据类型1、基本数据类型Hive 支持关系型数据中大多数基本数据类型 和其他的SQL语言一样,这些都是保留字。需要注意的是所有的这些数据类型都是对Java中接口的实现,因此这些类型的具体行为细节和Java中对应的类型是完全一致的。例如,string类...
    牛客大数据入门菜鸡 编辑于 2020-11-11 16:15:27
  • Flink 源码阅读笔记(18)- Flink SQL 中的流和动态表

    SQL 和关系代数在设计之初就针对的是静态的数据。静态数据是有界的,因此可以很容易地和表(关系)进行映射。但是对于一个不断变化的实时数据流而言,数据是无边界不断更新的,在将 SQL 应用在流上的时候,势必需要考虑数据的更新问题。例如,对与聚合操作而言,随着新数...
    牛客大数据入门菜鸡 编辑于 2020-12-21 14:31:11
  • Hive学习之路 (七)Hive的DDL操作

    1、创建库语法结构CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name   [COMMENT database_comment]      //关于数据块的描述   [LOCATION hdfs_path...
    牛客大数据入门菜鸡 编辑于 2020-11-11 16:28:05
  • Hive学习之路 (八)Hive中文乱码

    Hive注释中文乱码创建表的时候,comment说明字段包含中文,表成功创建成功之后,中文说明显示乱码 复制代码create external table movie(userID int comment '用户ID',movieID int comment ...
    牛客大数据入门菜鸡 编辑于 2020-11-11 16:29:44
  • Hive学习之路 (九)Hive的内置函数

    数学函数 集合函数 类型转换函数 日期函数 条件函数 字符函数 聚合函数 表生成函数 转发自:https://www.cnblogs.com/qingyunzong/p/8744593.html...
    牛客大数据入门菜鸡 编辑于 2020-11-11 16:39:16