首页 > 试题广场 >

如下关于hive的描述,哪些是对的?()

[单选题]
如下关于hive的描述,哪些是对的?()
  • hive是hadoop的数据库
  • hive不支持行级更新
  • hive可以替代OLTP系统
  • hive不支持分区
选B。

1. Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作,十分适合数据仓库的统计分析。

2. Hive 并不适合那些需要低延迟的应用,例如,联机事务处理(OLTP)。Hive并不提供实时的查询和基于行级的数据更新操作。Hive 的最佳使用场合是大数据集的批处理作业,例如,网络日志分析。

3. 首先,Hive 没有专门的数据存储格式,也没有为数据建立索引,用户可以非常自由的组织 Hive 中的表,只需要在创建表的时候告诉 Hive 数据中的列分隔符和行分隔符,Hive 就可以解析数据。
其次,Hive 中所有的数据都存储在 HDFS 中,Hive 中包含以下数据模型:表(Table),外部表(External Table),分区(Partition),桶(Bucket)。
发表于 2017-06-06 15:05:53 回复(0)