360图书馆文章备份

← 返回首页

基于docker快速搭建hive环境

2021-06-30

一、概述

Hive是什么?

Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,总归为大数据,并使得查询和分析方便。

最初,Hive是由Facebook开发,后来由Apache软件基金会开发,并作为进一步将它作为名义下Apache Hive为一个开源项目。它用在好多不同的公司。例如,亚马逊使用它在 Amazon Elastic MapReduce。

Hive 不是

  • 一个关系数据库

  • 一个设计用于联机事务处理(OLTP)

  • 实时查询和行级更新的语言

Hiver特点

  • 它存储架构在一个数据库中并处理数据到HDFS。

  • 它是专为OLAP设计。

  • 它提供SQL类型语言查询叫HiveQL或HQL。

  • 它是熟知,快速,可扩展和可扩展的。

Hive架构

下面的组件图描绘了Hive的结构:

该组件图包含不同的单元。下表描述每个单元:

单元名称