hive的基本用法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

hive的基本用法
（原创版）
目录
一、Hive 简介
二、Hive 基本用法
1.查看数据库/表及其表结构
2.创建表
3.创建索引
4.查询语句
5.只输出几条
正文
Hive 是一个基于 Hadoop 的数据仓库工具，可以用来存储、查询和分析大规模的结构化数据。

它类似于传统的关系型数据库，可以通过 SQL 语句进行查询和操作，但 Hive 是构建在 Hadoop 之上的，因此可以充分利用 Hadoop 的分布式计算能力来处理大规模数据。

一、Hive 简介
Hive 是由 Facebook 开发的一个数据仓库工具，它可以用来存储、查询和分析大规模的结构化数据。

Hive 本身是一个基于 Java 的程序，可以通过 MapReduce 进行并行计算，以快速处理海量数据。

二、Hive 基本用法
1.查看数据库/表及其表结构
要查看 Hive 中的数据库和表，可以使用以下命令：
```
show databases;
show tables;
```
如果需要查看表的详细结构，可以使用以下命令：
```
desc formatted table_name;
```
2.创建表
在 Hive 中创建表可以使用以下命令：
```
create table table_name (
column1 data_type1,
column2 data_type2,
...
);
```
其中，`data_type`可以是 int、float、string 等数据类型，
`table_name`为你自定义的表名。

例如，创建一个名为`students`的表，包含`id`、`name`和`age`三个字段，其中`id`为整数类型，`name`为字符串类型，`age`为整数类型：```
create table students (
id int,
name string,
age int
);
```
3.创建索引
在 Hive 中，可以通过创建索引来提高查询效率。

创建索引的命令如下：
```
create index index_name on table_name (column_name);
```
其中，`index_name`为你自定义的索引名，`table_name`为表名，`column_name`为要创建索引的字段。

例如，为`students`表中的`name`字段创建一个名为`name_idx`的索引：
```
create index name_idx on students (name);
```
4.查询语句
在 Hive 中，可以使用 SQL 语句进行查询。

以下是一些查询示例：- 查询所有字段：
```
select * from table_name;
```
- 查询指定字段：
```
select column1, column2 from table_name;
```
- 查询符合条件的记录：
```
select * from table_name where column1 = "value1" and column2 = "value2";
```
5.只输出几条
如果要查询结果只输出前几条，可以使用`LIMIT`子句。