hive函数大全

合集下载

hive高级函数

hive高级函数

hive高级函数Hive是一个基于Hadoop的数据仓库解决方案,它使用Hive查询语言(HQL)来处理和分析大型数据集。

Hive提供了许多内置的高级函数,用于对数据进行转换、过滤、聚合等操作。

在本文中,我们将探讨一些常用的Hive高级函数,并讨论它们的用法和应用场景。

一、字符串函数:1. CONCAT:将多个字符串连接在一起。

2. SUBSTRING:返回一个字符串的子串。

3. INSTR:返回一个字符串中第一次出现的指定子串的位置。

4. REPLACE:将一个字符串中的所有指定子串替换为新的子串。

5. TRIM:去除一个字符串两端的空格。

这些字符串函数在数据清洗和转换中非常有用,可以帮助我们从原始数据中提取需要的信息。

二、日期函数:1. TO_DATE:将一个字符串转换为日期格式。

2. YEAR/MONTH/DAY:从一个日期字段中提取年份、月份或日期。

3. DATE_ADD:将指定的时间间隔添加到一个日期字段。

4. DATE_DIFF:计算两个日期之间的天数差。

这些日期函数可以帮助我们对时间序列数据进行分析和计算,如计算每月销售额或计算两个日期之间的间隔。

三、数值函数:1. ROUND:对一个数值字段进行四舍五入。

2. ABS:返回一个数值字段的绝对值。

3. CEIL/FLOOR:对一个数值字段进行向上取整或向下取整。

4. POWER/SQRT:计算一个数值字段的幂或平方根。

这些数值函数在数据分析和统计计算中非常有用,可以帮助我们对数据进行处理和转换。

四、集合函数:1. COUNT:统计一个字段中非空值的数量。

2. SUM:计算一个字段中数值的总和。

3. AVG:计算一个字段中数值的平均值。

4. MAX/MIN:找到一个字段中数值的最大值或最小值。

这些集合函数常用于数据汇总和聚合分析,可以帮助我们计算数据的统计指标和概要信息。

除了上述提到的高级函数,Hive还提供了许多其他的内置函数,如条件函数(CASE WHEN)、窗口函数(OVER)、分组函数(GROUP BY)等。

hive函数大全

hive函数大全

目录一、关系运算: (4)1. 等值比较: = (4)2. 不等值比较: <> (4)3. 小于比较: < (4)4. 小于等于比较: <= (4)5. 大于比较: > (5)6. 大于等于比较: >= (5)7. 空值判断: IS NULL (5)8. 非空判断: IS NOT NULL (6)9. LIKE比较: LIKE (6)10. JAVA的LIKE操作: RLIKE (6)11. REGEXP操作: REGEXP (7)二、数学运算: (7)1. 加法操作: + (7)2. 减法操作: - (7)3. 乘法操作: * (8)4. 除法操作: / (8)5. 取余操作: % (8)6. 位与操作: & (9)7. 位或操作: | (9)8. 位异或操作: ^ (9)9.位取反操作: ~ (10)三、逻辑运算: (10)1. 逻辑与操作: AND (10)2. 逻辑或操作: OR (10)3. 逻辑非操作: NOT (10)四、数值计算 (11)1. 取整函数: round (11)2. 指定精度取整函数: round (11)3. 向下取整函数: floor (11)4. 向上取整函数: ceil (12)5. 向上取整函数: ceiling (12)6. 取随机数函数: rand (12)7. 自然指数函数: exp (13)8. 以10为底对数函数: log10 (13)9. 以2为底对数函数: log2 (13)10. 对数函数: log (13)11. 幂运算函数: pow (14)12. 幂运算函数: power (14)13. 开平方函数: sqrt (14)14. 二进制函数: bin (14)15. 十六进制函数: hex (15)16. 反转十六进制函数: unhex (15)17. 进制转换函数: conv (15)18. 绝对值函数: abs (16)19. 正取余函数: pmod (16)20. 正弦函数: sin (16)21. 反正弦函数: asin (16)22. 余弦函数: cos (17)23. 反余弦函数: acos (17)24. positive函数: positive (17)25. negative函数: negative (17)五、日期函数 (18)1. UNIX时间戳转日期函数: from_unixtime (18)2. 获取当前UNIX时间戳函数: unix_timestamp (18)3. 日期转UNIX时间戳函数: unix_timestamp (18)4. 指定格式日期转UNIX时间戳函数: unix_timestamp (18)5. 日期时间转日期函数: to_date (19)6. 日期转年函数: year (19)7. 日期转月函数: month (19)8. 日期转天函数: day (19)9. 日期转小时函数: hour (20)10. 日期转分钟函数: minute (20)11. 日期转秒函数: second (20)12. 日期转周函数: weekofyear (20)13. 日期比较函数: datediff (21)14. 日期增加函数: date_add (21)15. 日期减少函数: date_sub (21)六、条件函数 (21)1. If函数: if (21)2. 非空查找函数: COALESCE (22)3. 条件判断函数:CASE (22)4. 条件判断函数:CASE (22)七、字符串函数 (23)1. 字符串长度函数:length (23)2. 字符串反转函数:reverse (23)3. 字符串连接函数:concat (23)4. 带分隔符字符串连接函数:concat_ws (23)5. 字符串截取函数:substr,substring (24)6. 字符串截取函数:substr,substring (24)7. 字符串转大写函数:upper,ucase (24)8. 字符串转小写函数:lower,lcase (25)9. 去空格函数:trim (25)10. 左边去空格函数:ltrim (25)11. 右边去空格函数:rtrim (25)12. 正则表达式替换函数:regexp_replace (26)13. 正则表达式解析函数:regexp_extract (26)14. URL解析函数:parse_url (26)15. json解析函数:get_json_object (27)16. 空格字符串函数:space (27)17. 重复字符串函数:repeat (27)18. 首字符ascii函数:ascii (28)19. 左补足函数:lpad (28)20. 右补足函数:rpad (28)21. 分割字符串函数: split (28)22. 集合查找函数: find_in_set (29)八、集合统计函数 (29)1. 个数统计函数: count (29)2. 总和统计函数: sum (29)3. 平均值统计函数: avg (30)4. 最小值统计函数: min (30)5. 最大值统计函数: max (30)6. 非空集合总体变量函数: var_pop (30)7. 非空集合样本变量函数: var_samp (31)8. 总体标准偏离函数: stddev_pop (31)9. 样本标准偏离函数: stddev_samp (31)10.中位数函数: percentile (31)11. 中位数函数: percentile (31)12. 近似中位数函数: percentile_approx (32)13. 近似中位数函数: percentile_approx (32)14. 直方图: histogram_numeric (32)九、复合类型构建操作 (32)1. Map类型构建: map (32)2. Struct类型构建: struct (33)3. array类型构建: array (33)十、复杂类型访问操作 (33)1. array类型访问: A[n] (33)2. map类型访问: M[key] (34)3. struct类型访问: S.x (34)十一、复杂类型长度统计函数 (34)1. Map类型长度函数: size(Map<K.V>) (34)2. array类型长度函数: size(Array<T>) (34)3. 类型转换函数 (35)一、关系运算:1. 等值比较: =语法:A=B操作类型:所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1=1;12. 不等值比较: <>语法: A <> B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A与表达式B不相等,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 <> 2;13. 小于比较: <语法: A < B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 < 2;14. 小于等于比较: <=语法: A <= B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于或者等于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 <= 1;15. 大于比较: >语法: A > B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A大于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 2 > 1;16. 大于等于比较: >=语法: A >= B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A大于或者等于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 >= 1;1注意:String的比较要注意(常用的时间比较可以先to_date之后再比较)hive> select * from lxw_dual;OK2011111209 00:00:00 2011111209hive> select a,b,a<b,a>b,a=b from lxw_dual;2011111209 00:00:00 2011111209 false true false7. 空值判断: IS NULL语法: A IS NULL操作类型: 所有类型描述: 如果表达式A的值为NULL,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where null is null;18. 非空判断: IS NOT NULL语法: A IS NOT NULL操作类型: 所有类型描述: 如果表达式A的值为NULL,则为FALSE;否则为TRUE举例:hive> select 1 from lxw_dual where 1 is not null;19. LIKE比较: LIKE语法: A LIKE B操作类型: strings描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合表达式B 的正则语法,则为TRUE;否则为FALSE。

hive中的常用函数

hive中的常用函数

Hive是一种基于Hadoop的数据仓库工具,用于处理大规模数据集。

以下是Hive中常用的一些函数:
聚合函数:
COUNT:计算行数或非NULL值的数量。

SUM:计算数值列的总和。

AVG:计算数值列的平均值。

MIN:找出数值列的最小值。

MAX:找出数值列的最大值。

字符串函数:
CONCAT:连接两个或多个字符串。

LENGTH:返回字符串的长度。

SUBSTR:截取字符串的子串。

TRIM:去除字符串首尾的空格。

LOWER/UPPER:将字符串转换为小写/大写。

时间日期函数:
YEAR/MONTH/DAY:提取日期字段中的年份/月份/日份。

HOUR/MINUTE/SECOND:提取时间字段中的小时/分钟/秒数。

TO_DATE:将字符串转换为日期格式。

条件函数:
IF/ELSE:根据条件返回不同的值。

CASE WHEN/THEN/ELSE/END:根据多个条件返回不同的值。

数学函数:
ABS:返回数值的绝对值。

ROUND:对数值进行四舍五入。

RAND:生成一个随机数。

EXP:返回指定数值的指数值。

LOG:计算数值的自然对数。

这只是Hive中一些常用的函数示例,实际上Hive提供了更多的函数用于处理数据。

你可以根据具体的需求在Hive官方文档中查找更多详细的函数说明和用法。

hive常用的的函数

hive常用的的函数

hive常用的的函数Hive提供了一种简单的SQL查询语言称为HiveQL,它允许数据工程师、数据分析师和应用程序开发人员查询和管理大规模数据。

以下是Hive中常用的一些函数:1. 字符串函数:`length(string)`: 返回字符串的长度。

`concat(string1, string2, ...)`: 连接两个或多个字符串。

`substr(string, start, length)`: 返回字符串的子串。

`trim(string)`: 去除字符串两端的空格。

`ltrim(string)`: 去除字符串左端的空格。

`rtrim(string)`: 去除字符串右端的空格。

2. 数值函数:`abs(bigint)`: 返回整数的绝对值。

`ceil(double)`: 返回大于或等于给定数字的最小整数。

`floor(double)`: 返回小于或等于给定数字的最大整数。

`round(double, ndigits)`: 返回四舍五入的值,其中ndigits是精度。

`mod(int, int)`: 返回第一个参数除以第二个参数的余数。

3. 日期函数:`current_date()`: 返回当前日期。

`from_unixtime(unix_timestamp[, format])`: 将UNIX时间戳转换为指定格式的日期时间。

`unix_timestamp()`: 将当前日期和时间转换为UNIX时间戳(以秒为单位)。

`date_format(date, format)` or `date_format(timestamp, format)`: 将日期/时间值格式化为指定的字符串格式。

4. 聚合函数:`count(), count(column)`: 计算行数或非NULL值的数量。

`sum(column)`: 计算列的总和。

`avg(column)`: 计算列的平均值。

`min(column)`: 返回列中的最小值。

hive 常用的函数

hive 常用的函数

Apache Hive 是一个基于Hadoop 的数据仓库工具,它提供了类似SQL 的查询语言HiveQL 来处理大规模的数据集。

以下是一些Hive 中常用的函数类别及示例:1. 数学与舍入函数•ABS(x): 返回x 的绝对值。

•FLOOR(x): 对浮点数x 进行向下取整。

•CEIL(x): 对浮点数x 进行向上取整。

•ROUND(x[, d]): 对数字x 进行四舍五入,d(可选)表示要保留的小数位数。

2. 字符串函数•LENGTH(str): 返回字符串str 的长度。

•LOWER(str)或lcase(str): 将字符串转换为小写。

•UPPER(str)或ucase(str): 将字符串转换为大写。

•CONCAT(string1, string2,...): 连接多个字符串。

•TRIM([BOTH|LEADING|TRAILING] 'chars' FROM str): 删除字符串两侧或指定一侧的字符。

3. 日期和时间函数•FROM_UNIXTIME(epoch, format): 将Unix 时间戳转换为日期格式。

•UNIX_TIMESTAMP(): 获取当前Unix 时间戳。

•DATE_FORMAT(date_expression, format_string): 格式化日期表达式。

•YEAR(date), MONTH(date), DAY(date): 提取日期中的年、月、日部分。

4. 聚合函数•COUNT(*): 统计行数。

•SUM(column): 计算某一列的总和。

•AVG(column): 计算平均值。

•MAX(column): 找出一列的最大值。

•MIN(column): 找出一列的最小值。

•GROUP_CONCAT(column): 合并一组值为单个字符串(在某些版本的Hive 中可用)。

5. 集合函数•COLLECT_SET(column): 返回一组唯一的值组成的集合,无序且会去除重复值。

hive空间函数

hive空间函数

Hive是基于Hadoop的数据仓库工具,支持SQL语句和类SQL语句,提供了一些空间函数,用于处理空间数据。

以下是常用的Hive空间函数:
1. ST_Area:计算几何图形的面积。

2. ST_Boundary:返回几何图形的边界。

3. ST_Centroid:计算几何图形的重心。

4. ST_ConvexHull:计算几何图形的凸壳。

5. ST_Contains:判断一个几何图形是否包含另一个几何图形。

6. ST_Crosses:判断两个几何图形是否交叉。

7. ST_Disjoint:判断两个几何图形是否不相交。

8. ST_Envelope:返回几何图形的最小外接矩形。

9. ST_Equals:判断两个几何图形是否相等。

10. ST_Intersects:判断两个几何图形是否交叉。

11. ST_PointOnSurface:返回几何图形表面上的一个点。

12. ST_SymDifference:返回两个几何图形的对称差集。

13. ST_Union:返回多个几何图形的并集。

14. ST_Within:判断一个几何图形是否在另一个几何图形内部。

15. ST_X:返回几何图形的x坐标。

16. ST_Y:返回几何图形的y坐标。

这些空间函数在处理空间数据时非常有用,例如可以用于计算地理区域的面积、周长、重心等信息,判断两个地理位置之间的距离、相交关系等。

hive函数大全

hive函数大全

hive函数大全1.内置运算符1.1关系运算符运算符类型说明A =B 原始类型如果A与B相等,返回TRUE,否则返回FALSEA ==B 无失败,因为无效的语法。

SQL使用”=”,不使用”==”。

A <>B 原始类型如果A不等于B返回TRUE,否则返回FALSE。

如果A或B值为”NULL”,结果返回”NULL”。

A <B 原始类型如果A小于B返回TRUE,否则返回FALSE。

如果A或B值为”NULL”,结果返回”NULL”。

A <=B 原始类型如果A小于等于B返回TRUE,否则返回FALSE。

如果A或B值为”NULL”,结果返回”NULL”。

A >B 原始类型如果A大于B返回TRUE,否则返回FALSE。

如果A或B值为”NULL”,结果返回”NULL”。

A >=B 原始类型如果A大于等于B返回TRUE,否则返回FALSE。

如果A或B值为”NULL”,结果返回”NULL”。

A IS NULL 所有类型如果A值为”NULL”,返回TRUE,否则返回FALSEA IS NOT NULL 所有类型如果A值不为”NULL”,返回TRUE,否则返回FALSEA LIKEB 字符串如果A或B值为”NULL”,结果返回”NULL”。

字符串A与B通过sql 进行匹配,如果相符返回TRUE,不符返回FALSE。

B字符串中的”_”代表任一字符,”%”则代表多个任意字符。

例如:(…foobar‟ like …foo‟)返回FALSE,(…foobar‟ like …foo_ _ _‟或者…foobar‟ like …foo%‟)则返回TUREA RLIKEB 字符串如果A或B值为”NULL”,结果返回”NULL”。

字符串A与B通过java 进行匹配,如果相符返回TRUE,不符返回FALSE。

例如:(…foobar‟rlike …foo‟)返回FALSE,(‟foobar‟rlike …^f.*r$‟)返回TRUE。

Hive常用函数大全-数值计算

Hive常用函数大全-数值计算

Hive常⽤函数⼤全-数值计算 11、取整函数:round(X)(遵循四舍五⼊)2select round(3.1415926) from table--33select round(3.5) from table--4452、指定精度取整函数: round(X,Y)(遵循四舍五⼊)6select round(3.14159,3) from table--3.1427select round(3.14123,3) from table--3.141893、向下取整函数: floor(X)10select floor(3.6) from table--311select floor(3.3) from table--312134、向上取整函数: ceiling(X)14select ceiling(3.6) from table--415select ceiling(3.3) from table--416175、取随机数函数: rand(X)(返回⼀个0到1范围内的随机数)18select rand() from table--0.22212132324219206、取随机数函数: rand(X)(重复执⾏结果相同:返回⼀个稳定的随机数序列)21select rand(100) from table--0.684145478237322237、⾃然指数函数: exp(X)(返回e的X次⽅)24select exp(2) from table--e*e25268、以10为底对数函数: log10(X)(返回以10为底的X的对数)27select log10(100) from table--228299、以2为底对数函数: log2(X)(返回以2为底的X的对数)30select log2(8) from table--3313210、对数函数: log(X,Y)(返回以X为底的y的对数:2的3次⽅=8)33select log(2,8) from table--3343511、幂运算函数: pow(X,Y)/power(X,Y)(返回X的Y次幂)36select pow(2,4) from table--16373812、开平⽅函数: sqrt(X)(返回X的平⽅根)39select sqrt(16) from table--4404113、⼆进制函数: bin(X)(返回X的⼆进制表⽰)42select bin(7) from table--111434414、⼗六进制函数: hex(X)(返回X的⼗六进制表⽰)45select hex('ab') from table--6162464715、反转⼗六进制函数: unhex(X)48select hex('6162') from table--ab495016、进制转换函数: conv(X,Y,Z)(将数值X从Y进制转化到Z进制)51select conv(17,10,2) from table--10001525317、绝对值函数: abs(X)(返回X的绝对值)54select abs(-111.9) from table--111.955select abs(111.9) from table--111.9565718、正取余函数: pmod(X,Y)(返回X除以Y的余数)58select pmod(9,4) from table--159select pmod(-9,4) from table--3606119、正弦函数: sin(X)(返回X的正弦值)62select sin(0.8) from table--0.7173560908995228636420、反正弦函数: asin(X)(返回X的反正弦值)65select asin(0.7173560908995228) from table--0.8666721、余弦函数: cos(X)(返回X的余弦值)68select cos(0.9) from table--0.6216099682706644697022、反余弦函数: acos(X)(返回X的反余弦值)71select cos(0.6216099682706644) from table--0.9。

hive中的常用函数

hive中的常用函数

hive中的常用函数Hive是一个基于Hadoop的数据仓库工具,提供了类SQL的语言HiveQL来查询和管理Hadoop中的数据。

HiveQL支持多种常用函数,本文将详细介绍这些常用函数的用法和示例。

1. COUNT函数COUNT函数用于计算某个列或表中的行数。

语法如下:```SELECT COUNT(column_name) FROM table_name;```其中,column_name是要计算行数的列名,table_name是要计算行数的表名。

如果不指定column_name,则会计算整个表的行数。

示例:```SELECT COUNT(*) FROM orders;```这将计算orders表的总行数。

2. SUM函数SUM函数用于计算某个列的总和。

语法如下:```SELECT SUM(column_name) FROM table_name;```其中,column_name是要计算总和的列名,table_name是要计算总和的表名。

示例:```SELECT SUM(amount) FROM orders;```这将计算orders表中amount列的总和。

3. AVG函数AVG函数用于计算某个列的平均值。

语法如下:```SELECT AVG(column_name) FROM table_name;```其中,column_name是要计算平均值的列名,table_name是要计算平均值的表名。

示例:```SELECT AVG(amount) FROM orders;```这将计算orders表中amount列的平均值。

4. MAX函数MAX函数用于计算某个列的最大值。

语法如下:```SELECT MAX(column_name) FROM table_name;```其中,column_name是要计算最大值的列名,table_name是要计算最大值的表名。

示例:```SELECT MAX(amount) FROM orders;```这将计算orders表中amount列的最大值。

hive常用函数

hive常用函数

hive常用函数Hive一款建立在Hadoop之上的数据仓库分析软件,它为用户提供了一系列的函数,以满足用户的不同需求。

在这里,我们将重点介绍 Hive 中一些常用的函数,希望能够更好的帮助用户使用和熟悉Hive。

### 1.学函数数学函数是 Hive 中的一类经常被使用的函数,它们分为算术运算类函数、随机数类函数、对数类函数、三角函数类函数、取整函数类函数、科学计数法函数等,下面,我们将分别介绍这几类函数的语法以及用法。

####1)算术运算类函数算术运算类函数主要有如下:1. `ABS(x)`:返回x的绝对值2. `EXP(x)`:返回e的x次方3. `MOD(x, y)`:返回x除以y的余数4. `POWER(x,y)`:返回x的y次方5. `ROUND(x,d)`:返回x保留d位小数后的结果6. `LOG(x)`:返回x的自然对数####2)随机数类函数随机数类函数主要有`RAND()`,它用于生成一个0~1之间的随机数。

####3)对数类函数对数类函数主要有`LOG(x, base)` `LOG10(x)`,它们用于返回X的对数,其中base可以自定义,为空时,使用2作为默认值;而`LOG10(x)`则返回以10为底的x的对数。

####4)三角函数类函数三角函数类函数主要有`SIN(x)`,`COS(x)`,`TAN(x)`,它们分别用于返回x的正弦值、余弦值和正切值。

####5)取整函数类函数取整函数类函数主要有`CEIL(x)` `FLOOR(x)`,它们用于返回比x大的最小整数和比x小的最大整数。

####6)科学计数法函数科学计数法函数主要有`ROUND(x,s)`,其中x为一个数字,s代表保留小数点位数,用于表示数字的指数部分,即参数s代表相对于基数10的指数。

### 2.符串函数字符串函数是 Hive 中常用的一类函数,它们分为字符串处理类函数、字符和数值转换类函数、字符集转换类函数、正则表达式类函数等,下面,我们将分别介绍这几类函数的语法以及用法。

hive常用函数

hive常用函数

hive常用函数Hive是一个分布式数据仓库系统,允许用户使用SQL语句在Hadoop上从关系型数据库中查询数据。

它支持特定的SQL语句,例如SELECT、JOIN、GROUP BY和ORDER BY。

此外,它还提供了 hive 数机制,便于用户自定义函数。

Hive函数用于支持应用程序执行一些特定操作,比如聚合、排序、筛选等。

下面将介绍hive常用函数,一起来看一下吧。

一、COUNT函数count函数用于统计查询结果集中行数,它有两种使用形式:count(*)用于统计表中的所有行数,count(x)用于统计某列的的不为null的行数(x为列名).二、SUM函数SUM函数是求和函数,用于计算某列中所有数值的总和,它只接受一个参数:要求和的列名。

三、AVG函数AVG函数是求平均数函数,它用于计算某列中所有数值的平均值,它只接受一个参数:要求取平均数的列名。

四、MIN函数MIN函数是求最小数函数,它用于计算某列中所有数值的最小值,它只接受一个参数:要求求最小数的列名。

五、MAX函数MAX函数是求最大数函数,它用于计算某列中所有数值的最大值,它只接受一个参数:要求求最大数的列名。

六、CONCAT函数CONCAT函数是连接函数,用于连接两个字段,它接受多个参数,以逗号分隔,参数可以是列名,也可以是字符串值。

七、LOWER函数LOWER函数是转换小写函数,用于将字符串转换成小写,它只接受一个参数:要转换的字段或者字符串值。

八、UPPER函数UPPER函数是转换大写函数,用于将字符串转换成大写,它只接受一个参数:要转换的字段或者字符串值。

九、SUBSTR函数SUBSTR函数是字符串截取函数,用于从原始字符串中截取指定字符,它接受三个参数:原始字符串,起始位置和长度。

十、PARTITION函数PARTITION函数是数据分割函数,用于将一个表格划分为不同的部分,以便更好地管理表格内容,它只接受一个参数:分割字段。

hive常用的的函数 -回复

hive常用的的函数 -回复

hive常用的的函数-回复Hive是一个构建在Hadoop之上的数据仓库工具,它提供了类似于SQL 的查询语言来操作存储在分布式存储中的大规模数据。

Hive最大的优势之一是其拥有丰富的内置函数,它们可以用于数据转换、聚合、过滤等各种操作。

本文将逐步解释Hive中常用的函数并提供示例,帮助读者更好地理解和应用这些函数。

一、转换函数(Transformation Functions)1. 小写函数(LOWER)将字符串转换为小写形式。

示例:SELECT LOWER('Hello World');结果:hello world2. 大写函数(UPPER)将字符串转换为大写形式。

示例:SELECT UPPER('Hello World');结果:HELLO WORLD3. 子字符串函数(SUBSTRING)获取指定字符串的一个子字符串。

示例:SELECT SUBSTRING('Hello World', 1, 5);结果:Hello4. 替换函数(REPLACE)在字符串中替换指定内容。

示例:SELECT REPLACE('Hello World', 'World', 'Hive');结果:Hello Hive5. 连接函数(CONCAT)连接两个或多个字符串。

示例:SELECT CONCAT('Hello', ' ', 'World');结果:Hello World二、数学函数(Mathematical Functions)1. 绝对值函数(ABS)返回给定数字的绝对值。

示例:SELECT ABS(-5);结果:52. 向上取整函数(CEIL)返回不小于给定数字的最小整数。

示例:SELECT CEIL(3.14159);结果:43. 向下取整函数(FLOOR)返回不大于给定数字的最大整数。

Hive常用函数大全-字符串函数

Hive常用函数大全-字符串函数

Hive常⽤函数⼤全-字符串函数1、字符串长度函数:length(X)(返回字符串X的长度)select length('qwerty') from table--62、字符串反转函数:reverse(X)(返回字符串X反转的结果)select reverse('qwerty') from table--ytrewq3、字符串连接函数:concat(X,Y,...)(返回输⼊字符串连接后的结果,⽀持任意个输⼊字符串连接)select concat('abc','qwe','rty') from table--abcqwerty4、带分隔符字符串连接函数:concat_ws(X,y,Z)(返回输⼊字符串连接后的结果,X表⽰各个字符串间的分隔符)select concat_ws('/','abc','qwe','rty') from table--abc/qwe/rty5、字符串截取函数:substr(X,Y,Z)/substring(X,Y,Z)(返回字符串X从Y位置开始,截取长度为Z的字符串)select substr('qwerty',1,3) from table--qwe6、字符串转⼤写函数:upper(X)/ucase(X)(返回字符串X的⼤写格式)select upper('qwERt') from table--QWERTselect ucase('qwERt') from table--QWERT7、字符串转⼩写函数:lower(X)/lcase(X)(返回字符串X的⼩写格式)select lower('qwERt') from table--qwertselect lcase('qwERt') from table--qwert8、去空格函数:trim(X)(去除X字符串两边的空格)select trim(' qwe rty uiop ') from table--'qwe rty uiop'左边去空格函数:ltrim(X)(去除X字符串左边的空格)select ltrim(' qwe rty uiop ') from table--'qwe rty uiop '右边去空格函数:rtrim(X)(去除X字符串右边的空格)select rtrim(' qwe rty uiop ') from table--' qwe rty uiop'9、正则表达式替换函数:regexp_replace(X,Y,Z)(将字符串X中的符合java正则表达式Y的部分替换为Z:将X中与Y相同的字符串⽤Z替换)select regexp_replace('foobar', 'o|ar', '234') from table--f234234b23410、正则表达式解析函数:regexp_extract(X,Y,Z)(将字符串X按照Y正则表达式的规则拆分,返回Z指定的字符)select regexp_extract('foothebar', 'foo(.*?)bar', 0) from table--foothebarselect regexp_extract('foothebar', 'foo(.*?)bar', 1) from table--theselect regexp_extract('foothebar', 'foo(.*?)bar', 2) from table--bar11、URL解析函数:parse_url(X,Y,Z)(返回URL中指定的部分。

Hive常用函数大全(窗口函数、分析函数)

Hive常用函数大全(窗口函数、分析函数)

Hive常⽤函数⼤全(窗⼝函数、分析函数)1、相关函数1.1 窗⼝函数FIRST_VALUE:取分组内排序后,截⽌到当前⾏,第⼀个值LAST_VALUE:取分组内排序后,截⽌到当前⾏,最后⼀个值LEAD(col,n,DEFAULT) :⽤于统计窗⼝内往后第n⾏值。

第⼀个参数为列名,第⼆个参数为往下第n⾏(可选,默认为1),第三个参数为默认值(当往下第n⾏为NULL时候,取默认值,如不指定,则为NULL)LAG(col,n,DEFAULT) :⽤于统计窗⼝内往前第n⾏值。

第⼀个参数为列名,第⼆个参数为往上第n⾏(可选,默认为1),第三个参数为默认值(当往上第n⾏为NULL时候,取默认值,如不指定,则为NULL)1.2 OVER从句1、使⽤标准的聚合函数COUNT、SUM、MIN、MAX、AVG2、使⽤PARTITION BY语句,使⽤⼀个或者多个原始数据类型的列3、使⽤PARTITION BY与ORDER BY语句,使⽤⼀个或者多个数据类型的分区或者排序列4、使⽤窗⼝规范,窗⼝规范⽀持以下格式:(ROWS | RANGE) BETWEEN (UNBOUNDED | [num]) PRECEDING AND ([num] PRECEDING | CURRENT ROW | (UNBOUNDED | [num]) FOLLOWING) (ROWS | RANGE) BETWEEN CURRENT ROW AND (CURRENT ROW | (UNBOUNDED | [num]) FOLLOWING)(ROWS | RANGE) BETWEEN [num] FOLLOWING AND (UNBOUNDED | [num]) FOLLOWING5、当ORDER BY后⾯缺少窗⼝从句条件,窗⼝规范默认是RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW.6、当ORDER BY和窗⼝从句都缺失, 窗⼝规范默认是ROW BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING.7、OVER从句⽀持以下函数,但是并不⽀持和窗⼝⼀起使⽤它们。

hive函数大全

hive函数大全

hive函数⼤全在hive内部有许多函数,如下:1. 内置运算符1. 关系运算符2. 算术运算符3. 逻辑运算符4. 复杂类型函数2. 内置函数内置聚合函数1. 数学函数2. 收集函数3. 类型转换函数4. ⽇期函数5. 条件函数6. 字符函数3. 内置聚合函数4. 内置表⽣成函数1.1关系运算符1. 等值⽐较: =2. 等值⽐较:<=>3. 不等值⽐较: <>和!=4. ⼩于⽐较: <5. ⼩于等于⽐较: <=6. ⼤于⽐较: >7. ⼤于等于⽐较: >=8. 空值判断: IS NULL9. ⾮空判断: IS NOT NULL10. LIKE ⽐较: LIKE11. JAVA 的 LIKE 操作: RLIKE12. REGEXP 操作: REGEXP1.2算术运算符1. 加法操作: +2. 减法操作: –3. 乘法操作: *4. 除法操作: /5. 取余操作: %6. 位与操作: &7. 位或操作: |8. 位异或操作: ^9.位取反操作: ~1.3逻辑运算符1. 逻辑与: AND 、&&2. 逻辑或: OR 、|3. 逻辑⾮: NOT、!1.4复杂类型函数1. 获取array中的元素2. 获取map中的元素3. 获取struct中的元素2.1数学函数1. 取整函数: round(double a) 四舍五⼊2. 指定精度取整函数: round(double a,int d) ⼩数部分d位之后数字四舍五⼊3. 向下取整函数: floor(double a) 对给定数据进⾏向下舍⼊最接近的整数4. 向上取整函数: ceil(double a) 将参数向上舍⼊为最接近的整数5. 向上取整函数: ceiling(double a)6. 取随机数函数: rand7. ⾃然指数函数: exp(double a) 返回e的n次⽅8. 以 10 为底对数函数: log109. 以 2 为底对数函数: log210. 对数函数: log(double base,double a) 返回给定底数及指数返回⾃然对数11. 幂运算函数: pow(double a,double p) 返回某数的乘幂12. 幂运算函数: power(double a,double p)13. 开平⽅函数: sqrt 返回数值的平⽅根14. ⼆进制函数: bin15. ⼗六进制函数: hex16. 反转⼗六进制函数: unhex17. 进制转换函数: conv18. 绝对值函数: abs19. 正取余函数: pmod(int a,int b)20. 正弦函数: sin21. 反正弦函数: asin22. 余弦函数: cos23. 反余弦函数: acos24. positive 函数: positive(int a) 返回a的值25. negative 函数: negative(int a) 返回a的相反数2.2收集函数array/map类型⼤⼩: size 返回array/map类型的元素数量2.3类型转换函数基础类型之间强制转换:cast(field/expr as <type>)2.4⽇期函数1. UNIX 时间戳转⽇期函数: from_unixtime2. 获取当前 UNIX 时间戳函数: unix_timestamp3. ⽇期转 UNIX 时间戳函数: unix_timestamp4. 指定格式⽇期转 UNIX 时间戳函数: unix_timestamp5. ⽇期时间转⽇期函数: to_date6. ⽇期转年函数: year7. ⽇期转⽉函数: month8. ⽇期转天函数: day9. ⽇期转⼩时函数: hour10. ⽇期转分钟函数: minute11. ⽇期转秒函数: second12. ⽇期转周函数: weekofyear13. ⽇期⽐较函数: datediff14. ⽇期增加函数: date_add15. ⽇期减少函数: date_sub16. ⽇期查看函数: date_format17 ⽇期函数:last_day 返回当前⽉最后⼀天⽇期2.5条件函数1. if 函数: if(boolean condition,true_value,false_value)2. ⾮空查找函数: coalesce(v1,v2,v3...) 返回⼀组数据中第⼀个不为null的值3. 条件判断函数:case when a then b else c end 当值为a时返回b,否则返回c2.6字符函数1. 字符 ascii 码函数:ascii2. base64 字符串3. 字符串连接函数:concat(String a,String b) 连接多个字符串,合并为⼀个字符串4. 带分隔符字符串连接函数:concat_ws(joinstr,String a,String b) 连接多个字符串,字符串之间以指定的分隔符分开5. ⼩数位格式化成字符串函数:format_number6. 字符串截取函数:substr(String a,int start),substring(String a,int start)从⽂本字符串指定的起始位置后的字符7. 字符串查找函数:instr8. 字符串长度函数:length9. 字符串查找函数:locate10. 字符串格式化函数:printf11. 字符串转换成 map 函数:str_to_map12. base64 解码函数:unbase64(string str)13. 字符串转⼤写函数:upper,ucase14. 字符串转⼩写函数:lower,lcase15. 去空格函数:trim16. 左边去空格函数:ltrim17. 右边去空格函数:rtrim18. 正则表达式替换函数:regexp_replace(string a,string b,string c) 字符串a中的b字符被c字符替代19. 正则表达式解析函数:regexp_extract20. URL 解析函数:parse_url21. json 解析函数:get_json_object(string json_string,string path) 拆分取值22. 空格字符串函数:space 返回指定数量的空格23. 重复字符串函数:repeat(string a,int b) 重复b次a字符串24. 左补⾜函数:lpad25. 右补⾜函数:rpad26. 分割字符串函数: split27. 集合查找函数: find_in_set28. 分词函数:sentences(string a) 将字符串中内容按语句分组,每个单词间以逗号分隔,最后返回数组29. 分词后统计⼀起出现频次最⾼的 TOP-K30. 分词后统计与指定单词⼀起出现频次最⾼的 TOP-K31. 倒序字符串:reverse32. ngrams33. context_ngrams34. first_value/last_value 返回当前列第⼀个(最后⼀个)值35. lag/lead 返回当前值的前后值3.内置聚合函数1. 个数统计函数: count2. 总和统计函数: sum3. 平均值统计函数: avg4. 最⼩值统计函数: min5. 最⼤值统计函数: max6. 返回指定列的⽅差: var_pop7. 返回指定列的样本⽅差: var_samp8. 返回指定列的偏差: stddev_pop9. 返回指定列的样本偏差: stddev_samp10. 两列数值协⽅差:covar_pop11. 两列数值样本协⽅差:covar_samp12. 返回两列数值的相关系数:corr(col1,col2)13.中位数函数: percentile14. 近似中位数函数: percentile_approx15. 直⽅图: histogram_numeric16. 集合去重数:collect_set17. 集合不去重函数:collect_list4.内置表⽣成函数1. array/map拆分多⾏:explode测试:1.1关系运算符关系运算符:= <=> > >= < <=-- select5<=>5true-- select6>=5true-- select8<=7falselike/rlike⽐较-- select'football' like 'foot%'true-- select'2697566722@' rlike '\\@[0-9a-z]{2,}\.(com|cn|org|edu)' trueregexp-- select'football' regexp '\\w{9,}[a-z]'false1.2算术运算符-- select5+510-- select5-50-- select5*525-- select5/51-- select5%41-- select5&91-- select5|913-- select5^9121.4复杂类型函数-- select array(1,4,5,6,8) [1,4,5,6,8]-- select map('name','张三','age',18) {"name":"张三","age":"18"}-- select struct(array(1,3,5),map('name','张三','age',18)) {"col1":[1,3,5],"col2":{"name":"张三","age":"18"}} 2.1数学函数-- select round(5.3423) 5-- select round(5.345,2) 5.35-- select floor(5.9) 5-- select ceil(5.1) 6-- select rand() 0.7311469360199058-- select exp(2) 7.38905609893065-- select log(5,25) 2-- select pow(2,3) 8-- select sqrt(25) 5-- select bin(8) 1000-- select hex(16) 10-- select unhex(100)-- select abs(-10) 10-- select pmod(5,2) 1-- select sin(3.1415926/2) 0.9999999999999997-- select asin(0.9999999999999997) 1.5707963009853283-- select positive(10) 10-- select negative(10) -102.2收集函数-- select size(array(1,3,4,5,6,7,8)) 72.4⽇期函数-- select from_unixtime(0,'yyyy-MM-dd HH:mm:ss') 1969-12-3119:00:00-- select unix_timestamp() 1598707426-- select to_date('2020-1-1') 2020-01-01-- select year(current_date()) 2020-- select month(current_date()) 8-- select day(current_date()) 29-- select hour(current_timestamp()) 9-- select minute(current_timestamp()) 26-- select second(current_timestamp()) 15-- select weekofyear(current_date()) 35-- select datediff(current_date(),'2020-08-01') 28-- select date_add(current_date(),1) 2020-08-30-- select date_sub(current_date(),1) 2020-08-28-- select date_format(current_date(),'y') 2020-- select last_day('2020-01-02') 2020-01-31-- select if(1=3,3,2) 2-- select coalesce(null,3,null,4) 3-- select case when 5>9 then 4else0 end 02.6字符函数-- select ascii(',') 44-- select concat('张三','吃饭') 张三吃饭-- select concat_ws('-','张三','⼲嘛去了') 张三-⼲嘛去了-- select format_number(2.4234432532,3) 2.423-- select substr(87654321,3,2) 65-- select instr('张三在哪','在') 3-- select length('324322') 6-- select locate('吗','吃了吗') 3-- select printf('你好') 你好-- select str_to_map('name:李四,age:18',',',':') {"name":"李四","age":"18"}-- select upper('abc') ABC-- select lower('ABC') abc-- select trim(' 你好 ') 你好-- select regexp_replace('早上好','早','晚') 晚上好-- SELECT regexp_extract('100-200', '(\d+)-(\d+)', 1) FROM src LIMIT 1100-- select parse_url('https:///u/afeiiii/','PROTOCOL') https-- select id,get_json_object(line,'$.name') name,get_json_object(line,'$.age') age,get_json_object(line,'$.gender') gender from jsontest-- select repeat('a',4) aaaa-- select split('howAareByou','[AB]') ["how","are","you"]-- select find_in_set('aa','aa,bb,aa') 1-- select sentences('你,吃了吗') [["你","吃了吗"]]4.内置表⽣成函数--explode(a) - separates the elements of array a into multiple rows, or the elements of a map into multiple rows and columns explode适合array/map的拆分--select id,,t.age,t.gender from jsontest lateral view json_tuple(line,'name','age','gender')t as name,age,gender json_tuple适合String类型拆分。

Hive函数总结

Hive函数总结

Hive函数总结查找系统⾃带函数: show functions;排序:ORDER BY : 全局排序,只有⼀个reducer, ASC(ascend)升序(默认); DESC(descend)降序SORT BY : 每个MapReduce内部排序 对于⼤规模的数据集 order by 的效率⾮常低,在很多情况下,并不需要全局排序,这时就可以使⽤ sort byDISTRIBUTE BY: 分区排序系统内置函数 查看系统⾃带的函数:show functions; 显⽰⾃带的函数的⽤法:desc functions ⽅法名; 详细显⽰⾃带的函数的⽤法:desc functions extended ⽅法名;常⽤内置函数:空字段赋值: NVL: 给值为Null的数据赋值,它的格式是NVL(value , default_value)。

它的功能是如果value为NULL,则NVL函数返回default_value的值,否则返回value的值,如果两个参数都为NULL ,则返回NULL。

⾏转列:CONCAT(string A/col , string B/col ...): 返回输⼊字符串连接后的结果,⽀持任意个输⼊字符串;将两个字段以,进⾏连接返回⼀个字段以base为字段名输出:CONCAT_WS(separator, str1, str2,...):它是⼀个特殊形式的 CONCAT()。

第⼀个参数剩余参数间的分隔符。

分隔符可以是与剩余参数⼀样的字符串。

如果分隔符是 NULL,返回值也将为 NULL。

这个函数会跳过分隔符参数后的任何 NULL 和空字符串。

分隔符将被加到被连接的字符串之间;COLLECT_SET(col):函数只接受基本数据类型,它的主要作⽤是将某字段的值进⾏去重汇总,产⽣array类型字段。

selectt1.base,concat_ws('|', collect_set()) namefrom(selectname,concat(constellation, ",", blood_type) basefromperson_info) t1group byt1.base;列转⾏:EXPLODE(col):将hive⼀列中复杂的array或者map结构拆分成多⾏。

hive 常用的函数

hive 常用的函数

hive 常用的函数Hive是一个建立在Hadoop上的数据仓库工具,常用于大数据处理和分析。

在Hive中,有许多内置的函数可以帮助用户进行数据处理和转换。

以下是一些Hive 常用的函数:1. 字符串函数:- CONCAT:用于连接两个或多个字符串。

- SUBSTR:用于获取字符串的子串。

- LENGTH:用于获取字符串的长度。

- UPPER和LOWER:用于将字符串转换为大写或小写。

- TRIM:用于去除字符串两端的空格。

2. 数学函数:- ROUND:用于对数字进行四舍五入。

- ABS:用于获取数字的绝对值。

- CEIL和FLOOR:分别用于向上取整和向下取整。

- POWER:用于计算一个数字的指数幂。

- SQRT:用于计算一个数字的平方根。

3. 日期函数:- TO_DATE:用于将字符串转换为日期类型。

- YEAR、MONTH、DAY:分别用于获取日期的年、月、日部分。

- DATEDIFF:用于计算两个日期之间的天数差。

- DATE_ADD和DATE_SUB:用于对日期进行加减操作。

4. 数组函数:- SIZE:用于获取数组的长度。

- ARRAY_CONTAINS:用于判断数组中是否包含某个元素。

- ARRAY_MAX和ARRAY_MIN:分别用于获取数组中的最大值和最小值。

- ARRAY_JOIN:用于将数组转换为字符串。

5. 条件函数:- CASE WHEN:用于在查询中实现条件判断。

- COALESCE:用于获取第一个非空的值。

- NVL:用于将空值替换为指定的默认值。

- IF和IFNULL:用于实现简单的条件判断。

以上是一些Hive中常用的函数,通过合理使用这些函数,可以更高效地进行数据处理和转换。

在实际应用中,根据具体的需求和数据类型选择合适的函数是非常重要的。

希望以上内容对您有所帮助。

hive常用函数

hive常用函数

hive常用函数Hive一种分布式数据仓库,提供了多种用于灵活地处理数据的函数。

这些函数大多数都被设计用来提高数据库的性能和可用性,同时也为数据提供了更有价值的分析功能。

在这篇文章中,我们将介绍一些常见的 hive数和用法,帮助开发者快速了解和使用它们。

1.合函数:集合函数用于操作集合,包括数组和结构体数据类型。

集合函数包括 array_contains, size, sort_array, explode, map, array, collect_set collect_list函数。

2.符串函数:字符串函数用于处理和操作字符串。

常用的字符串函数有 regexp_extract, regexp_replace, length, lower, upper, concat, concat_ws, trim, ltrim, rtrim, substr, instr函数。

3.期和时间函数:日期和时间函数用于处理和操作日期和时间类型数据。

常见的日期和时间函数包括 add_months, date_add,date_sub, date_format, from_unixtime, last_day,months_between, trunc函数。

4.计函数:统计函数用于返回指定列的统计分析结果。

常用的统计函数包括 avg, count, min, max, sum, variance, stddev, covar_pop, covar_samp, percentile函数。

5.密函数:加密函数用于对数据进行加密,以保护数据安全。

常见的加密函数包括 md5, sha1, sha256, sha512函数。

6.滤函数:过滤函数用于过滤掉不符合条件的个别行数据。

常用的过滤函数包括 where, having, group by, order by函数。

7.他函数:Hive提供了一些其他函数,用于特定条件下对数据进行处理和操作。

hive函数用法

hive函数用法

hive函数用法在Hive中,有许多内置函数,用于在Hive查询中执行各种操作。

这些函数可以用于字符串操作、数学运算、日期处理、聚合等多种用途。

以下是一些常见的Hive函数及其用法:1. 字符串函数:- `CONCAT(string A, string B)`: 将两个字符串连接起来。

```sqlSELECT CONCAT('Hello', ' ', 'World') AS result;```- `SUBSTR(string A, int start, int len)`: 从字符串中提取子字符串。

```sqlSELECT SUBSTR('Hive is powerful', 1, 4) AS result;```- `LOWER(string A)`, `UPPER(string A)`: 将字符串转换为小写或大写。

```sqlSELECT LOWER('Hello') AS lower_result, UPPER('World') AS upper_result;```2. 数学函数:- `ROUND(double A)`, `CEIL(double A)`, `FLOOR(double A)`: 对浮点数进行四舍五入、向上取整或向下取整。

```sqlSELECT ROUND(3.14159) AS round_result, CEIL(4.25) AS ceil_result, FLOOR(5.75) AS floor_result;```- `ABS(double A)`: 返回一个数的绝对值。

```sqlSELECT ABS(-10) AS abs_result;```3. 日期函数:- `CURRENT_DATE`: 返回当前日期。

```sqlSELECT CURRENT_DATE AS current_date;```- `DATEDIFF(string enddate, string startdate)`: 返回两个日期之间的天数差。

hive查询函数用法

hive查询函数用法

hive查询函数用法Hive是一个基于Hadoop的数据仓库工具,它提供了丰富的查询函数来处理和转换数据。

下面是一些常见的Hive查询函数及其用法:1. COUNT():用于计算指定列或行的数量。

使用方法:SELECT COUNT(column_name) FROM table_name;2. SUM():用于计算指定列的总和。

使用方法:SELECT SUM(column_name) FROM table_name;3. A VG():用于计算指定列的平均值。

使用方法:SELECT A VG(column_name) FROM table_name;4. MIN():用于获取指定列的最小值。

使用方法:SELECT MIN(column_name) FROM table_name;5. MAX():用于获取指定列的最大值。

使用方法:SELECT MAX(column_name) FROM table_name;6. GROUP BY:用于按照指定列对结果进行分组,并对每个组应用聚合函数。

使用方法:SELECT column_name, aggregate_function(column_name) FROM table_name GROUP BY column_name;7. HA VING:用于在GROUP BY之后过滤分组结果。

使用方法:SELECT column_name, aggregate_function(column_name) FROM table_name GROUP BY column_name HA VING condition;8. CONCAT():用于连接多个字符串。

使用方法:SELECT CONCAT(column1, column2) FROM table_name;9. SUBSTRING():用于提取字符串的子串。

使用方法:SELECT SUBSTRING(column_name, start_index, length) FROM table_name;10. DATE_FORMAT():用于将日期格式化为指定的字符串格式。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

目录一、关系运算: (4)1. 等值比较: = (4)2. 不等值比较: <> (4)3. 小于比较: < (4)4. 小于等于比较: <= (4)5. 大于比较: > (5)6. 大于等于比较: >= (5)7. 空值判断: IS NULL (5)8. 非空判断: IS NOT NULL (6)9. LIKE比较: LIKE (6)10. JAVA的LIKE操作: RLIKE (6)11. REGEXP操作: REGEXP (7)二、数学运算: (7)1. 加法操作: + (7)2. 减法操作: - (7)3. 乘法操作: * (8)4. 除法操作: / (8)5. 取余操作: % (8)6. 位与操作: & (9)7. 位或操作: | (9)8. 位异或操作: ^ (9)9.位取反操作: ~ (10)三、逻辑运算: (10)1. 逻辑与操作: AND (10)2. 逻辑或操作: OR (10)3. 逻辑非操作: NOT (10)四、数值计算 (11)1. 取整函数: round (11)2. 指定精度取整函数: round (11)3. 向下取整函数: floor (11)4. 向上取整函数: ceil (12)5. 向上取整函数: ceiling (12)6. 取随机数函数: rand (12)7. 自然指数函数: exp (13)8. 以10为底对数函数: log10 (13)9. 以2为底对数函数: log2 (13)10. 对数函数: log (13)11. 幂运算函数: pow (14)12. 幂运算函数: power (14)13. 开平方函数: sqrt (14)14. 二进制函数: bin (14)15. 十六进制函数: hex (15)16. 反转十六进制函数: unhex (15)17. 进制转换函数: conv (15)18. 绝对值函数: abs (16)19. 正取余函数: pmod (16)20. 正弦函数: sin (16)21. 反正弦函数: asin (16)22. 余弦函数: cos (17)23. 反余弦函数: acos (17)24. positive函数: positive (17)25. negative函数: negative (17)五、日期函数 (18)1. UNIX时间戳转日期函数: from_unixtime (18)2. 获取当前UNIX时间戳函数: unix_timestamp (18)3. 日期转UNIX时间戳函数: unix_timestamp (18)4. 指定格式日期转UNIX时间戳函数: unix_timestamp (18)5. 日期时间转日期函数: to_date (19)6. 日期转年函数: year (19)7. 日期转月函数: month (19)8. 日期转天函数: day (19)9. 日期转小时函数: hour (20)10. 日期转分钟函数: minute (20)11. 日期转秒函数: second (20)12. 日期转周函数: weekofyear (20)13. 日期比较函数: datediff (21)14. 日期增加函数: date_add (21)15. 日期减少函数: date_sub (21)六、条件函数 (21)1. If函数: if (21)2. 非空查找函数: COALESCE (22)3. 条件判断函数:CASE (22)4. 条件判断函数:CASE (22)七、字符串函数 (23)1. 字符串长度函数:length (23)2. 字符串反转函数:reverse (23)3. 字符串连接函数:concat (23)4. 带分隔符字符串连接函数:concat_ws (23)5. 字符串截取函数:substr,substring (24)6. 字符串截取函数:substr,substring (24)7. 字符串转大写函数:upper,ucase (24)8. 字符串转小写函数:lower,lcase (25)9. 去空格函数:trim (25)10. 左边去空格函数:ltrim (25)11. 右边去空格函数:rtrim (25)12. 正则表达式替换函数:regexp_replace (26)13. 正则表达式解析函数:regexp_extract (26)14. URL解析函数:parse_url (26)15. json解析函数:get_json_object (27)16. 空格字符串函数:space (27)17. 重复字符串函数:repeat (27)18. 首字符ascii函数:ascii (28)19. 左补足函数:lpad (28)20. 右补足函数:rpad (28)21. 分割字符串函数: split (28)22. 集合查找函数: find_in_set (29)八、集合统计函数 (29)1. 个数统计函数: count (29)2. 总和统计函数: sum (29)3. 平均值统计函数: avg (30)4. 最小值统计函数: min (30)5. 最大值统计函数: max (30)6. 非空集合总体变量函数: var_pop (30)7. 非空集合样本变量函数: var_samp (31)8. 总体标准偏离函数: stddev_pop (31)9. 样本标准偏离函数: stddev_samp (31)10.中位数函数: percentile (31)11. 中位数函数: percentile (31)12. 近似中位数函数: percentile_approx (32)13. 近似中位数函数: percentile_approx (32)14. 直方图: histogram_numeric (32)九、复合类型构建操作 (32)1. Map类型构建: map (32)2. Struct类型构建: struct (33)3. array类型构建: array (33)十、复杂类型访问操作 (33)1. array类型访问: A[n] (33)2. map类型访问: M[key] (34)3. struct类型访问: S.x (34)十一、复杂类型长度统计函数 (34)1. Map类型长度函数: size(Map<K.V>) (34)2. array类型长度函数: size(Array<T>) (35)3. 类型转换函数 (35)十二、join,group,order,distribute,常用函数 (35)一、关系运算:1. 等值比较: =语法:A=B操作类型:所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1=1;12. 不等值比较: <>语法: A <> B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A与表达式B不相等,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 <> 2;13. 小于比较: <语法: A < B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 < 2;14. 小于等于比较: <=语法: A <= B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于或者等于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 <= 1;15. 大于比较: >语法: A > B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A大于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 2 > 1;16. 大于等于比较: >=语法: A >= B操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A大于或者等于表达式B,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where 1 >= 1;1注意:String的比较要注意(常用的时间比较可以先to_date之后再比较)hive> select * from lxw_dual;OK2011111209 00:00:00 2011111209hive> select a,b,a<b,a>b,a=b from lxw_dual;2011111209 00:00:00 2011111209 false true false7. 空值判断: IS NULL语法: A IS NULL操作类型: 所有类型描述: 如果表达式A的值为NULL,则为TRUE;否则为FALSE举例:hive> select 1 from lxw_dual where null is null;18. 非空判断: IS NOT NULL语法: A IS NOT NULL操作类型: 所有类型描述: 如果表达式A的值为NULL,则为FALSE;否则为TRUE举例:hive> select 1 from lxw_dual where 1 is not null;19. LIKE比较: LIKE语法: A LIKE B操作类型: strings描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合表达式B 的正则语法,则为TRUE;否则为FALSE。

B中字符”_”表示任意单个字符,而字符”%”表示任意数量的字符。

举例:hive> select 1 from lxw_dual where 'football' like 'foot%';1hive> select 1 from lxw_dual where 'football' like 'foot____';1注意:否定比较时候用NOT A LIKE Bhive> select 1 from lxw_dual where NOT 'football' like 'fff%';110. JAVA的LIKE操作: RLIKE语法: A RLIKE B操作类型: strings描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合JAVA正则表达式B的正则语法,则为TRUE;否则为FALSE。

相关文档
最新文档