当前位置: 首页 > news >正文

宜章网站建设湛江今日头条新闻

宜章网站建设,湛江今日头条新闻,商业网站案例,手机打开web浏览器Hive窗口函数 其他函数: Hive—Hive函数 文章目录Hive窗口函数开窗数据准备建表导入数据聚合函数window子句LAG(col,n,default_val) 往前第 n 行数据LEAD(col,n, default_val) 往后第 n 行数据ROW_NUMBER() 会根据顺序计算RANK() 排序相同时会重复,总数不会变DENSE…

Hive窗口函数

其他函数: Hive—Hive函数


文章目录

  • Hive窗口函数
  • 开窗
  • 数据准备
  • 建表
    • 导入数据
    • 聚合函数
    • window子句
    • LAG(col,n,default_val) 往前第 n 行数据
    • LEAD(col,n, default_val) 往后第 n 行数据
    • ROW_NUMBER() 会根据顺序计算
    • RANK() 排序相同时会重复,总数不会变
    • DENSE_RANK() 排序相同时会重复,总数会减少
    • first_value取分组内排序后,截止到当前行,第一个值
    • last_value取分组内排序后,截止到当前行,最后一个值
    • NTILE(n) 数据切片函数


开窗

又称开窗函数

OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化

数据准备

字段为 name,orderdata,cost

jack,2015-01-01,10
tony,2015-01-02,15
jack,2015-02-03,23
tony,2015-01-04,29
jack,2015-01-05,46
jack,2015-04-06,42
tony,2015-01-07,50
jack,2015-01-08,55
mart,2015-04-08,62
mart,2015-04-09,68
neil,2015-05-10,12
mart,2015-04-11,75
neil,2015-06-12,80
mart,2015-04-13,94

建表

----建表------
create table if not exists t_window(name string,orderdate date,cost int
)

导入数据

原始数据的已经上传到hdfs上

load data inpath '/order.csv' into table  t_window;# 查看数据
select * from t_window;

在这里插入图片描述

聚合函数

常见聚合函数(count(),sum(),max(),min(),avg()……)

---全表数据cost的总和
select name,orderdate,cost,sum(cost) over () from t_window;

在这里插入图片描述

window子句

UNBOUNDED 起点
CURRENT ROW 当前行
n PRECEDING 往前 n 行数据
n FOLLOWING 往后 n 行数据
UNBOUNDED PRECEDING 表示从前面的起点
UNBOUNDED FOLLOWING 表示到后面的终点
select name,orderdate,cost,sum(cost) over (partition by name order by orderdate rows between unbounded preceding and unbounded following) as row1,---个人累计消费总和sum(cost) over(partition by name order by orderdate) as row2,--个人截止到当前时间的消费总和sum(cost) over(partition by name order by orderdate rows between unbounded preceding and current row ) as row3,--个人截止到当前时间的消费总和sum(cost) over(partition by name order by orderdate rows between 1 preceding and current row ) as row4,---当前消费额与上一次消费额的总和sum(cost) over(partition by name order by orderdate rows between 1 preceding and 1 following ) as row5, --前行和前边一行及后面一行sum(cost) over(partition by name order by orderdate rows between current row and UNBOUNDED FOLLOWING ) as row6,--当前行及后面所有行sum(cost) over(partition by name order by orderdate rows between current row and 3 following) as row7 --当前消费与后三次的消费总额
from t_window;

在这里插入图片描述

LAG(col,n,default_val) 往前第 n 行数据

分区内滞后当前行的参数值

select name,orderdate,cost,-----前一个日期lag(orderdate,1,'1990-01-01') over (partition by name order by orderdate) as row1
from t_window;

在这里插入图片描述

LEAD(col,n, default_val) 往后第 n 行数据

分区内当前行前导行的参数值

select name,orderdate,cost,----后一个日期lead(orderdate,1,'1990-01-01') over (partition by name order by orderdate) as row2
from t_window;

在这里插入图片描述

ROW_NUMBER() 会根据顺序计算

row_number()从1开始,按照顺序,生成分组内记录的序列,row_number()的值不会存在重复,当排序的值相同时,按照表中记录的顺序进行排列

---根据名字分区,消费金额降序排序
select name,orderdate,cost,row_number() over (partition by name order by cost desc ) as row1
from t_window;

在这里插入图片描述

RANK() 排序相同时会重复,总数不会变

rank() 生成数据项在分组中的排名,排名相等会在名次中留下空位

select name,orderdate,cost,rank() over (partition by name order by cost desc )as row2
from t_window;

在这里插入图片描述

DENSE_RANK() 排序相同时会重复,总数会减少

dense_rank() 生成数据项在分组中的排名,排名相等会在名次中不会留下空位

select name,orderdate,cost,dense_rank() over (partition by name order by cost desc )as row3
from t_window;

在这里插入图片描述

first_value取分组内排序后,截止到当前行,第一个值

select name,orderdate,cost--------按名字分区,查询第一笔消费的时间与所有时间对比(有需求查询员工的入职时间,与此类似),first_value(orderdate)over (partition by name order by orderdate)as time1
from t_window;

在这里插入图片描述

last_value取分组内排序后,截止到当前行,最后一个值

select name,orderdate,cost--------按名字分区,查询当前行的最后一个时间,last_value(orderdate)over (partition by name order by orderdate)as time2
from t_window;

在这里插入图片描述

NTILE(n) 数据切片函数

把有序窗口的行分发到指定数据的组中,各个组有编号,编号从 1 开始,对于每一行,NTILE 返回此行所属的组的编号
注意:n 必须为 int 类型

select name,orderdate,cost,ntile(3) over() as row1---把数据分成三份
from t_window;

在这里插入图片描述

select name,orderdate,cost,ntile(3) over(partition by name)as row2---按名字分组 切片成三份
from t_window;

在这里插入图片描述

http://www.hrbkazy.com/news/26358.html

相关文章:

  • 茂易网站建设做网站需要准备什么
  • 蛋糕行业网站建设方案免费站推广网站2022
  • 盗版软件做的网站会被起诉吗站长之家权重
  • 深圳前十网站建设公司国外常用的seo站长工具
  • 湖南网站建设 尖端磐石网络怎样留别人电话在广告上
  • 城乡建设部网站甘红刚什么网站都能进的浏览器
  • 做手机app用什么软件免费的seo优化
  • 旅游网站的系统建设的意义怎么弄推广广告
  • 可以找题目做的网站软文有哪几种类型
  • 上海网站建设哪家强如何引流被动加好友微信
  • 全国网站建设有实力广安seo外包
  • 怎么自己做三个一网站网站运营培训
  • 互联网网站如何做百度账号客服24小时人工电话
  • 自己建网站做代理商baidu百度首页
  • wordpress主题qux南京seo收费
  • 织梦网站怎么做app开发成本预算表
  • 免费网站引导页网上怎么推广产品
  • 淘宝网站备案视频互联网推广选择隐迅推
  • 做ppt网站郑州seo推广外包
  • 在试用网站做推广爱站工具包的模块
  • 做图片的网站如何在百度发广告
  • 网站建设运营计划软文营销的作用有哪些
  • 网站怎么做能让人搜到宁波seo推广咨询
  • 天津做网站找津坤科技时事新闻
  • vb语言做的网站百度一下你就知道官网网址
  • 百竞网站建设nba篮网最新消息
  • 深圳网站建站推广网络营销最新案例
  • 网站建设对用户影响百度竞价推广流程
  • 私服网站去哪买空间啊百度关键词优化技巧
  • 官方网站建设与维护好处山东最新消息今天