当前位置: 首页 > news >正文

日照住房和城乡建设局网站seo网址大全

日照住房和城乡建设局网站,seo网址大全,西安网站开发xamokj,兰州做网站哪个平台好一、Hive 中的行列转换 1. 行转列: collect_list() collect_list() 函数用于将一个列中的数据收集成一个数组。 示例数据文件 假设有一个名为 orders.txt 的文件,内容如下: 1,101 1,101 1,103 2,104 2,105导入数据到 Hive 表 首先&…

一、Hive 中的行列转换

1. 行转列: collect_list()

collect_list() 函数用于将一个列中的数据收集成一个数组。

示例数据文件

假设有一个名为 orders.txt 的文件,内容如下:

1,101
1,101
1,103
2,104
2,105
导入数据到 Hive 表

首先,我们创建一个表 orders 并将数据导入到该表中:

-- 创建表
CREATE TABLE orders (user_id INT,order_id INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';-- 加载数据
LOAD DATA LOCAL INPATH '/path/to/orders.txt' INTO TABLE orders;

然后,我们可以使用 collect_list() 函数收集每个用户的订单 ID:

SELECTuser_id,collect_list(order_id) as order_ids
FROMorders
GROUP BYuser_id;
示例结果
user_idorder_ids
1[101, 101, 103]
2[104, 105]

2. 行转列:collect_set()

collect_set() 函数类似于 collect_list(),但它会移除数组中的重复值。

示例数据文件

使用同一个 orders.txt 文件。

导入数据到 Hive 表

数据已经导入过,因此我们直接使用 collect_set() 函数:

SELECTuser_id,collect_set(order_id) as unique_order_ids
FROMorders
GROUP BYuser_id;
示例结果
user_idunique_order_ids
1[101, 103]
2[104, 105]

3. 列转行:explode()

explode() 函数用于将数组里的元素拆分开来,并用行展示。通常与 lateral view 函数搭配使用。

示例数据文件

假设有一个名为 user_interests.txt 的文件,内容如下:

1,sports,music,art
2,reading,travel
导入数据到 Hive 表

使用 explode() 函数炸裂拆分:

SELECTuser_id,interest
FROMuser_interests
LATERAL VIEWexplode(split(interests, ',')) exploded_table AS interest;
-- 加载数据
LOAD DATA LOCAL INPATH '/path/to/user_interests.txt' INTO TABLE user_interests;
示例结果
user_idinterest
1sports
1music
1art
2reading
2travel

二、Hive 收集切割

1. split()

split() 函数用于将一个字符串按照指定的分隔符切割成一个数组。

示例数据文件

user_interests.txt 的文件,内容如下:

1,sports,music,art
2,reading,travel
导入数据到 Hive 表

user_interests 已创建,然后,使用 split() 将兴趣字符串分割成数组:

SELECTuser_id,split(interests, ',') as interest_array
FROMuser_interests;
示例结果
user_idinterest_array
1[“sports”, “music”, “art”]
2[“reading”, “travel”]

2. split()常和concat_ws() 一起使用

concat_ws() 是一个字符串函数,用于将多列的值合并成一个字符串,使用指定的分隔符。split() 函数则用于将字符串按照指定的分隔符切割成一个数组。

示例数据文件

假设有一个名为 user_info.txt 的文件,内容如下:

1,John,Doe,john.doe@example.com
2,Jane,Smith,jane.smith@example.com
导入数据到 Hive 表

首先,我们创建一个表 user_info 并将数据导入到该表中:

-- 创建表
CREATE TABLE user_info (user_id INT,first_name STRING,last_name STRING,email STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';-- 加载数据
LOAD DATA LOCAL INPATH '/path/to/user_info.txt' INTO TABLE user_info;

然后,使用 concat_ws() 将多列的值合并成一个字符串,并使用 split() 将这个字符串拆分成数组:

SELECTuser_id,split(concat_ws(',', first_name, last_name, email), ',') as info_array
FROMuser_info;
示例结果
user_idinfo_array
1[“John”, “Doe”, “john.doe@example.com”]
2[“Jane”, “Smith”, “jane.smith@example.com”]

更多细节可参考我的sql题专栏中的炸裂函数与恢复

经典sql题(十三)炸裂对应学生的姓名和成绩
经典sql题(十四)炸裂函数的恢复

http://www.hrbkazy.com/news/48224.html

相关文章:

  • 用axure怎么做h5网站网站批量收录
  • 美甲网站自适应源码泰安seo网络公司
  • 开锁在百度上做网站要钱吗深圳网站关键词优化公司
  • 七星彩投注网站建设安装百度一下
  • 做网站前产品经理要了解什么什么是优化
  • 久久建筑网会员登陆aso优化分析
  • 网站高质量外链中山网站建设公司
  • 旅游网站建设需求分析哈尔滨网络优化公司有哪些
  • 电商平台代运营公司关键词优化的技巧
  • wordpress豆瓣小站关键词在线听
  • 为吴铮真做网站的男生淘宝竞价排名
  • smarty网站程序seo怎么收费
  • 辽宁网站建设公司电话武汉seo计费管理
  • 衢州网站设计方案站长工具服务器查询
  • 天津市网站制作 公司软件定制开发公司
  • 公益广告不浪费水网站怎么做正规的计算机培训机构
  • 西安有哪些做网站的公司好粤语seo是什么意思
  • 代码做网站怎么做一个自己的网页
  • seo优化网站建设哪家好深圳设计公司
  • 地产平台网站模板灰色广告投放平台
  • 源码怎样做网站怎么在网上推广产品
  • 东莞网站建设求职简历佛山百度推广公司
  • 做的好看的pc端网站营销型网站建设优化建站
  • 建网站需要那些步骤公众号软文怎么写
  • 昆明做网站优化的公司做网站的公司哪家好
  • 高端大气百度优化服务
  • 有哪些做司考真题的网站怎样才能在百度上发布信息
  • 网站开发 项目计划南京谷歌seo
  • 百度采购网官方网站营销型网站推广方案
  • 青岛企业建站系统模板网上营销是干什么的