当前位置: 首页 > news >正文

天猫网站做的比京东好河北seo诊断培训

天猫网站做的比京东好,河北seo诊断培训,制作网站的手机软件,丹徒区建设局网站Hive与Presto列转行的区别 1、背景描述2、Hive/Spark列转行3、Presto列转行 1、背景描述 在处理数据时,我们经常会遇到一个字段存储多个值,这时需要把一行数据转换为多行数据,形成标准的结构化数据 例如,将下面的两列数据并列转换…

Hive与Presto列转行的区别

    • 1、背景描述
    • 2、Hive/Spark列转行
    • 3、Presto列转行



1、背景描述


在处理数据时,我们经常会遇到一个字段存储多个值,这时需要把一行数据转换为多行数据,形成标准的结构化数据

例如,将下面的两列数据并列转换为三行,使得codename一一对应

idcodename
1a、b、cA、B、C

Hive、Spark和Presto都提供了这种实现,但有所不同。下面通过这个案例介绍三者之间的区别及注意事项

2、Hive/Spark列转行


Hive和Spark都可以使用lateral view posexplode实现:

select id, pos1, sub_code, pos2, sub_name from tmp
lateral view posexplode(split(code,'、')) v1 as pos1, sub_code
lateral view posexplode(split(name,'、')) v2 as pos2, sub_name
where id='1' and pos1=pos2

Hive On MapReduce与Hive On Spark的执行结果如下:

idsub_codesub_name
1aA
1bB
1cC

值得注意的是,lateral view posexplode会自动过滤被转换列字段值为空的数据,进而导致数据丢失

优化方案是将lateral view修改为lateral view outer后尝试

更多关于lateral view UDTF的使用见文章:传送门

3、Presto列转行


使用PrestoSQL的交叉连接cross join unnest实现:

with t1 as(select id,sub_code,row_number() over() rnfrom tempcross join unnest(split(code, '、')) as t (sub_code)where id='1'
),
t2 as (select id,sub_name,row_number() over() rnfrom tempcross join unnest(split(name, '、')) as t (sub_name)where id='1'
)
select t1.id, t1.sub_code, t2.sub_name
from t1
left join t2 
on t1.rn = t2.rn
order by t1.rn

PrestoSQL的执行结果如下:

idsub_codesub_name
1bB
1aA
1cC

需要注意的是,cross join unnest不会自动过滤被转换列和转换列字段值为空的数据,因此此方式数据不会丢失

例如,当转换列字段值存在空值时:

idcodename
1a、b、cA、B

cross join unnest列转行的结果为

idsub_codesub_name
1aA
1cNULL
1bB

当被转换列字段值存在空值时:

idcodename
1a、b、cNULL

cross join unnest列转行的结果为

idsub_codesub_name
1bNULL
1aNULL
1cNULL


http://www.hrbkazy.com/news/56258.html

相关文章:

  • 企业网站设计概念整合营销案例
  • 成都市建设领域网站咨询电话优化营商环境
  • 沧州机械类网站建设手机清理优化软件排名
  • 重庆家居网站制作公司西安seo搜推宝
  • 现在网络推广方式重庆seo推广服务
  • 深圳建设个网站重庆森林经典台词梁朝伟
  • 图片高清处理在线百度灰色词优化排名
  • 百度上面如何做网站网络推广运营主要做什么
  • 城口集团网站建设市场调研报告内容
  • 石家庄做网站那家好360搜图片识图
  • 全功能asp政府网站源码 带网上办事在线指南等功能杭州云优化信息技术有限公司
  • 茂名专业网站建设怎么样推广自己的网址
  • 网站开发的相关技能有哪些上首页的seo关键词优化
  • php网站开发 知乎建网站seo
  • 网站建设专业英文百度seo提高排名费用
  • 网站建设需求登记表 免费下载seo案例分析方案
  • 网页制作公司公众号关键词排名优化
  • 安徽省建设造价管理协会网站seo推广怎么学
  • 求委托私人做网站线在科技成都网站推广公司
  • 做外贸比较好的网站有哪些江苏网页设计
  • wordpress 搜索伪静态北京网站优化效果
  • mockpuls可以做网站吗seo教育
  • wordpress评论ajax加载seo智能优化公司
  • 网站备案 公司名称关联性app线下推广怎么做
  • 网站推广临沂网址域名ip解析
  • 做公众号的必备参考网站湛江百度网站快速排名
  • 衢州建设职业学校网站成都网站建设创新互联
  • 网站搭建申请免费软文发布平台
  • 公务员 做网站 违法百度竞价推广点击软件
  • 广州网站开发报价市场营销推广策划方案