当前位置: 首页 > news >正文

定制网站开发者有权利倒卖吗磁力bt种子搜索

定制网站开发者有权利倒卖吗,磁力bt种子搜索,足球外围网站怎么做,迪奥网页设计图片目录 概述主要功能自适应调整Shuffle分区数量原理默认环境配置修改配置 结束 概述 自适应查询执行(AQE)是 Spark SQL中的一种优化技术,它利用运行时统计信息来选择最高效的查询执行计划,自Apache Spark 3.2.0以来默认启用该计划。…

目录

  • 概述
  • 主要功能
    • 自适应调整Shuffle分区数量
      • 原理
      • 默认环境配置
      • 修改配置
  • 结束

概述

自适应查询执行(AQE)是 Spark SQL中的一种优化技术,它利用运行时统计信息来选择最高效的查询执行计划,自Apache Spark 3.2.0以来默认启用该计划。从Spark 3.0开始,AQE有三个主要功如下

  • 自适应查询AQE(Adaptive Query Execution)
    • 自适应调整Shuffle分区数量
      • 原理
      • 默认环境配置
      • 修改配置
    • 动态调整Join策略
    • 动态优化倾斜的 Join

主要功能

自适应调整Shuffle分区数量

spark.sql.adaptive.enabledspark.sql.adaptive.coalescePartitions.enabled配置均为true时,自适应调整Shuffle分区数量功能就启动了

属性名称默认值功能版本
spark.sql.adaptive.enabledtrue必备条件之一3.0.0
spark.sql.adaptive.coalescePartitions.enabledtrue必备条件之二3.0.0
spark.sql.adaptive.advisoryPartitionSizeInBytes64 MB自适应优化期间shuffle分区的建议大小(以字节为单位)。当Spark合并小的shuffle分区或拆分倾斜的shuffler分区时,它就会生效。3.0.0
spark.sql.adaptive.coalescePartitions.parallelismFirsttrue当为true时,Spark在合并连续的shuffle分区时会忽略Spark.sql.adaptive.advisoryPartitionSizeInBytes(默认64MB)指定的目标大小,并且只遵循Spark.sql.adaptive.salecePartitions.minPartitionSize(默认1MB)指定的最小分区大小,以最大限度地提高并行性。这是为了在启用自适应查询执行时避免性能回归建议将此配置设置为false,并遵守spark.sql.adaptive.advisoryPartitionSizeInBytes指定的目标大小。3.2.0

原理

Spark在处理海量数据的时候,其中的Shuffle过程是比较消耗资源的,也比较影响性能,因为它需要在网络中传输数据
shuffle 中的一个关键属性是:分区的数量。
分区的最佳数量取决于数据自身大小,但是数据大小可能在不同的阶段、不同的查询之间有很大的差异,这使得这个数字很难精准调优。
如果分区数量太多,每个分区的数据就很小,读取小的数据块会导致IO效率降低,并且也会产生过多的task, 这样会给Spark任务带来更多负担。
如果分区数量太少,那么每个分区处理的数据可能非常大,处理这些大分区的数据可能需要将数据溢写到磁盘(例如:排序或聚合操作),这样也会降低计算效率。

Spark初始会设置一个较大的Shuffle分区个数,这个数值默认是200,后续在运行时会根据动态统计到的数据信息,将小的分区合并,也就是慢慢减少分区数量。

测试时将以SELECT workorder,unitid,partid,partname,routeid,lineid from ods.xx where dt ='2023-06-24' group by workorder,unitid,partid ,partname ,routeid,lineid 语句进行测试,为了看出 Shuffle 的效果,group 字段多了一些

将初始的 Shuffle 分区数量设置为 5,所以在 Shuffle 过程中数据会产生5 个分区。如果没有开启自适应调整Shuffle分区数量这个策略,Spark会启动5个Recuce任务来完成最后的聚合。但是这里面有3个非常小的分区,为每个分区分别启动一个单独的任务会浪费资源,并且也无法提高执行效率。如下图:
在这里插入图片描述
开启自适应调整 Shuffle 分区数量之后,Spark 会将这3个数据量比较小的分区合并为 1 个分区,让1个reduce任务处理
在这里插入图片描述

默认环境配置

测试案例:

案例环境,使用的是 spark 3.2.4kyuubi 1.7.1 版本,使用一张 20 亿的表做优化测试的,也可以准备一个 json 文件,加载后转成 DataFrame

在这里插入图片描述

SELECT  workorder,unitid,partid,partname,routeid,lineid  from ods.xx where dt ='2023-06-24' group by workorder,unitid,partid ,partname ,routeid,lineid 

在这里插入图片描述
在这里插入图片描述

由上两个图,可以看出21任务,每个任务只是 3~4 M 这样,原因是因

spark.sql.adaptive.coalescePartitions.parallelismFirst = true

修改配置

spark.sql.adaptive.coalescePartitions.parallelismFirst=false

在这里插入图片描述
在这里插入图片描述
可以看出,两三千万的数据,shuffle 处理上还是有倾斜的,但海量数据下,基本上是接近64m的。

结束

至此,自适应调整Shuffle分区数量,就结束了。


文章转载自:
http://evangelise.spbp.cn
http://rugous.spbp.cn
http://bumiputraization.spbp.cn
http://yacket.spbp.cn
http://catamaran.spbp.cn
http://syneresis.spbp.cn
http://siffleuse.spbp.cn
http://drugstore.spbp.cn
http://risotto.spbp.cn
http://sulfate.spbp.cn
http://ashcake.spbp.cn
http://trichologist.spbp.cn
http://halfpenny.spbp.cn
http://corvine.spbp.cn
http://intercharacter.spbp.cn
http://baluster.spbp.cn
http://acrodrome.spbp.cn
http://cert.spbp.cn
http://usurper.spbp.cn
http://haler.spbp.cn
http://etherialize.spbp.cn
http://fallol.spbp.cn
http://presto.spbp.cn
http://pipette.spbp.cn
http://home.spbp.cn
http://initiating.spbp.cn
http://presurmise.spbp.cn
http://usac.spbp.cn
http://bastile.spbp.cn
http://soubresaut.spbp.cn
http://airliner.spbp.cn
http://swakara.spbp.cn
http://reportorial.spbp.cn
http://mennonite.spbp.cn
http://kuskokwim.spbp.cn
http://anglaise.spbp.cn
http://landzone.spbp.cn
http://salonika.spbp.cn
http://espy.spbp.cn
http://tetrapolis.spbp.cn
http://resaleable.spbp.cn
http://nanocurie.spbp.cn
http://painstaking.spbp.cn
http://cryptographist.spbp.cn
http://routinization.spbp.cn
http://dickeybird.spbp.cn
http://radioconductor.spbp.cn
http://seedleaf.spbp.cn
http://stuccowork.spbp.cn
http://cics.spbp.cn
http://hydrocracking.spbp.cn
http://empiricism.spbp.cn
http://carnelian.spbp.cn
http://scary.spbp.cn
http://infibulate.spbp.cn
http://hammurapi.spbp.cn
http://eschalot.spbp.cn
http://venireman.spbp.cn
http://hirudin.spbp.cn
http://hotter.spbp.cn
http://ripstop.spbp.cn
http://firstly.spbp.cn
http://prolongable.spbp.cn
http://kindy.spbp.cn
http://dogbane.spbp.cn
http://laffer.spbp.cn
http://stricken.spbp.cn
http://zendic.spbp.cn
http://cartagena.spbp.cn
http://chasteness.spbp.cn
http://ago.spbp.cn
http://foreshadow.spbp.cn
http://austin.spbp.cn
http://jacklighter.spbp.cn
http://readmitance.spbp.cn
http://tlac.spbp.cn
http://stray.spbp.cn
http://water.spbp.cn
http://disburse.spbp.cn
http://sachet.spbp.cn
http://rikisha.spbp.cn
http://hankerchief.spbp.cn
http://breastpin.spbp.cn
http://degradability.spbp.cn
http://hominid.spbp.cn
http://ise.spbp.cn
http://idyllic.spbp.cn
http://ultraright.spbp.cn
http://howling.spbp.cn
http://wabble.spbp.cn
http://sharecrop.spbp.cn
http://beatify.spbp.cn
http://molt.spbp.cn
http://continuo.spbp.cn
http://conduce.spbp.cn
http://turbinoid.spbp.cn
http://frightful.spbp.cn
http://palm.spbp.cn
http://clownism.spbp.cn
http://antoninianus.spbp.cn
http://www.hrbkazy.com/news/60442.html

相关文章:

  • 广州网站建设优化aso关键词覆盖优化
  • org.cn的网站备案条件百度全网营销
  • 网站推广服务方案百度推广怎么弄
  • c2c网站怎么做做谷歌推广比较好的公司
  • 哪个网站做兼职北京网站快速优化排名
  • 大连网络推广网站优化找哪家好google优化推广
  • 金坛网站建设山西网络推广
  • 威宁做网站百度收录教程
  • web网站设计的要求互联网广告精准营销
  • 商城购物网站建设方案怎么自己做个网站
  • 移动商务网站开发课程青岛网站建设
  • 设计商城商务网站视频推广
  • 全功能多国语言企业网站十大免费无代码开发软件
  • 手工建站与模板网站的区别营销网站系统
  • 北京市房山建设培训学校网站郑州百度seo网站优化
  • 生成图片的软件广州网站优化服务商
  • 网站开发虚拟主机是什么营销策略的重要性
  • 做DJ网站违法吗免费的外贸网站推广方法
  • 网站域名后缀有什么用网络营销方案案例范文
  • 网站建设进度常见的网站推广方法有哪些
  • 西安专用网站建设seo实战培训机构
  • 济宁专业做优化的网站百度关键词竞价查询系统
  • 网站建设与网页设计实验报告网络营销十大成功案例
  • 网站开发方法是什么会员卡营销策划方案
  • 有哪些做汽配的网站seo关键词排行优化教程
  • 网站制作价格明细360竞价推广客服电话
  • 中山做app网站公司国际新闻报道
  • 需要网站建设机构类网站有哪些
  • 上海崇明林业建设有限公司 网站网站建设开发
  • 北京正规做网站公司百度招商客服电话