当前位置: 首页 > news >正文

怎么去做推广优化网站找哪家

怎么去做推广,优化网站找哪家,长春网站改版,甘肃建筑人才网查找满足指定条件的app_id查询条件: 表名、时间、节点名时间限定: 最好适当放大, 不知道什么原因有点不准eventLog的存放路径: spark.history.fs.logDirectory 1. spark-sql 先限定时间段;数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;按app_id粒度聚合, 查…
  1. 查找满足指定条件的app_id
  2. 查询条件: 表名、时间、节点名
  3. 时间限定: 最好适当放大, 不知道什么原因有点不准
  4. eventLog的存放路径: spark.history.fs.logDirectory

1. spark-sql 

  • 先限定时间段;
  • 数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;
  • 按app_id粒度聚合, 查找符合条件的数据;
-- 设定时区
set spark.sql.session.timeZone=GMT+8;-- 创建数据源视图
create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T08:00:00', 'modifiedBefore'='2023-08-21T14:00:00' );with tmp as ( -- 打标数据selectinput_file_name() as file_name,if( value like '%tbl_name%', 1, 0) as table_name,if( value like '%core-1-7%', 1, 0) as host_01,if( value like '%core-1-10%', 1, 0) as host_02fromview_name
),
tmp2 as ( -- 汇总到app_id粒度selectfile_name,sum(table_name) as table_name,sum(host_01) as host_01,sum(host_02) as host_02fromtmpgroup byfile_name
)
select*
fromtmp2
wheretable_name > 0
order byfile_name
;

2. 整文件读取

  • 先初步过滤app_id;
  • 整个文件读取成一行;
  • 按条件进行过滤;
import spark.implicits._// 寻找可能的APP_ID
val sql_create_view ="""|create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T00:00:00', 'modifiedBefore'='2023-08-21T23:00:00' )|""".stripMargin
val sql_filter_app_id ="""|select|   split( input_file_name(), 'history/')[1]  as file_name|from|    view_name|where|    value like '%trandw.dwd_log_app_open_di%'|group by|    split( input_file_name(), 'history/')[1]|""".stripMargin
spark.sql(sql_create_view)
val df_app_ids = spark.sql(sql_filter_app_id)
val app_ids = df_app_ids.collect().map(_.getString(0)).mkString(",")// 整个文件读取成一行
val rdd = spark.sparkContext.wholeTextFiles(s"hdfs://hdfs-cluster/spark-history/{${app_ids}}",20).repartition(12)
val df = rdd.toDF("file_name", "value")
df.createOrReplaceTempView("tmp")// 过滤数据
val sql_str ="""|select|   file_name|from|    tmp|where|    value like '%tbl_name%'|    and value like '%core-1-7%'|    and  value like '%core-1-10%'|""".stripMarginspark.sql(sql_str).show(1)

http://www.hrbkazy.com/news/13579.html

相关文章:

  • 稿定设计app免费版官方淘宝seo优化排名
  • 无锡地区做网站百度知道官网入口
  • 学做外挂的网站裤子seo关键词
  • 辽宁建设工程信息网企业人员调动新区快速seo排名
  • 怎么做可以把网站图片保存下来东莞网站设计公司排名
  • 安徽池州做企业网站百度seo收录
  • 金坛网站建设价格宁波网站建设的公司
  • wordpress 侧导航栏夫唯seo
  • 新郑做网站优化新浪微舆情大数据平台
  • 青岛哪家做网站的公司cps广告是什么意思
  • 动态网站的例子引流推广
  • 照明灯企业网站织梦模板快速排名点击工具
  • 建立 wiki 网站在线建站平台
  • 如何登录wordpressseo排名的方法
  • 用什么框架做网站快公司网站的推广
  • 政府网站开发项目技术总结书怎样在百度上打广告
  • 长沙门户网站建设宁波正规优化seo软件
  • 个人网站开发背景怎么写友情链接联盟
  • 免费营销型企业网站模板seo推广是什么
  • 东莞中小企业网站制作2022年seo还值得做吗
  • 婚恋网站哪家做的最好seo常规优化
  • 速成网站建设百度发布
  • 做网站建设公司属于诈骗嘛中文搜索引擎网站
  • 做产品网站要备案吗如何推广app
  • 机械加工网址大全seo快速排名软件方案
  • 高职示范校建设网站图片外链生成工具在线
  • software powered by wordpress做seo如何赚钱
  • 淘宝联盟网站建设不完整免费站长工具
  • 网站开发公司深圳seo排名优化技术
  • asp网站上哪做谷歌seo优化公司