当前位置: 首页 > news >正文

做的最好的美女视频网站免费创建个人网页

做的最好的美女视频网站,免费创建个人网页,公司网站如何做水印,wordpress ent前言 研究总结 Hudi extraMetadata ,记录研究过程。主要目的是通过 extraMetadata 保存 source 表的 commitTime (checkpoint), 来实现增量读Hudi表写Hudi表时,保存增量读状态的事务性,实现类似于流任务中的 exactly-once 背景需求 有个需求:增量读Hudi表关联其他Hudi…

前言

研究总结 Hudi extraMetadata ,记录研究过程。主要目的是通过 extraMetadata 保存 source 表的 commitTime (checkpoint), 来实现增量读Hudi表写Hudi表时,保存增量读状态的事务性,实现类似于流任务中的 exactly-once

背景需求

有个需求:增量读Hudi表关联其他Hudi表然后做一些复杂的业务处理逻辑,然后将结果表保存到目标Hudi表中

然后就有问题:如何保证保存目标Hudi表和保存 endCommiTime 是事务的。具体如下
1、Spark支持增量读Hudi表,需要传入起(始) commitTime。
2、上一批数据处理完成后应该保存上次增量读的的 endCommiTime,作为下一批增量读的的 beginCommitTime
3、可以选择将上一批的 endCommiTime 保存到 HDFS 或者数据库表中,但是不能保证事务。(并且还需要借助外部表或者存储目录,如果能通过Hudi本身解决,就比较完美了)
4、也就是可能存在保存目标Hudi表成功,但是保存 endCommiTime 失败的情况

这时就想到了 DeltaStreamer 中是通过设置 checkpoint 来实现的,具体是通过将 commitTime 的值保存到目标表 .commit 元数据文件中(extraMetadata->deltastreamer.checkpoi

http://www.hrbkazy.com/news/2914.html

相关文章:

  • vi企业设计重庆seo务
  • 济南手工网站建设公司百度指数怎么查
  • 深圳专业网站设计公司价格百度浏览器下载
  • 青岛工商注册核名查询系统seo搜索价格
  • 网站平台建设技术报告怎么样创建网站
  • 金融网站建设公司关键词爱站网关键词挖掘工具
  • 景德镇做网站公司免费网站的平台
  • wordpress用户更改不了密码seo优化搜索结果
  • 网站建设中html 下载企业网站seo排名
  • php网站开发优化九个关键词感悟中国理念
  • 南方数据企业网站管理系统9域名注册需要多少钱
  • 网站代码字体变大seo快速优化
  • 中英文企业网站百度关键词优化软件如何
  • 推荐几个的网站高端网站建设制作
  • 做网站素材图片免费python在线网站
  • 电商有哪些类目兰州网站优化
  • 唐山如何做百度的网站杭州seo博客
  • 网上注册公司流程及资料公司seo是什么职位
  • 企业免费建站网站餐饮营销方案
  • 衣柜推拉门图案设计网站软文是啥意思
  • 机械加工怎么找客户整站优化推广
  • 百度网站怎么做的网站推广seo
  • 做网站的集群方案北京百度网讯科技有限公司
  • 手机建行网站短信营销平台
  • 做地方网站需要什么部门批准今日的头条新闻
  • 杭州网站排名外包厦门网
  • 网站sem免费广州seo
  • 野花日本大全免费观看7seo外链在线提交工具
  • 网站运维服务内容seo推广服务
  • 北京网站设计公司wx成都柚米科技15管理培训班