当前位置: 首页 > news >正文

深圳龙岗网站制作西安seo优化公司

深圳龙岗网站制作,西安seo优化公司,好的免费网站建站平台,建设网站面试题 1、你们的数仓中DWD层为什么要划分数据域?划分数据域之后会对ADS层造成什么影响?是可以提效还是可扩展性强?你们是如何考虑的呢? 2、AZkaban和dolphinScheduler的区别是什么?如果选型会从哪几个方面来考虑呢&a…

面试题

1、你们的数仓中DWD层为什么要划分数据域?划分数据域之后会对ADS层造成什么影响?是可以提效还是可扩展性强?你们是如何考虑的呢?
2、AZkaban和dolphinScheduler的区别是什么?如果选型会从哪几个方面来考虑呢?
3、数仓中数据的幂等性如何实现?就是如何保证数仓中的数据不丢失和不重复?
4、零点漂移问题如何解决?
5、你们是如何统一指标口径?
6、某电商平台业务线的A运营组比如说提了一个GIV的计算公式,说不包含优惠卷的价格,就是不包含平台成本,平台补贴,B运营组又提了一个需求是GIV要包含平台补贴,这个时候如何去协调和沟通?
7、数据抽取工具分别有哪些优缺点?适用于哪些场景?

回答

1划分数据域,方便对业务环节进行拆解且清晰,能够快速定位找寻,ads 用的是主题域,划分后ads 会依赖跨域数据,如果底层数据域变动会影响ads 指标或标签,所以对于指标提现建议放到dws 做指标沉淀复用且方便找寻,对于ads 数据仍然是依赖但采用大宽表小宽表方法存储,大宽表即核心标签指标存放地方,能给后续ads 做到复用同时也是核心内容直接引用资产,但这样仍然会耦合,耦合点在于如果ads 大宽表不能产出下游也会等待,所以最好办法是对于核心大宽表拆解到2级主题存放

3更多是想问实时数据情况吧,参考kafka ack 与幂等以及Flink exactly once ,这里八股文就不解释了,说下离线的 离线抽取丢数情况还是有的,最简单办法还是扫count 即数据源和ods 如果不匹配则告警,如果是全量可以用表行数波动来判断,增量得和库匹配去写脚本了,至于重复则设置主键唯一dqc

5指标口径拉齐,从整体看与数分沟通,数分负责业务口径审批及对接,数仓负责技术口径审批及维护,对当前指标按照数据 主题域拆解归类生成指标域,指标域也由负责主题同学负责,同时建设指标上下线流程(流程在学习路线元数据指标那节课),并且建设指标中心去维护录入指标

6 核心问题在于指标多个业务方不统一情况,继续接5题的回答,生成指标中心后统一拉业务方负责人一起沟通确定指标业务口径,如后续更改则需要在审批指标时候抄送另外一方业务,让他们有告知,但如果业务方态度强硬可上升leader ,让负责人清楚目前指标状况和达成统一的好处,如果负责人也态度强硬并对自己leader 的leader 举报,则可以再退而求其次 单独开发for 这个部门,但这个口子能不开就不开。

http://www.hrbkazy.com/news/4395.html

相关文章:

  • 做购物网站能否生存seo岗位培训
  • 上海网站建设多少钱青岛seo经理
  • 天津专门做网站的公司的电话十大搜索引擎排行榜
  • 网站专题页长沙网站建设
  • 怎样让自己的网站被收录深圳专业seo
  • 网站策划需要具备什么朝阳seo排名
  • 企业网站 的网络营销方法有福州百度网站排名优化
  • 专业网站制作推广服务产品营销方案案例范文
  • dedecms 做影网站品牌推广策划方案案例
  • app下载链接南宁百度首页优化
  • 耐思尼克网站宁波seo优化公司排名
  • 门户网站建设采购seo超级外链工具免费
  • 日本vps的 服务器长沙自动seo
  • 个人网站的搭建b站推广网站入口2023是什么
  • spa.net网站开发百度搜索关键词怎么刷上去
  • wp怎样做可以下载的网站成都互联网公司排名
  • 网站开发app开发武汉seo首页优化报价
  • 网站怎么做能提升ip流量搜索引擎的设计与实现
  • 做公司 网站青岛网络科技公司排名
  • 自己的网站服务器阿里指数官网最新版本
  • 电子开发网站汕头seo不错
  • 网站后台管理系统权限企业站seo案例分析
  • 网站直播用php怎么做的大数据查询个人信息
  • 未来做那个网站致富舆情分析系统
  • 网站的服务器是什么bing搜索引擎入口
  • 如何做专题网站网络营销是学什么
  • 做网站设像素西安seo高手
  • 重庆网络网站推广站长论坛
  • 网站建设外包排名关键词优化排名软件s
  • 美食网站代做山东进一步优化