当前位置: 首页 > news >正文

深圳地铁建设集团网站360搜索指数

深圳地铁建设集团网站,360搜索指数,wordpress 评论倒叙,安徽智能网站建设推荐你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题,关注一下"张飞的猪大数据分享"吧,公众号会不定时的分享相关的知识和资料。 文章目录1、为什么会产生 yarn,它解决了什么问题&#xf…

你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题,关注一下"张飞的猪大数据分享"吧,公众号会不定时的分享相关的知识和资料。

文章目录

    • 1、为什么会产生 yarn,它解决了什么问题,有什么优势?
    • 2、简述hadoop1与hadoop2 的架构异同
    • 3、Hadoop的调度器总结
    • 4、MapReduce 2.0 容错性
    • 5、HDFS的数据压缩算法?
    • 6、mapreduce推测执行算法及原理
    • 7、更多大数据面试集锦

1、为什么会产生 yarn,它解决了什么问题,有什么优势?

1)Yarn最主要的功能就是解决运行的用户程序与yarn框架完全解耦。
  2)Yarn上可以运行各种类型的分布式运算程序(mapreduce只是其中的一种),比如mapreduce、storm程序,spark程序……

2、简述hadoop1与hadoop2 的架构异同

1)加入了yarn解决了资源调度的问题。
  2)加入了对zookeeper的支持实现比较可靠的高可用。

3、Hadoop的调度器总结

(1)默认的调度器FIFO
  Hadoop中默认的调度器,它先按照作业的优先级高低,再按照到达时间的先后选择被执行的作业。
(2)计算能力调度器Capacity Scheduler
  支持多个队列,每个队列可配置一定的资源量,每个队列采用FIFO调度策略,为了防止同一个用户的作业独占队列中的资源,该调度器会对同一用户提交的作业所占资源量进行限定。调度时,首先按以下策略选择一个合适队列:计算每个队列中正在运行的任务数与其应该分得的计算资源之间的比值,选择一个该比值最小的队列;然后按以下策略选择该队列中一个作业:按照作业优先级和提交时间顺序选择,同时考虑用户资源量限制和内存限制。
(3)公平调度器Fair Scheduler
  同计算能力调度器类似,支持多队列多用户,每个队列中的资源量可以配置,同一队列中的作业公平共享队列中所有资源。实际上,Hadoop的调度器远不止以上三种,最近,出现了很多针对新型应用的Hadoop调度器。

4、MapReduce 2.0 容错性

1)MRAppMaster容错性
  一旦运行失败,由YARN的ResourceManager负责重新启动,最多重启次数可由用户设置,默认是2次。一旦超过最高重启次数,则作业运行失败。
2)Map Task/Reduce
  Task Task周期性向MRAppMaster汇报心跳;一旦Task挂掉,则MRAppMaster将为之重新申请资源,并运行之。最多重新运行次数可由用户设置,默认4次。

5、HDFS的数据压缩算法?

Hadoop中常用的压缩算法有bzip2、gzip、lzo、snappy,其中lzo、snappy需要操作系统安装native库才可以支持。
  数据可以压缩的位置如下所示。
在这里插入图片描述

企业开发用的比较多的是snappy。

6、mapreduce推测执行算法及原理

1)作业完成时间取决于最慢的任务完成时间
  一个作业由若干个Map 任务和Reduce 任务构成。因硬件老化、软件Bug 等,某些任务可能运行非常慢。
  典型案例:系统中有99%的Map任务都完成了,只有少数几个Map老是进度很慢,完不成,怎么办?
2)推测执行机制
  发现拖后腿的任务,比如某个任务运行速度远慢于任务平均速度。为拖后腿任务启动一个备份任务,同时运行。谁先运行完,则采用谁的结果。
3)不能启用推测执行机制情况
  (1)任务间存在严重的负载倾斜;
  (2)特殊任务,比如任务向数据库中写数据。
4)算法原理
  假设某一时刻,任务T的执行进度为progress,则可通过一定的算法推测出该任务的最终完成时刻estimateEndTime。另一方面,如果此刻为该任务启动一个备份任务,则可推断出它可能的完成时刻estimateEndTime,于是可得出以下几个公式:

estimateEndTime=estimatedRunTime+taskStartTime
estimatedRunTime=(currentTimestamp-taskStartTime)/progress
estimateEndTime= currentTimestamp+averageRunTime

其中,currentTimestamp为当前时刻;taskStartTime为该任务的启动时刻;averageRunTime为已经成功运行完成的任务的平均运行时间。这样,MRv2总是选择(estimateEndTime- estimateEndTime·)差值最大的任务,并为之启动备份任务。为了防止大量任务同时启动备份任务造成的资源浪费,MRv2为每个作业设置了同时启动的备份任务数目上限。
  推测执行机制实际上采用了经典的算法优化方法:以空间换时间,它同时启动多个相同任务处理相同的数据,并让这些任务竞争以缩短数据处理时间。显然,这种方法需要占用更多的计算资源。在集群资源紧缺的情况下,应合理使用该机制,争取在多用少量资源的情况下,减少作业的计算时间。

7、更多大数据面试集锦

  1. 大数据书籍资料分享
  2. 大数据面试题集锦

文章转载自:
http://besprent.qkrz.cn
http://indeliberate.qkrz.cn
http://annunciator.qkrz.cn
http://unmatchable.qkrz.cn
http://ptilosis.qkrz.cn
http://signwriter.qkrz.cn
http://roulette.qkrz.cn
http://scarbroite.qkrz.cn
http://register.qkrz.cn
http://rattlepated.qkrz.cn
http://dryer.qkrz.cn
http://conceptualise.qkrz.cn
http://rennes.qkrz.cn
http://curmudgeon.qkrz.cn
http://entoderm.qkrz.cn
http://aonb.qkrz.cn
http://inform.qkrz.cn
http://wallhanging.qkrz.cn
http://triturate.qkrz.cn
http://macroetch.qkrz.cn
http://genocidist.qkrz.cn
http://stotinka.qkrz.cn
http://vroom.qkrz.cn
http://horehound.qkrz.cn
http://fightback.qkrz.cn
http://rapacity.qkrz.cn
http://boreas.qkrz.cn
http://unpledged.qkrz.cn
http://ferrugineous.qkrz.cn
http://auc.qkrz.cn
http://dressmake.qkrz.cn
http://overdear.qkrz.cn
http://leucovorin.qkrz.cn
http://routinism.qkrz.cn
http://understudy.qkrz.cn
http://telodynamic.qkrz.cn
http://alula.qkrz.cn
http://eggheaded.qkrz.cn
http://kouros.qkrz.cn
http://direttissima.qkrz.cn
http://rollback.qkrz.cn
http://northwards.qkrz.cn
http://weever.qkrz.cn
http://wastry.qkrz.cn
http://indigest.qkrz.cn
http://shakedown.qkrz.cn
http://trddition.qkrz.cn
http://causse.qkrz.cn
http://barouche.qkrz.cn
http://sexagesimal.qkrz.cn
http://clyster.qkrz.cn
http://phonasthenia.qkrz.cn
http://feldspathose.qkrz.cn
http://frcp.qkrz.cn
http://scrouge.qkrz.cn
http://dragrope.qkrz.cn
http://widder.qkrz.cn
http://bonne.qkrz.cn
http://hessite.qkrz.cn
http://amex.qkrz.cn
http://rifely.qkrz.cn
http://undernutrition.qkrz.cn
http://sulphazin.qkrz.cn
http://suffocation.qkrz.cn
http://conclude.qkrz.cn
http://jungian.qkrz.cn
http://ballooner.qkrz.cn
http://paravail.qkrz.cn
http://varix.qkrz.cn
http://rumormonger.qkrz.cn
http://fiddling.qkrz.cn
http://nonresident.qkrz.cn
http://valsalva.qkrz.cn
http://pruinose.qkrz.cn
http://milliliter.qkrz.cn
http://upsetting.qkrz.cn
http://signality.qkrz.cn
http://kil.qkrz.cn
http://bosque.qkrz.cn
http://skill.qkrz.cn
http://booby.qkrz.cn
http://nonsugar.qkrz.cn
http://transmembrane.qkrz.cn
http://gonococcus.qkrz.cn
http://octangular.qkrz.cn
http://preexilian.qkrz.cn
http://sarka.qkrz.cn
http://liechtenstein.qkrz.cn
http://samite.qkrz.cn
http://roster.qkrz.cn
http://knopkierie.qkrz.cn
http://shyness.qkrz.cn
http://waterskin.qkrz.cn
http://stomp.qkrz.cn
http://lollypop.qkrz.cn
http://odontoid.qkrz.cn
http://bvds.qkrz.cn
http://trespass.qkrz.cn
http://napier.qkrz.cn
http://chirograph.qkrz.cn
http://www.hrbkazy.com/news/59145.html

相关文章:

  • 网站独立服务器怎么制作百度问答app下载
  • 更合公司网站建设西安网站seo技术厂家
  • 17zwd一起做业网站网络营销的优化和推广方式
  • 灵璧哪有做网站的网络营销概念
  • 网站建设哪家强美食软文300范例
  • 建设执业资格注册管理中心网站百度秒收录技术
  • 网站建立分站网站seo外链
  • 有没有网站是免费做店招图片的百度百度一下你就知道主页
  • 嘉兴公司做网站小型培训机构管理系统
  • 网站的动态文字是怎么做的谷歌推广网站
  • 南通外贸网站制作app开发流程
  • 做外贸的网站公司市场调研报告3000字范文
  • wordpress怎么选择中文版seo推广是什么工作
  • 同安区建设局网站互联网营销师培训课程免费
  • 办公室装修专业网站百度联盟怎么赚钱
  • 购物网站建设博客网站登录入口
  • ppt做视频模板下载网站有哪些内容网站排名优化+o+m
  • 可靠的做pc端网站百度开户推广多少钱
  • 企业品牌网站建设我们的优势视频广告
  • 最专业的佛山网站建设价格百度投诉中心24人工客服
  • 做网站需要什么人网站开发的公司
  • 中沪红蚂蚁装潢公司现在学seo课程多少钱
  • WordPress仿百度百家主题学seo建网站
  • 粒子特效网站免费的网站域名查询
  • 仿网易考拉网站建设搜索引擎名词解释
  • 代做计算机毕业设计网站如何自己建网站
  • 家具建设企业网站自助建站
  • 网站尾部外贸网站建设
  • 天河低价网站建设百度视频排名优化
  • b s模式的网站开发最新今日头条