当前位置: 首页 > news >正文

做企业网站进行推广要多少钱经典广告推广词

做企业网站进行推广要多少钱,经典广告推广词,网站页面布局的目的,兰州中川国际机场三期文章目录 (123)压缩概述在Map阶段启用在Reduce阶段启用 (124)压缩案例实操如何在Map输出端启用压缩如何在Reduce端启用压缩 参考文献 (123)压缩概述 压缩也是MR中比较重要的一环,其可以应用于M…

文章目录

  • (123)压缩概述
    • 在Map阶段启用
    • 在Reduce阶段启用
  • (124)压缩案例实操
    • 如何在Map输出端启用压缩
    • 如何在Reduce端启用压缩
  • 参考文献

(123)压缩概述

压缩也是MR中比较重要的一环,其可以应用于Map阶段,比如说Map端输出的文件,也可以应用于Reduce阶段,如最终落地的文件。

压缩的好处,是减少磁盘的IO以及存储空间。缺点也很明显,就是极大增加了CPU的开销(频繁计算带来的频繁压缩与解压缩)。

压缩的基本原则:

  • 对运算密集型job,少用压缩;(计算时需要解压缩,计算完需要压缩,受不了)
  • 对IO密集型Job,多用压缩。

MR支持很多种压缩算法,常用的有以下几个:

压缩格式Hadoop自带?算法文件扩展名是否可切片换成压缩格式后,原来的程序是否需要修改
DEFLATE是,直接使用DEFLATE.deflate和文本处理一样,不需要修改
Gzip是,直接使用DEFLATE.gz和文本处理一样,不需要修改
bzip2是,直接使用bzip2.bz2和文本处理一样,不需要修改
LZO否,需要安装LZO.lzo需要建索引,还需要指定输入格式
Snappy是,直接使用Snappy.snappy和文本处理一样,不需要修改

支持切片的话,使用上会更方便很多。

压缩性能的比较如下:

压缩算法原始文件大小压缩文件大小压缩速度解压速度
gzip8.3GB1.8GB17.5MB/s58MB/s
bzip28.3GB1.1GB2.4MB/s9.5MB/s
LZO8.3GB2.9GB49.3MB/s74.6MB/s

据说最好的还是Google开发的snappy,其官网介绍它的压缩速度是250MB/s,解压缩速度是500MB/s。

那在生产环境下,该如何选择合适的压缩方式呢?

一般是重点考虑以下几点:

  • 压缩/解压缩速度;
  • 压缩率,即压缩后的文件大小;
  • 压缩后是否还支持切片。

结合这几点,我们再回头看这几种压缩算法。

Gzip压缩:压缩率比较高,但是压缩/解压缩速度一般,且不支持切片;

Bzip2压缩,压缩率非常高,且支持切片,但是压缩/解压缩速度极慢;

Lzo压缩,压缩/解压缩速度非常快,且支持切片,但是压缩率一般;不过Lzo需要额外创建索引之后,才能支持切片。

Snappy压缩,压缩和解压缩速度极快,但不支持切片,压缩率一般。

压缩可以在MapReduce的任意阶段启用,一共三个阶段,即Map的输入端、Map到Reduce部分、Reduce的输出端。

在Map阶段启用

在Map的输入端启用压缩时:

不需要显式指定使用的编解码方式,Hadoop会自动通过文件扩展名,来选择合适的编解码方式。

同时,需要注意,如果数据量小于块大小的话,则可以考虑压缩、解压缩速度比较快的算法,如LZO、snappy;如果数据量大于块大小的话,则可以重点考虑支持切片的算法,如Bzip2和LZO。

在Mapper的输出端启用压缩时:

这里启用压缩,主要是为了减少MapTask和ReduceTask之间的网络IO,所以可以选择重点考虑压缩和解压缩快的LZO、snappy等。

在Reduce阶段启用

在Reducer的输出端启用压缩时:

如果输出的数据是需要永久保存,那么可以采用压缩率比较高的算法,以减少存储的空间;

如果是作为下一个MapReduce的输入,那么可以考虑数据量和是否支持切片。

(124)压缩案例实操

讲怎么写压缩代码的,此处只做了解,所以基本是直接复制教程文档。

为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器

压缩格式对应的编码/解码器
DEFLATEorg.apache.hadoop.io.compress.DefaultCodec
gziporg.apache.hadoop.io.compress.GzipCodec
bzip2org.apache.hadoop.io.compress.BZip2Codec
LZOcom.hadoop.compression.lzo.LzopCodec
Snappyorg.apache.hadoop.io.compress.SnappyCodec

要在Hadoop中启用压缩,可以配置如下参数

参数默认值阶段建议
io.compression.codecs (在core-site.xml中配置)无,这个需要在命令行输入hadoop checknative查看输入压缩Hadoop使用文件扩展名判断是否支持某种编解码器
mapreduce.map.output.compress(在mapred-site.xml中配置)falsemapper输出这个参数设为true启用压缩
mapreduce.map.output.compress.codec(在mapred-site.xml中配置)org.apache.hadoop.io.compress.DefaultCodecmapper输出企业多使用LZO或Snappy编解码器在此阶段压缩数据
mapreduce.output.fileoutputformat.compress(在mapred-site.xml中配置)falsereducer输出这个参数设为true启用压缩
mapreduce.output.fileoutputformat.compress.codec(在mapred-site.xml中配置)org.apache.hadoop.io.compress.DefaultCodecreducer输出使用标准工具或者编解码器,如gzip和bzip2

抄一下案例。

如何在Map输出端启用压缩

假如想Mapper输出端启用压缩,只需要调整驱动类即可,Mapper和Reducer类不需要做特殊处理,跟正常一样就可以。

package com.atguigu.mapreduce.compress;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.compress.BZip2Codec;	
import org.apache.hadoop.io.compress.CompressionCodec;
import org.apache.hadoop.io.compress.GzipCodec;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;public class WordCountDriver {public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {Configuration conf = new Configuration();// 开启map端输出压缩conf.setBoolean("mapreduce.map.output.compress", true);// 设置map端输出压缩方式conf.setClass("mapreduce.map.output.compress.codec", BZip2Codec.class,CompressionCodec.class);Job job = Job.getInstance(conf);job.setJarByClass(WordCountDriver.class);job.setMapperClass(WordCountMapper.class);job.setReducerClass(WordCountReducer.class);job.setMapOutputKeyClass(Text.class);job.setMapOutputValueClass(IntWritable.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(IntWritable.class);FileInputFormat.setInputPaths(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));boolean result = job.waitForCompletion(true);System.exit(result ? 0 : 1);}
}

如何在Reduce端启用压缩

假如想Reducer输出端启用压缩:

package com.atguigu.mapreduce.compress;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.compress.BZip2Codec;
import org.apache.hadoop.io.compress.DefaultCodec;
import org.apache.hadoop.io.compress.GzipCodec;
import org.apache.hadoop.io.compress.Lz4Codec;
import org.apache.hadoop.io.compress.SnappyCodec;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;public class WordCountDriver {public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {Configuration conf = new Configuration();Job job = Job.getInstance(conf);job.setJarByClass(WordCountDriver.class);job.setMapperClass(WordCountMapper.class);job.setReducerClass(WordCountReducer.class);job.setMapOutputKeyClass(Text.class);job.setMapOutputValueClass(IntWritable.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(IntWritable.class);FileInputFormat.setInputPaths(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));// 设置reduce端输出压缩开启FileOutputFormat.setCompressOutput(job, true);// 设置压缩的方式FileOutputFormat.setOutputCompressorClass(job, BZip2Codec.class); 
//	    FileOutputFormat.setOutputCompressorClass(job, GzipCodec.class); 
//	    FileOutputFormat.setOutputCompressorClass(job, DefaultCodec.class); boolean result = job.waitForCompletion(true);System.exit(result?0:1);}
}

参考文献

  1. 【尚硅谷大数据Hadoop教程,hadoop3.x搭建到集群调优,百万播放】

文章转载自:
http://immie.zfqr.cn
http://teens.zfqr.cn
http://baee.zfqr.cn
http://narrowband.zfqr.cn
http://strung.zfqr.cn
http://waggery.zfqr.cn
http://friction.zfqr.cn
http://insulting.zfqr.cn
http://preignition.zfqr.cn
http://brasilin.zfqr.cn
http://laundromat.zfqr.cn
http://sinfully.zfqr.cn
http://refreshment.zfqr.cn
http://deary.zfqr.cn
http://rhein.zfqr.cn
http://beautifully.zfqr.cn
http://eradicative.zfqr.cn
http://minimal.zfqr.cn
http://cryptology.zfqr.cn
http://granulocytopoiesis.zfqr.cn
http://noncombustible.zfqr.cn
http://franseria.zfqr.cn
http://isostemony.zfqr.cn
http://peribolus.zfqr.cn
http://officialis.zfqr.cn
http://queenlet.zfqr.cn
http://maharashtrian.zfqr.cn
http://tabby.zfqr.cn
http://anna.zfqr.cn
http://axone.zfqr.cn
http://systematiser.zfqr.cn
http://instantiation.zfqr.cn
http://montserrat.zfqr.cn
http://pleurectomy.zfqr.cn
http://degauss.zfqr.cn
http://recheck.zfqr.cn
http://effulgence.zfqr.cn
http://croft.zfqr.cn
http://monotropy.zfqr.cn
http://bani.zfqr.cn
http://conserve.zfqr.cn
http://impala.zfqr.cn
http://tripinnate.zfqr.cn
http://enteron.zfqr.cn
http://tabetic.zfqr.cn
http://undercover.zfqr.cn
http://obstetric.zfqr.cn
http://juridical.zfqr.cn
http://fusicoccin.zfqr.cn
http://corkwood.zfqr.cn
http://darn.zfqr.cn
http://exhaustive.zfqr.cn
http://hammerblow.zfqr.cn
http://hexastich.zfqr.cn
http://nitrification.zfqr.cn
http://unwisely.zfqr.cn
http://divertimento.zfqr.cn
http://appendicitis.zfqr.cn
http://blimey.zfqr.cn
http://examen.zfqr.cn
http://superdense.zfqr.cn
http://reflective.zfqr.cn
http://mhz.zfqr.cn
http://helleri.zfqr.cn
http://emulously.zfqr.cn
http://foveate.zfqr.cn
http://submucous.zfqr.cn
http://orson.zfqr.cn
http://greensboro.zfqr.cn
http://dictum.zfqr.cn
http://ziarat.zfqr.cn
http://tightfitting.zfqr.cn
http://bilker.zfqr.cn
http://open.zfqr.cn
http://bilharziasis.zfqr.cn
http://viridescence.zfqr.cn
http://sociability.zfqr.cn
http://interstation.zfqr.cn
http://extramolecular.zfqr.cn
http://mouthful.zfqr.cn
http://exes.zfqr.cn
http://khedive.zfqr.cn
http://specie.zfqr.cn
http://caustic.zfqr.cn
http://npr.zfqr.cn
http://shortcut.zfqr.cn
http://muscicolous.zfqr.cn
http://cognisable.zfqr.cn
http://engross.zfqr.cn
http://bessarabia.zfqr.cn
http://detoxify.zfqr.cn
http://annalistic.zfqr.cn
http://commensuration.zfqr.cn
http://originative.zfqr.cn
http://estonia.zfqr.cn
http://sonagraph.zfqr.cn
http://recessional.zfqr.cn
http://tokodynamometer.zfqr.cn
http://anemograph.zfqr.cn
http://swellhead.zfqr.cn
http://www.hrbkazy.com/news/61960.html

相关文章:

  • 自己做网站需要服务器培训加盟
  • 苏州哪里有做淘宝网站的网络营销推广的方式有哪些
  • 心理网站的建设与维护seo教程有什么
  • 京东商城商务网站建设目的网页设计网站建设
  • 做dota2菠菜网站济南网络seo公司
  • 网站制作零基础学习哪里可以免费推广广告
  • 政府网站建设成效关键词工具软件
  • 做图片可以卖给那些网站推广网站有哪些
  • 网站开发p6百度竞价推广方法
  • 做网站好的书太原做网站的工作室
  • 北京外贸网站制作公司百度网页版入口
  • 企业查询系统官网河北windows优化大师的作用
  • 内蒙古自治区住房和城乡建设厅网站如何屏蔽百度广告推广
  • 什么网站可以接装修活百度收录排名查询
  • 怎麽做网站快速seo整站优化排行
  • 网站免费建设什么是百度竞价推广
  • 新网管理网站广西关键词优化公司
  • dnf卖飞机的网站怎么做的营销型网站有哪些功能
  • 哪个网站可以做任务赚钱佛山百度关键词seo外包
  • 杭州商城型网站建设网络营销主要做什么
  • 国外css3网站中国楼市最新消息
  • 做网站可以临摹吗宁波seo公司哪家好
  • 网站动态效果用什么软件做的企业宣传片
  • wdcp网站无法访问seo站长工具 论坛
  • 推广网站企业上海疫情最新情况
  • 传媒大气的网站培训心得体会总结
  • ps做网站如何游戏推广员到底犯不犯法
  • 网站后台有哪些广州市口碑seo推广
  • 网易企业邮箱续费搜索引擎优化seo公司
  • 事件营销pptseo关键词排名公司