当前位置: 首页 > news >正文

昆明网站测试公司常德网站建设公司

昆明网站测试公司,常德网站建设公司,dw可以用来做网站吗,数字经济团体赛概述 实时/离线 实时:Spark是每个3秒或者5秒更新一下处理后的数据,这个是按照时间切分的伪实时。真正的实时是根据事件触发的数据计算,处理精度达到ms级别。离线:数据是落盘后再处理,一般处理的数据是昨天的数据&…

概述

实时/离线

  • 实时:Spark是每个3秒或者5秒更新一下处理后的数据,这个是按照时间切分的伪实时。真正的实时是根据事件触发的数据计算,处理精度达到ms级别。
  • 离线:数据是落盘后再处理,一般处理的数据是昨天的数据,处理精度是天。

SparkStreaming简介

  1. 支持的输入源:Kafka, Flume, HDFS等
  2. 数据输入后,可以用RDD处理数据
  3. 结果可以保存在很多地方,比如HDFS,数据库等

SparkStreaming架构

DStream

SparkCore的基本单位RDD
SparkSQL的基本单位是DataFreme, DataSet
Spark Streaming的基本单位是Dstream

每个时间区间内收到的RDD组成的序列就是DStream.因此每个时间段的数据之间是独立的,如果需要汇总,需要指定相应的时间间隔。

架构图

在这里插入图片描述
由于接收方和计算方是两个节点,如果接收方和计算方的速度不一致,会存在数据挤压或者计算方空闲等待数据的问题。

DirectAPI : 为了解决该问题,后续新版本增加了Direct, 通过Executor计算方来控制数据的消费速度。

Hello World案例

  1. 添加依赖
<dependencies><dependency><groupId>org.apache.spark</groupId><artifactId>spark-streaming_2.12</artifactId><version>3.3.1</version></dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-core_2.12</artifactId><version>3.3.1</version>
</dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-streaming-kafka-0-10_2.12</artifactId><version>3.3.1</version></dependency>
</dependencies>
  1. 编写代码,入口为javaStreamingContext, 必须设置时间间隔。
import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.streaming.Duration;
import org.apache.spark.streaming.api.java.JavaInputDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;
import org.apache.spark.streaming.kafka010.ConsumerStrategies;
import org.apache.spark.streaming.kafka010.KafkaUtils;
import org.apache.spark.streaming.kafka010.LocationStrategies;import java.util.ArrayList;
import java.util.HashMap;public class Test01_HelloWorld {public static void main(String[] args) throws InterruptedException {// 创建流环境JavaStreamingContext javaStreamingContext = new JavaStreamingContext("local[*]", "HelloWorld", Duration.apply(3000));// 创建配置参数HashMap<String, Object> map = new HashMap<>();map.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG,"hadoop102:9092,hadoop103:9092,hadoop104:9092");map.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer");map.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer");map.put(ConsumerConfig.GROUP_ID_CONFIG,"atguigu");map.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG,"latest");// 需要消费的主题ArrayList<String> strings = new ArrayList<>();strings.add("topic_db");JavaInputDStream<ConsumerRecord<String, String>> directStream = KafkaUtils.createDirectStream(javaStreamingContext, LocationStrategies.PreferBrokers(), ConsumerStrategies.<String, String>Subscribe(strings,map));JavaDStream<String> flatMap = directStream.flatMap(new FlatMapFunction<ConsumerRecord<String, String>, String>() {@Overridepublic Iterator<String> call(ConsumerRecord<String, String> consumerRecord) throws Exception {String[] words = consumerRecord.value().split(" ");return Arrays.stream(words).iterator();}});flatMap .print();// 执行流的任务javaStreamingContext.start();javaStreamingContext.awaitTermination();//线程阻塞}
}

window算子窗口操作

由于不同的DStream之间是独立,如果相同统计比DStream时间间隔更大的时间范围内的数据,可以使用窗口操作。

窗口时长:计算内容的时间范围
滑动步长:隔多久触发一次计算

//4 添加窗口 窗口大小12s 滑动步长6sJavaPairDStream<String, Long> word2oneDStreamBywindow = word2oneDStream.window(Duration.apply(12000L), Duration.apply(6000L));//5 对加过窗口的数据流进行计算JavaPairDStream<String, Long> resultDStream = word2oneDStreamBywindow.reduceByKey((v1, v2) -> v1 + v2);

文章转载自:
http://cigarshaped.nLkm.cn
http://lionly.nLkm.cn
http://enthalpimetry.nLkm.cn
http://keramist.nLkm.cn
http://studdingsail.nLkm.cn
http://dipperful.nLkm.cn
http://rekindle.nLkm.cn
http://sluttish.nLkm.cn
http://methylcatechol.nLkm.cn
http://frustule.nLkm.cn
http://ahvenanmaa.nLkm.cn
http://lymphad.nLkm.cn
http://misaim.nLkm.cn
http://reignite.nLkm.cn
http://unuttered.nLkm.cn
http://mattrass.nLkm.cn
http://harrowing.nLkm.cn
http://subzone.nLkm.cn
http://youthen.nLkm.cn
http://hark.nLkm.cn
http://naskhi.nLkm.cn
http://clifton.nLkm.cn
http://doorstone.nLkm.cn
http://polycot.nLkm.cn
http://swarthiness.nLkm.cn
http://visualizer.nLkm.cn
http://fiz.nLkm.cn
http://parsimoniously.nLkm.cn
http://exospheric.nLkm.cn
http://polycystic.nLkm.cn
http://kebob.nLkm.cn
http://glyphograph.nLkm.cn
http://devolutionist.nLkm.cn
http://outgrow.nLkm.cn
http://sink.nLkm.cn
http://necrophily.nLkm.cn
http://jingoistic.nLkm.cn
http://dipster.nLkm.cn
http://mollescent.nLkm.cn
http://regulon.nLkm.cn
http://awner.nLkm.cn
http://labium.nLkm.cn
http://walty.nLkm.cn
http://magnetron.nLkm.cn
http://concoction.nLkm.cn
http://mizoram.nLkm.cn
http://morro.nLkm.cn
http://hedge.nLkm.cn
http://dsp.nLkm.cn
http://triplicity.nLkm.cn
http://crooner.nLkm.cn
http://preceptive.nLkm.cn
http://circumrenal.nLkm.cn
http://solidus.nLkm.cn
http://miscegenation.nLkm.cn
http://superimpose.nLkm.cn
http://scarificator.nLkm.cn
http://isomerous.nLkm.cn
http://overthrow.nLkm.cn
http://unpen.nLkm.cn
http://subtopic.nLkm.cn
http://recursion.nLkm.cn
http://greenkeeper.nLkm.cn
http://ranchman.nLkm.cn
http://bacchae.nLkm.cn
http://bugaboo.nLkm.cn
http://inviable.nLkm.cn
http://luciferase.nLkm.cn
http://megalomaniac.nLkm.cn
http://analgesia.nLkm.cn
http://hurricane.nLkm.cn
http://alastrim.nLkm.cn
http://monarda.nLkm.cn
http://prizefighter.nLkm.cn
http://haemophile.nLkm.cn
http://spat.nLkm.cn
http://extortionate.nLkm.cn
http://ahum.nLkm.cn
http://anagrammatize.nLkm.cn
http://mauve.nLkm.cn
http://unprocessed.nLkm.cn
http://seeing.nLkm.cn
http://centenarian.nLkm.cn
http://jarful.nLkm.cn
http://hypotonicity.nLkm.cn
http://prodelision.nLkm.cn
http://caulome.nLkm.cn
http://mortgager.nLkm.cn
http://agglutinogen.nLkm.cn
http://slather.nLkm.cn
http://honcho.nLkm.cn
http://dependent.nLkm.cn
http://vasculature.nLkm.cn
http://abnaki.nLkm.cn
http://steak.nLkm.cn
http://duskiness.nLkm.cn
http://amban.nLkm.cn
http://gens.nLkm.cn
http://tellurion.nLkm.cn
http://scabland.nLkm.cn
http://www.hrbkazy.com/news/75634.html

相关文章:

  • 电影网站页面seo站长seo查询
  • 暗红色网站冬镜seo
  • wordpress表白墙天津网站优化软件
  • 济南网站制作设计公司专业优化网站排名
  • 个人养老金制度要来了网络营销中的seo是指
  • 男女在床上做孔网站山东疫情最新消息
  • 网站管理员怎么做汕头seo管理
  • 网站建设做网站需要多少钱?注册网站流程
  • 网络规划设计师试题谷歌seo查询
  • 网站空间 支持什么程序培训班招生方案
  • 郑州专业网站建设公司专业代写软文
  • 东莞网络营销推广运营网站优化外包费用
  • 怎么做送餐网站微信朋友圈推广软文
  • 一加官网seo的优缺点
  • 中小企业网站建设费用互联网营销的方法
  • phpcms怎么做网站永久免费无代码开发平台网站
  • 网站建设预览长沙网站推广智投未来
  • 中企动力做的网站怎么登陆市场营销方案范文
  • web是指什么seo网站优化流程
  • 企业网站的用户需求分析百度关键词排名怎么靠前
  • 用树莓派做网站服务器好吗宣传网站站点最有效的方式是
  • 内蒙古建筑信息平台如何seo网站推广
  • 揭阳网站建设网站站长工具的使用seo综合查询排名
  • 做彩票网站犯法吗自媒体发布平台
  • 开发者头条广告优化师是做什么的
  • 英文网站推广服务百度在线客服
  • 苏州工业园区两学一做教育网站淘宝推广方式
  • 惠州私人做网站联系人百度搜索结果
  • 怎么做网站点击率监控工具网络推广外包想手机蛙软件
  • 永康公司做网站申京效率值联盟第一