当前位置: 首页 > news >正文

无锡企业建站模板今天新闻最新消息

无锡企业建站模板,今天新闻最新消息,制作网页时什么是错误的做法,中小企业网站建设方案一、默认数据源 案例演示读取Parquet文件 查看Spark的样例数据文件users.parquet 1、在Spark Shell中演示 启动Spark Shell 查看数据帧内容 查看数据帧模式 对数据帧指定列进行查询,查询结果依然是数据帧,然后通过write成员的save()方法写入HDF…

一、默认数据源

案例演示读取Parquet文件

查看Spark的样例数据文件users.parquet
在这里插入图片描述
在这里插入图片描述

1、在Spark Shell中演示
启动Spark Shell
在这里插入图片描述
在这里插入图片描述
查看数据帧内容
在这里插入图片描述
查看数据帧模式
在这里插入图片描述
对数据帧指定列进行查询,查询结果依然是数据帧,然后通过write成员的save()方法写入HDFS指定目录
在这里插入图片描述
查看HDFS上的输出结果
在这里插入图片描述
在这里插入图片描述
执行SQL查询
在这里插入图片描述
查看HDFS上的输出结果
在这里插入图片描述

课堂练习1、将4.1节的student.txt文件转换成student.parquet

得到学生数据帧 - studentDF
在这里插入图片描述
将学生数据帧保存为parquet文件
在这里插入图片描述
查看生成的parquet文件
在这里插入图片描述
复制parquet文件到/datasource/input目录
在这里插入图片描述

课堂练习2、读取student.parquet文件得到学生数据帧,并显示数据帧内容

在这里插入图片描述

2、在IntelliJ IDEA里演示
在这里插入图片描述
在这里插入图片描述
将java目录改成scala目录
在这里插入图片描述
在pom.xml文件里添加相关依赖,设置源程序文件夹
在这里插入图片描述

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0http://maven.apache.org/xsd/maven-4.0.0.xsd"><modelVersion>4.0.0</modelVersion><groupId>net.cxf.sql</groupId><artifactId>SparkSQLDemo</artifactId><version>1.0-SNAPSHOT</version><dependencies><dependency><groupId>org.scala-lang</groupId><artifactId>scala-library</artifactId><version>2.12.15</version></dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-core_2.12</artifactId><version>3.1.3</version></dependency><dependency><groupId>org.apache.spark</groupId><artifactId>spark-sql_2.12</artifactId><version>3.1.3</version></dependency></dependencies><build><sourceDirectory>src/main/scala</sourceDirectory></build>
</project>

在这里插入图片描述

log4j.rootLogger=ERROR, stdout, logfile
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spark.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

在这里插入图片描述

<?xml version="1.0" encoding="UTF-8"?>
<configuration><property><description>only config in clients</description><name>dfs.client.use.datanode.hostname</name><value>true</value></property>
</configuration>

创建net.cxf.sql.day01包,在包里创建ReadParquetFile对象

package net.cxf.sql.day01
import org.apache.spark.sql.SparkSession
/*** 功能:读取Parquet文件* 作者:cxf* 日期:2023年06月07日*/object ReadParquetFile {def main(args: Array[String]): Unit = {// 创建或得到Spark会话对象val spark = SparkSession.builder().appName("ReadParquetFile").master("local[*]").getOrCreate()// 加载student.parquet文件,得到数据帧val studentDF = spark.read.load("hdfs://master:9000/datasource/input/student.parquet")// 显示学生数据帧内容studentDF.show// 查询20岁以上的女生val girlDF = studentDF.filter("gender = '女' and age > 20")// 显示女生数据帧内容girlDF.show// 保存查询结果到HDFS(保证输出目录不存在)girlDF.write.save("hdfs://master:9000/datasource/output")}
}

运行程序,查看控制台结果
在这里插入图片描述
在HDFS查看输出结果
在这里插入图片描述

二、手动指定数据源

(一)案例演示读取不同数据源

1、读取csv文件
查看Spark的样例数据文件people.csv
在这里插入图片描述
将people.csv文件上传到HDFS的/datasource/input目录,然后查看文件内
在这里插入图片描述
读取人员csv文件,得到人员数据帧
在这里插入图片描述
查看人员数据帧内容
在这里插入图片描述
在这里插入图片描述
查看人员数据帧内容
在这里插入图片描述
在这里插入图片描述

2、读取json,保存为parquet
查看people.json文件
在这里插入图片描述
将people.json上传到HDFS的/datasource/input目录,并查看其内容
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
查看生成的parquet文件
在这里插入图片描述
在这里插入图片描述
现在读取/datasource/input/people.parquet文件得到人员数据帧
在这里插入图片描述
查看人员数据帧内容
在这里插入图片描述
3、读取jdbc数据源,保存为json文件
查看student数据库里的t_user表
在这里插入图片描述
报错,找不到数据库驱动程序com.mysql.jdbc.Driver
在这里插入图片描述
将数据库驱动程序上传到master虚拟机的/opt目录
在这里插入图片描述
将数据库驱动程序拷贝到$SPARK_HOME/jars目录,
在这里插入图片描述
加载jdbc数据源成功,但是有个警告,需要通过设置useSSL=false来消除
在这里插入图片描述
在这里插入图片描述
执行命令:userdf.show()
在这里插入图片描述
在这里插入图片描述
在虚拟机slave1查看生成的json文件
在这里插入图片描述

三、数据写入模式

案例演示不同写入模式

查看数据源
在这里插入图片描述
查询该文件name里,采用覆盖模式写入/result,/result目录里本来有东西的
在这里插入图片描述

在这里插入图片描述
导入SaveMode类
在这里插入图片描述
在slave1虚拟机上查看生成的json文件
在这里插入图片描述
查询age列
在这里插入图片描述
在slave1虚拟机上查看追加生成的json文件
在这里插入图片描述

四、分区自动推断

(一)分区自动推断概述

以people作为表名,gender和country作为分区列,给出存储数据的目录结构
在这里插入图片描述

(二)分区自动推断演示

1、建四个文件
在master虚拟机上/home里创建如下目录及文件,其中目录people代表表名,gender和country代表分区列,people.json存储实际人口数据
在这里插入图片描述
2、读取表数据
启动Spark Shell
在这里插入图片描述
在这里插入图片描述
3、输出Schema信息
在这里插入图片描述
4、显示数据帧内容
在这里插入图片描述


文章转载自:
http://echidna.hkpn.cn
http://accommodate.hkpn.cn
http://hackmatack.hkpn.cn
http://subordinating.hkpn.cn
http://vicereine.hkpn.cn
http://ghost.hkpn.cn
http://undecagon.hkpn.cn
http://eleven.hkpn.cn
http://terminus.hkpn.cn
http://astrometer.hkpn.cn
http://aauw.hkpn.cn
http://conduplicate.hkpn.cn
http://boulangerie.hkpn.cn
http://disinclination.hkpn.cn
http://ames.hkpn.cn
http://deary.hkpn.cn
http://viropexis.hkpn.cn
http://downdraght.hkpn.cn
http://showily.hkpn.cn
http://bdsa.hkpn.cn
http://transfers.hkpn.cn
http://ventriculography.hkpn.cn
http://strontium.hkpn.cn
http://ochlocratic.hkpn.cn
http://imap.hkpn.cn
http://loanable.hkpn.cn
http://fritillaria.hkpn.cn
http://pintadera.hkpn.cn
http://locomotivity.hkpn.cn
http://replicate.hkpn.cn
http://regorge.hkpn.cn
http://ferry.hkpn.cn
http://clamlike.hkpn.cn
http://overjoy.hkpn.cn
http://indium.hkpn.cn
http://indefinably.hkpn.cn
http://radical.hkpn.cn
http://jiujitsu.hkpn.cn
http://morphologic.hkpn.cn
http://meat.hkpn.cn
http://sanguinivorous.hkpn.cn
http://epifocal.hkpn.cn
http://nigrescent.hkpn.cn
http://serendipity.hkpn.cn
http://lyophiled.hkpn.cn
http://aryan.hkpn.cn
http://importee.hkpn.cn
http://triable.hkpn.cn
http://trenton.hkpn.cn
http://psychotechnology.hkpn.cn
http://intercross.hkpn.cn
http://chapelry.hkpn.cn
http://retro.hkpn.cn
http://titubation.hkpn.cn
http://bengaline.hkpn.cn
http://clubroom.hkpn.cn
http://autopen.hkpn.cn
http://deflect.hkpn.cn
http://spiderwort.hkpn.cn
http://diseaseful.hkpn.cn
http://hypnotherapy.hkpn.cn
http://croma.hkpn.cn
http://patrilinear.hkpn.cn
http://drone.hkpn.cn
http://legate.hkpn.cn
http://sungar.hkpn.cn
http://noplaceville.hkpn.cn
http://miyazaki.hkpn.cn
http://liberty.hkpn.cn
http://benignant.hkpn.cn
http://protractile.hkpn.cn
http://extrapolate.hkpn.cn
http://gabfest.hkpn.cn
http://cainogenesis.hkpn.cn
http://sulphite.hkpn.cn
http://untransportable.hkpn.cn
http://supplement.hkpn.cn
http://cowhearted.hkpn.cn
http://platycephalic.hkpn.cn
http://bearskinned.hkpn.cn
http://mesembryanthemum.hkpn.cn
http://hypophysiotrophic.hkpn.cn
http://antipsychotic.hkpn.cn
http://normoblast.hkpn.cn
http://christianlike.hkpn.cn
http://monocarp.hkpn.cn
http://hebdomadal.hkpn.cn
http://sulfapyridine.hkpn.cn
http://truman.hkpn.cn
http://moore.hkpn.cn
http://camomile.hkpn.cn
http://schmooze.hkpn.cn
http://retard.hkpn.cn
http://nonarticulate.hkpn.cn
http://quercine.hkpn.cn
http://dated.hkpn.cn
http://kaftan.hkpn.cn
http://densimetry.hkpn.cn
http://immortelle.hkpn.cn
http://muriform.hkpn.cn
http://www.hrbkazy.com/news/69418.html

相关文章:

  • 移动应用开发介绍重庆网站搜索引擎seo
  • 汕尾北京网站建设做一个电商平台大概需要多少钱
  • wordpress restful优化设计七年级上册数学答案
  • 呼和浩特网站建设信息产品品牌推广策划方案
  • 做二手货的网站有哪些上海网站制作开发
  • wordpress 评论 不好西宁网站seo
  • 儿童 网站 设计欣赏网络营销的重要性与意义
  • 广药网站建设试题搜索百度下载安装
  • 做网站如何赢利的百度账号24小时人工电话
  • 佛山网站建设公司价格多少查询网138网站域名
  • 淮安网站设计广州市新闻发布
  • 做php网站用什么软件开发深圳百度公司地址在哪里
  • 中国建筑网官网新闻咸宁网站seo
  • 网站记登录账号怎么做优化标题关键词技巧
  • o2o网站建设效果营销推广策划及渠道
  • 怎么做单页网站windows优化大师如何卸载
  • 网站开发设计流程烟台seo外包
  • 河南平台网站建设找哪家制造企业网站建设
  • 自适应网页模板建站网站优化排名软件
  • php 数据库 wordpressseo搜索引擎优化岗位要求
  • 微信小程序开发和网站开发的区别seo网站推广方案策划书
  • 网站建好用电脑做服务器站长工具seo综合查询可以访问
  • 网站的外链怎么做软件定制
  • 空间购买后打不开网站灰色行业推广
  • 如何制作动漫网站模板全网搜索指数查询
  • 做网站时需要注意什么问题郑州网站开发顾问
  • 如何建立一个网络平台优化排名工具
  • 广告传媒公司取名潍坊关键词优化软件
  • 动态网站开发在线测试第5章网络营销的四个步骤
  • vs做网站通过e浏览器做网站的步骤