当前位置: 首页 > news >正文

要加强网站内容建设有没有免费的微网站

要加强网站内容建设,有没有免费的微网站,企业文化怎么写,潍坊网站建设 世纪环球16楼一、默认数据源 案例演示读取Parquet文件 查看Spark的样例数据文件users.parquet 1、在Spark Shell中演示 启动Spark Shell 查看数据帧内容 查看数据帧模式 对数据帧指定列进行查询#xff0c;查询结果依然是数据帧#xff0c;然后通过write成员的save()方法写入HDF…一、默认数据源 案例演示读取Parquet文件 查看Spark的样例数据文件users.parquet 1、在Spark Shell中演示 启动Spark Shell 查看数据帧内容 查看数据帧模式 对数据帧指定列进行查询查询结果依然是数据帧然后通过write成员的save()方法写入HDFS指定目录 查看HDFS上的输出结果 执行SQL查询 查看HDFS上的输出结果 课堂练习1、将4.1节的student.txt文件转换成student.parquet 得到学生数据帧 - studentDF 将学生数据帧保存为parquet文件 查看生成的parquet文件 复制parquet文件到/datasource/input目录 课堂练习2、读取student.parquet文件得到学生数据帧并显示数据帧内容 2、在IntelliJ IDEA里演示 在这里插入图片描述 将java目录改成scala目录 在pom.xml文件里添加相关依赖设置源程序文件夹 ?xml version1.0 encodingUTF-8? project xmlnshttp://maven.apache.org/POM/4.0.0xmlns:xsihttp://www.w3.org/2001/XMLSchema-instancexsi:schemaLocationhttp://maven.apache.org/POM/4.0.0http://maven.apache.org/xsd/maven-4.0.0.xsdmodelVersion4.0.0/modelVersiongroupIdnet.cxf.sql/groupIdartifactIdSparkSQLDemo/artifactIdversion1.0-SNAPSHOT/versiondependenciesdependencygroupIdorg.scala-lang/groupIdartifactIdscala-library/artifactIdversion2.12.15/version/dependencydependencygroupIdorg.apache.spark/groupIdartifactIdspark-core_2.12/artifactIdversion3.1.3/version/dependencydependencygroupIdorg.apache.spark/groupIdartifactIdspark-sql_2.12/artifactIdversion3.1.3/version/dependency/dependenciesbuildsourceDirectorysrc/main/scala/sourceDirectory/build /project log4j.rootLoggerERROR, stdout, logfile log4j.appender.stdoutorg.apache.log4j.ConsoleAppender log4j.appender.stdout.layoutorg.apache.log4j.PatternLayout log4j.appender.stdout.layout.ConversionPattern%d %p [%c] - %m%n log4j.appender.logfileorg.apache.log4j.FileAppender log4j.appender.logfile.Filetarget/spark.log log4j.appender.logfile.layoutorg.apache.log4j.PatternLayout log4j.appender.logfile.layout.ConversionPattern%d %p [%c] - %m%n?xml version1.0 encodingUTF-8? configurationpropertydescriptiononly config in clients/descriptionnamedfs.client.use.datanode.hostname/namevaluetrue/value/property /configuration 创建net.cxf.sql.day01包在包里创建ReadParquetFile对象 package net.cxf.sql.day01 import org.apache.spark.sql.SparkSession /*** 功能读取Parquet文件* 作者cxf* 日期2023年06月07日*/object ReadParquetFile {def main(args: Array[String]): Unit {// 创建或得到Spark会话对象val spark SparkSession.builder().appName(ReadParquetFile).master(local[*]).getOrCreate()// 加载student.parquet文件得到数据帧val studentDF spark.read.load(hdfs://master:9000/datasource/input/student.parquet)// 显示学生数据帧内容studentDF.show// 查询20岁以上的女生val girlDF studentDF.filter(gender 女 and age 20)// 显示女生数据帧内容girlDF.show// 保存查询结果到HDFS保证输出目录不存在girlDF.write.save(hdfs://master:9000/datasource/output)} } 运行程序查看控制台结果 在HDFS查看输出结果 二、手动指定数据源 一案例演示读取不同数据源 1、读取csv文件 查看Spark的样例数据文件people.csv 将people.csv文件上传到HDFS的/datasource/input目录然后查看文件内 读取人员csv文件得到人员数据帧 查看人员数据帧内容 查看人员数据帧内容 2、读取json保存为parquet 查看people.json文件 将people.json上传到HDFS的/datasource/input目录并查看其内容 查看生成的parquet文件 现在读取/datasource/input/people.parquet文件得到人员数据帧 查看人员数据帧内容 3、读取jdbc数据源保存为json文件 查看student数据库里的t_user表 报错找不到数据库驱动程序com.mysql.jdbc.Driver 将数据库驱动程序上传到master虚拟机的/opt目录 将数据库驱动程序拷贝到$SPARK_HOME/jars目录 加载jdbc数据源成功但是有个警告需要通过设置useSSLfalse来消除 执行命令userdf.show() 在虚拟机slave1查看生成的json文件 三、数据写入模式 案例演示不同写入模式 查看数据源 查询该文件name里采用覆盖模式写入/result/result目录里本来有东西的 导入SaveMode类 在slave1虚拟机上查看生成的json文件 查询age列 在slave1虚拟机上查看追加生成的json文件 四、分区自动推断 一分区自动推断概述 以people作为表名gender和country作为分区列给出存储数据的目录结构 二分区自动推断演示 1、建四个文件 在master虚拟机上/home里创建如下目录及文件其中目录people代表表名gender和country代表分区列people.json存储实际人口数据 2、读取表数据 启动Spark Shell 3、输出Schema信息 4、显示数据帧内容
http://www.hkea.cn/news/14571482/

相关文章:

  • 建设银行平潭招聘网站网站建设的机构
  • 石家庄网站设计工作室招聘网站建设的目的
  • 做黄图网站接广告好赚吗海外推广营销
  • 网站项目开发案国外免费logo设计网站
  • wordpress网站如何播放视频如何查询网站是不是asp做的
  • 惠州网站建设学校建设部网站燃气管理部门
  • 安微省建设厅田网站wordpress首页文章带图
  • 建设行业的门户网站常州建设局下属网站
  • 媒体135网站湖北省建设银行网站6
  • 南山网站建设哪家好做贷款网站犯法
  • 一个公司备案两个网站网址大全2345色综合导航
  • 做网站来钱快微信营销平台
  • 东莞关键词优化代理德州网站优化
  • 如何做棋牌网站有没有做英语题的网站
  • 安徽网站建设外贸丽水专业网站建设价格
  • 国内男女直接做的视频网站wordpress和apache
  • 免费企业信息查询网站wordpress阅读主题
  • 要怎么做网站安顺做网站的公司
  • 房建设计图网站如何为wordpress加评论
  • 做母婴的网站有哪些成都品牌设计
  • 综述题建设网站需要几个步骤做app 的模板下载网站有哪些内容
  • 怎么在企业站建立网站吗建设网站 注册与登陆
  • php网站开发遇到的问题商贸有限公司怎么样注册
  • 做网站设计哪里有信誉好的做pc端网站
  • 怎样做自己的摄影网站成都设计院招聘
  • 佛山市网站建设 乾图信息科技网上如何建网站卖量具
  • html的制作网站的优点代做财务报表分析网站
  • .net网站费用wordpress采集发布
  • windows2008 iis 网站配置合肥网站到首页排名
  • 友情链接网站大全提供网站制作公司电话