当前位置: 首页 > news >正文

潍坊网站设计好处苏州网站建设流程

潍坊网站设计好处,苏州网站建设流程,网站建设用那个软件,创建一个app需要多少钱一、sparkStreaming的不足 1.基于微批,延迟高不能做到真正的实时 2.DStream基于RDD,不直接支持SQL 3.流批处理的API应用层不统一,(流用的DStream-底层是RDD,批用的DF/DS/RDD) 4.不支持EventTime事件时间#xff08;一般流处理都会有两个时间#xff1a;事件发生的事件一般流处理都会有两个时间事件发生的事件一个是事件处理的时间 5.数据的Exactly-Once(恰好一次语义)需要手动实现 二、StructuredStreaming 的介绍  1、2016年Spark2.0版本中发布 2、基于SparkSQL引擎的可扩展、容错的全新的流处理引擎。 3、并不是对Spark Streaming的简单改进而是重新开发的全新流式引擎 准实时技术来一批处理一批 实时来一条处理一条 离线一般都是处理一些静止的数据 三、socketconsole 1、在虚拟机中下载nc yum install -y nc2、启动 nc -lk 9999 案例wordcount import osfrom pyspark.sql import SparkSession from pyspark.sql.functions import explode import pyspark.sql.functions as F if __name__ __main__:os.environ[JAVA_HOME] E:/java-configuration/jdk-8# 配置Hadoop的路径就是前面解压的那个路径os.environ[HADOOP_HOME] E:/applications/bigdata_config/hadoop-3.3.1/hadoop-3.3.1# 配置base环境Python解析器的路径os.environ[PYSPARK_PYTHON] C:/Users/35741/miniconda3/python.exe# 配置base环境Python解析器的路径os.environ[PYSPARK_DRIVER_PYTHON] C:/Users/35741/miniconda3/python.exe# 创建一个sparkSession对象spark SparkSession.builder.appName(socketDemo).getOrCreate()socketDf spark.readStream.format(socket) \.option(host, bigdata01) \.option(port, 9999) \.load()# 处理# 方式一使用dsl语法splitDf socketDf.select(explode(F.split(socketDf.value, )).alias(word))resultDf1 splitDf.groupBy(word).count()# 方式二使用sqlsocketDf.createOrReplaceTempView(wordcount)resultDf2 spark.sql(with t1 as( select num from wordcount lateral view explode(split(value, )) c as num)select num,count(*) counts from t1 group by num;)# 下面的就是sink的写法 后续会写query1 resultDf1.writeStream \.outputMode(complete) \.format(console) \.start()query2 resultDf2.writeStream \.outputMode(complete) \.format(console) \.start() \.awaitTermination()spark.stop() 四、fileconsole 文件中的数据 1;yuwen;43 1;shuxue;55 2;yuwen;77 2;shuxue;88 3;yuwen;98 3;shuxue;65 3;yingyu;88 import osfrom pyspark.sql import SparkSessionfrom pyspark.sql.types import StructField, StringType, DoubleType, LongType, IntegerType, StructTypeif __name__ __main__:os.environ[JAVA_HOME] E:/java-configuration/jdk-8# 配置Hadoop的路径就是前面解压的那个路径os.environ[HADOOP_HOME] E:/applications/bigdata_config/hadoop-3.3.1/hadoop-3.3.1# 配置base环境Python解析器的路径os.environ[PYSPARK_PYTHON] C:/Users/35741/miniconda3/python.exe# 配置base环境Python解析器的路径os.environ[PYSPARK_DRIVER_PYTHON] C:/Users/35741/miniconda3/python.exe# 创建一个sparkSession对象spark SparkSession.builder.appName(socketDemo).getOrCreate()# score_schema StructType([# StructField(namestu_id, dataTypeIntegerType(), nullableFalse),# StructField(namesubject_name, dataTypeStringType(), nullableTrue),# StructField(namescore, dataTypeDoubleType(), nullableTrue)# ])score_schema StructType().add(stu_id, IntegerType()).add(subject_name, StringType()).add(score,DoubleType())socketDf spark.readStream.format(csv) \.option(sep, ;) \.schema(score_schema) \.load(../../resources/input1)socketDf.writeStream \.outputMode(append) \.format(console) \.option(truncate, False) \.start() \.awaitTermination()spark.stop()
http://www.hkea.cn/news/14275832/

相关文章:

  • 网站备案修改域名ipwordpress 百度联盟
  • 杭州网站搭建公司商业网站建设试题
  • 金融理财管理网站源码 dedecms资源型网站建设 需要多大硬盘
  • 网站开发配置网站建设 招聘需求
  • 备案网站名称重复进入qq空间登录
  • 网站首页在哪个文件夹电影网站建设方案ppt模板
  • 建设企业网站企业网上银行助手下载盘锦兴隆台住房和城乡建设网站
  • 静态网站模板源码下载零基础学设计
  • 360官方网站内江市住房和城乡建设局网站电话号码
  • 网站建设php有哪些校园宿舍网网络设计案例
  • 用asp做网站的可行性分析seo 排名 优化
  • 长沙做网站备案成都装修网站设计
  • 公司没网站怎么做dsp专业做网站建设公司好吗
  • 避免网站侵权php网站开发多线程开发
  • 青岛高端网站制作公司传奇游戏网页
  • 社交网站上的商城怎么做六安人社局网站
  • 电商网站 解决方案上海高端网站建设高端网站建设
  • 家装e站wordpress区块链快讯模板
  • wordpress 整站移植网站建设要考
  • 湖北专业的网站制作代理商自建商城网站
  • 哪些网站做装修精品下载站
  • 高职思政主题网站建设作用宁波网站制作公司排名
  • 查企业去哪个网站二手商品交易网站开发
  • 个体户 网站建设百度官网app下载安装
  • 怎么诊断网站wap站是什么意思啊
  • 做网站主页上主要放哪些内容体验营销案例
  • 新邱建设网站青岛鑫隆建设集团网站
  • 网站怎么做充值系统淘宝运营培训机构排名
  • 西安网站建设设计的好公司排名如何做切片网站
  • asp网站路径企业黄页信息网