当前位置: 首页 > news >正文

徐州做网站的公司有哪些长宁区网站建设公司

徐州做网站的公司有哪些,长宁区网站建设公司,建网站需要什么,网站建设的重要性意义WATERMARK 定义了表的事件时间属性#xff0c;其形式为: WATERMARK FOR rowtime_column_name AS watermark_strategy_expression rowtime_column_name 把一个现有的列定义为一个为表标记事件时间的属性。该列的类型必须为 TIMESTAMP(3)/TIMESTAMP_LTZ(3)#xff0c;且是 sche…WATERMARK 定义了表的事件时间属性其形式为: WATERMARK FOR rowtime_column_name AS watermark_strategy_expression rowtime_column_name 把一个现有的列定义为一个为表标记事件时间的属性。该列的类型必须为 TIMESTAMP(3)/TIMESTAMP_LTZ(3)且是 schema 中的顶层列它也可以是一个计算列。 watermark是触发计算的机制只要事件时间 watermark就会触发当前行数据的计算watermark的形象描述如下 watermark的窗口触发机制 watermark会根据数据流中event的时间戳发生变化。通常情况下event都是乱序的不按时间排序的。watermark的计算逻辑为当前最大的 event time - 最大允许延迟时间MaxOutOfOrderness。在同一个分区内部当watermark大于或者等于窗口的结束时间时才能触发该窗口的计算即watermarkwindows endtime。如下图所示 根据上图分析 MaxOutOfOrderness 5s窗口的大小为10s。 watermark分别为12:08、12:15、12:30 计算逻辑为WM(12:08)12:13 - 5sWM(12:15)12:20 - 5sWM(12:30)12:35 - 5s 对于 [12:00,12:10 窗口需要在WM12:15时才能被触发计算参与计算的event为event(12:07)/event(12:01)/event(12:07)/event(12:09)event(12:10)/event(12:12)/event(12:12)/event(12:13)/event(12:20)/event(12:14)/event(12:15)不参与计算因为还未到窗口时间也就是event time 为 [12:00,12:10] 窗口内的event才能参与计算。 注意如果过了这个窗口期再收到 [12:00,12:10] 窗口内的event就算超过了最大允许延迟时间MaxOutOfOrderness不会再参与计算也就是数据被强制丢掉了。对于 [12:10,12:20] 和 [12:20,12:30] 窗口会在WM12:30时被同时触发计算参与**[12:10,12:20]** 窗口计算的event为event(12:10)/event(12:12)/event(12:12)/event(12:13)/event(12:14)/event(12:15)/event(12:15)/event(12:18)参与 [12:20,12:30] 窗口计算的event为event(12:20)/event(12:20)在这个过程中event(12:05)会被丢弃不会参与计算因为已经超了最大允许延迟时间MaxOutOfOrderness 迟到的事件的处理在介绍watermark时提到了现实中往往处理的是乱序event即当event处于某些原因而延后到达时往往会发生该event time watermark的情况所以flink对处理乱序event的watermark有一个允许延迟的机制这个机制就是最大允许延迟时间MaxOutOfOrderness允许在一定时间内迟到的event仍然视为有效event。 WATERMARK rowtime_column_name 取值两种方式 rowtime_column_name为计算列 CREATE TABLE pageviews (mid bigint,db string,sch string,tab string,opt string,ts bigint,ddl string,err string,src map string, string ,cur map string, string ,cus map string, string ,event_time as cast(TO_TIMESTAMP_LTZ(ts,3) AS TIMESTAMP(3)), --计算列必须为TIMESTAMP(3)/TIMESTAMP_LTZ(3)类型WATERMARK FOR event_time AS event_time - INTERVAL 60 SECOND ) WITH (connector kafka,properties.bootstrap.servers ***,topic topic1,format json,properties.group.id *****,scan.startup.mode earliest-offset-- 取值 : group-offsets latest-offset earliest-offset );rowtime_column_name为事件时间属性 CREATE TABLE dataGen(uuid VARCHAR(20),name INT,age INT,ts TIMESTAMP(3), --事件时间属性字段类型为TIMESTAMP(3)WATERMARK FOR ts AS ts )with(connector datagen,rows-per-second 10,number-of-rows 100,fields.age.kind random,fields.age.min 1,fields.age.max 10,fields.name.kind random,fields.name.min 1,fields.name.max 10);watermark使用demo CREATE TABLE kafka_table(mid bigint,db string,sch string,tab string,opt string,ts bigint,ddl string,err string,src map string, string ,cur map string, string ,cus map string, string ,group_name as COALESCE(cur[group_name], src[group_name]),batch_number as COALESCE(cur[batch_number], src[batch_number]),event_time as cast(TO_TIMESTAMP_LTZ(ts,3) AS TIMESTAMP(3)), -- TIMESTAMP(3)/TIMESTAMP_LTZ(3)WATERMARK FOR event_time AS event_time - INTERVAL 2 MINUTE --SECOND ) WITH (connector kafka,properties.bootstrap.servers ***,topic topic1,format json,properties.group.id *****,scan.startup.mode earliest-offset-- 取值 : group-offsets latest-offset earliest-offset );watermark在over聚合中的使用 --RANGE每个group_name计算当前group_name前10分钟内收到的同一group_name的所有总数 selectgroup_name ,event_time ,COUNT(group_name) OVER w1 as cnt from kafka_table where UPPER(opt) DELETE WINDOW w1 AS (PARTITION BY group_nameORDER BY event_timeRANGE BETWEEN INTERVAL 10 MINUTE PRECEDING AND CURRENT ROW)watermark在windows聚合中的使用 --求每10分钟的滚动窗口内同一group_name的所有总数 create view tmp as SELECT group_name,event_time FROM kafka_table where UPPER(opt) DELETE;select window_start,window_end,window_time,group_name,count(*) as cnt from TABLE(TUMBLE(TABLE tmp, DESCRIPTOR(event_time), INTERVAL 10 MINUTES)) group by window_start,window_end,window_time,group_name参考 Window Aggregation Over Aggregation
http://www.hkea.cn/news/14375191/

相关文章:

  • 网站什么做的精品网站建设
  • dedecms导航网站电子商务公司网站怎么建
  • 南宁网站推广流程公司关键词排名优化
  • 安徽黄山网站建设小程序搭建系统
  • 网站在哪里变更备案信息网络公司什么意思
  • 网站建设的视频教程wordpress+调用多媒体
  • 贵州网站建设设计南昌做企业网站
  • 怎么做网站上打字体宁波外贸公司电话名单
  • 网站建设推进情况哈尔滨怎样快速建站
  • 微信的网站怎么做洛阳青峰网络公司做网站
  • 网站开发财务费用网站 wap
  • 国内卡一卡二卡三网站视频在线支付的网站怎么做
  • 徐州做网站的公司有几家工作细胞第一季
  • 有没有网站做胡兼职上海最好网站建设公司
  • 网站seo优化查询怎么看网站的建站公司是哪个
  • 高端网站设计公司广告策划方案
  • 新公司网站怎么做推广东营网站建设那家好
  • 有哪些做软件的网站传奇新服网
  • 网站做什么推广好类似头条的网站怎么做
  • 自己做网站导航页wordpress导航怎么添加连接
  • 网站架构的组成部分智慧团建登录网站入口
  • 中型网站每天访问量seo的优化方案
  • 网站页面相关产品链接怎么做网站策划的基本过程
  • 佛山学校网站建设中信建设有限责任公司中标公示
  • 网站开发用啥语言他达拉非片说明书
  • 重庆丰标建设网站多语言企业网站建设
  • 白云网站建设价格上小学网站建设
  • Wix网站开发 工作室个人主页建站
  • 网站建设群网站logo尺寸一般多大
  • cod单页建站工具天津网络广告公司