当前位置: 首页 > news >正文

网站建设 外文文献室内设计专业作品集

网站建设 外文文献,室内设计专业作品集,做百度推广多少钱,在哪些网站上发外链好文章目录 前言一、现象二、结论三、解决 前言 窗口没有关闭计算的问题#xff0c;一直困扰了很久#xff0c;经过多次验证#xff0c;确定了问题的根源。 一、现象 Flink使用了window#xff0c;同时使用了watermark #xff0c;并且还设置了较高的并行度。生产是设置了… 文章目录 前言一、现象二、结论三、解决 前言 窗口没有关闭计算的问题一直困扰了很久经过多次验证确定了问题的根源。 一、现象 Flink使用了window同时使用了watermark 并且还设置了较高的并行度。生产是设置了300的并行度并且接入了几十个topic 这个地方划重点后面会提到。结果就是窗口没有关闭进行计算。于是我查阅的相关文档得到的答案是因为配置的源并行度大于topic的分区数而导致。这个答案只能说很接近而且我最开始也觉得很有道理。 解释一下watermark window的原理 可以看到前面三个窗口里面都有数据窗口触发计算的其中一个必要条件是最新的数据没过最低的水位线就进行计算认为不会再有乱序的数据进来了。但是从图中我们可以看到其中一个窗口一个数据都没有就会导致拿不到所有窗口的最低水位线。因此也就无法触发计算。 为了验证这一法则 我在测试环境配置了一个并行度为10的程序topic只有一个分区启动任务的时候我信誓旦旦地保证这不可能关闭窗口进行计算然而现实狠狠打了我一巴掌窗口结果算出来了。虽然只是三言两语实际上我做了很多尝试只是其他的实验不重要都是证明我是错的 于是通过比较的方法想到和生产的情况不同就在于生产消费了几十个topic而我的测试只有一个topic于是我再次坚信问题一定就在这了。 我直接在idea进行测试 我配置了两个topic并且在一开始只往第一个topic中写数据而第二个topic不写数据 很好跑了一整个中午一次窗口聚合计算都没有。 此时进行最后一步验证就是往第二个topic写数据。 我在这个时间往第二个topic发了数据 collectTime:1697693856606为了让大家看清楚现象我把日志和截图都给出来 2023-10-19 13:37:32.699 [Legacy Source Thread - Source: Custom Source - Flat Map - (Flat Map - Flat Map - Sink: Unnamed, Timestamps/Watermarks - (Flat Map, Flat Map, Flat Map)) (10/16)#0] INFO c.a.c.d.risk.domain.function.IndicatrixMapFunction - 【通过】滑动窗口前置数据处理 2023-10-19 13:37:32.805 [Window(TumblingEventTimeWindows(60000), EventTimeTrigger, CountAverageFunction, LogResultWindowFunction) (13/16)#0] INFO com.ai.cass.dc.risk.re.idxSend.IdxSend - 聚合时存储指标结果,calcTypeCode:FrequencyOccurStttc key:ff83d41c-335f-405d-88e7-f5285aecdcf5a1123 Value:8 2023-10-19 13:37:32.805 [Window(TumblingEventTimeWindows(60000), EventTimeTrigger, CountAverageFunction, LogResultWindowFunction) (13/16)#0] INFO com.ai.cass.dc.risk.re.idxSend.IdxSend - 聚合时存储指标结果,calcTypeCode:FrequencyOccurStttc key:ff83d41c-335f-405d-88e7-f5285aecdcf5a1123 Value:27 2023-10-19 13:37:32.805 [Window(TumblingEventTimeWindows(60000), EventTimeTrigger, CountAverageFunction, LogResultWindowFunction) (13/16)#0] INFO com.ai.cass.dc.risk.re.idxSend.IdxSend - 聚合时存储指标结果,calcTypeCode:FrequencyOccurStttc key:ff83d41c-335f-405d-88e7-f5285aecdcf5a1123 Value:28 2023-10-19 13:37:32.805 [Window(TumblingEventTimeWindows(60000), EventTimeTrigger, CountAverageFunction, LogResultWindowFunction) (13/16)#0] INFO com.ai.cass.dc.risk.re.idxSend.IdxSend - 聚合时存储指标结果,calcTypeCode:FrequencyOccurStttc key:ff83d41c-335f-405d-88e7-f5285aecdcf5a1123 Value:17 2023-10-19 13:37:32.805 [Window(TumblingEventTimeWindows(60000), EventTimeTrigger, CountAverageFunction, LogResultWindowFunction) (13/16)#0] INFO com.ai.cass.dc.risk.re.idxSend.IdxSend - 聚合时存储指标结果,calcTypeCode:FrequencyOccurStttc key:ff83d41c-335f-405d-88e7-f5285aecdcf5a1123 Value:20证明就是在这个时间节点上窗口计算处理结果 二、结论 因此我就可以大胆地推断是因为多个topic进行了数据消费其中有个topic数据会进入窗口进行计算但有的窗口又永远不会有数据进入计算这就造成对应的窗口永远没有最低的watermark以致于窗口无法关闭并计算。 三、解决 既然问题找到了那解决办法就随之而生 1、如果可以不使用水印直接关闭水印即可只要消费的数据不会积压并且要求没那么高的话这个方法最简单2、减小并行度到能够使得每个窗口都有数据减小并行度会让不同topic用同一个窗口至于这个数量那还得研究研究了3、把需要到窗口和不到窗口计算的数据进行分流4、也可以把源与后面算子之间采用rebalance的方式传递这样就能够轮询的方式往下传递使得每个window都会有数据这里有一点一定要注意rebalance必须放在watermark之前才可以。
http://www.hkea.cn/news/14446375/

相关文章:

  • 河北省住房和城市建设局采购网站企业网站维护是指
  • 网站友情链接济宁有做企业网站吗
  • 连云港做网站优化网站建设深圳赶集网
  • 手机wap网站模板 带后台安卓系统最好优化软件
  • 辽宁省朝阳网站建设墓地网站建设价格
  • 专业做网站的网站重庆网站建设网页设计
  • 统一门户网站餐饮网站程序
  • 做服装有哪些好的网站有哪些方面制作芝士需要哪些设备
  • 豆各庄网站建设软文平台
  • seo网站排名的软件wordpress提醒美化
  • 潍坊网站建设求职简历怎样把网站做的好看
  • 自建手机网站营销网站制作
  • .net网站开发模板网站不要了该如何处理
  • 网络竞价托管公司做360网站优化快速排
  • wordpress接入支付宝网站同时做竞价和优化可以吗
  • 无法连接到wordpress站点竞价账户托管公司哪家好
  • 外国人做中国数学视频网站建筑网站 知乎
  • 网站分站如何做室内设计效果图一套方案
  • 宿迁网站建设流程如何评估一个网站
  • 图片展示网站建设吉林省住房城乡建设厅网站首页
  • 寺庙 网站建设长沙网站设计流程
  • qq网站临时会话怀化网站优化推荐
  • 成都网站设计哪家比较好如何写一个wordpress主题
  • 多站点wordpress简数采集器微信公众号内置手机网站
  • 大学生ppt模板免费下载 素材网站建设排名优化公司
  • 海南省住房和城市建设厅网站ps软件破解版
  • 做网站做电脑版还是手机版好工程行业网站
  • 企业官方网站建设的作用网站制作的困难和解决方案
  • 东莞微网站建设公司网站设计赚钱吗
  • 网站后台这么做视频教程wordpress模版 导入帝国