当前位置: 首页 > news >正文

如何计算网站pv连云港网站建设费用

如何计算网站pv,连云港网站建设费用,装修方案,上海网站建设褐公洲司以前总是说笛卡尔积#xff0c;笛卡尔积#xff0c;没碰到过#xff0c;今天在跑流程调度时#xff0c;就碰到笛卡尔积了#xff0c;本来#xff0c;就是查询几个编码的信息#xff0c;然后由于使用的是with tmp as#xff0c;没使用where in ,所以跑的很慢 现象#…以前总是说笛卡尔积笛卡尔积没碰到过今天在跑流程调度时就碰到笛卡尔积了本来就是查询几个编码的信息然后由于使用的是with tmp as没使用where in ,所以跑的很慢 现象  4条编码与一张数据量在亿万级别的表进行join,  占用内存在30多g执行10分钟20分钟以上依然半分钟进度只增加1%到了50% - 60%结果就卡住跑不动了。此时应该就是发生了数据倾斜笛卡尔积。 后续同事反馈内存占用较大需要停止执行任务然后就停止了  然后同事和领导跑过来看执行的语句后被另一个领导批评了一点然后观察我的sql WITH tmp.test1 AS ( SELECT 111111111 AS c1_num, 222222222 AS c2_num UNION ALL SELECT 4444444444, 333333333 UNION ALL SELECT 555555555, 666666666666 UNION ALL SELECT 8888888888, 77777777777 ) select tn.c1_num,tn.c2_numfrom tmp.test1 tninner join H_IS.day t ON tn.c1_num t.c1_num AND tn.c2_num t.c2_numwhere t.dt 20240301 and t.dt 20240630 发现我这样写会导致全表扫描让我改sql,我寻思不就是占用了30多个g吗有人还占用上千g内存呢心想不至于吧。      起初还以为是分区的问题dt限制的分区天数太多导致跑的满后面改完sql以后发现不是day表分区问题就是小表Join达标出现了数据倾斜 后学我按照经理的建议将sql的关联条件改到where里面执行首先创建一个表存编码然后再从where里面过滤 select tn.c1_num,tn.c2_numfrom tmp.test1 tninner join H_IS.day t ON tn.c1_num t.c1_num AND tn.c2_num t.c2_numwhere t.dt 20240301 and t.dt 20240630 and t.c3_num in (select c1_num from tmp.test1) 发现改完后的代码执行速度直接飞起从原来的执行10-20分钟没有执行完到1分钟30秒就马上就出结果了于是我意识到这里with tmp as生成的虚拟表与大表join导致数据倾斜 所以执行的很慢还占用内存才where提前分区过滤裁剪提高了执行速度避免了数据倾斜。 这里补充gpt的解释 问题分析 WITH 子句CTE中的数据量小但未被优化处理 你的 WITH tmp.test1 创建的是一个小型的虚拟数据集它在 SQL 查询优化器中往往被视为一个笛卡尔积生成表即将它的内容分布到所有可能的分区中。如果后续 JOIN 操作涉及的大表例如 H_IS.day有大量分区查询引擎需要扫描所有分区的数据并将临时数据广播到每个分区从而导致数据倾斜和内存高占用。 INNER JOIN 中的广播问题 在大数据场景中Hive 或类似系统会默认对小表广播broadcast join。当 WITH 中的数据不是一个实际表而是一个临时计算结果时可能没有被优化为广播操作导致全表扫描和网络数据传输。 WHERE IN 的优化 在第二个查询中当你将 WITH 的数据写入一个物理表并使用 WHERE IN 筛选时查询引擎可以识别出表中字段的索引如果有和分区直接过滤数据。而且 WHERE IN 的条件可以被优化器提前下推到 JOIN 的早期阶段减少需要计算和传输的数据量。 分区过滤的问题 如果 t.dt是分区字段使用 WITH 定义的子查询可能无法触发分区裁剪而使用实际表和 WHERE IN 则可以利用分区裁剪优化性能。
http://www.hkea.cn/news/14310435/

相关文章:

  • 视频网站直播怎么做创建域名的步骤
  • 建设一中校园网站03340 网站建设与管理
  • 南宁设计网站dw做网站怎么跳转
  • 域名网站建设流程正品又便宜的购物网站
  • php 优化网站建设wordpress图片显示缩略图
  • 淮阴区建设局网站哪里可以做网站平台
  • 网站推广网络营销方案品牌网站建设蔻大蝌蚪
  • 设计网站定制公司王也图片高清头像
  • 做一家新闻媒体网站多少钱玖玖建筑网官方网
  • 网上书城网站建设总结太原自助模板建站
  • 云南住房和城乡建设厅网站流程图制作软件
  • 网站敏感词汇正规的招聘网站
  • 多用户商城源码开发购物网站怎么做优化
  • 临沂专业网站制作公司wordpress插件机制
  • .电子商务网站建设的核心怎么注册个人工作室
  • 更改网站模板内容怎么建设音乐试听网站
  • 新乡网站优化公司价格国外做珠宝的网站有哪些
  • 网站建设北京贵企业建站什么网站好
  • iis配置网站访问权限国内网站建设哪家好
  • 邯郸做网站推广费用wordpress怎么配置文件
  • 主做熟人推荐的招聘网站上海做网站cnsosu
  • 爱做网站软件移动的网络网站建设
  • 致力于网站建设高端网站制
  • 徐州网站建设xzqjwl婚纱摄影网站的设计思路
  • 如何看网站的关键词深圳上市公司网站建设
  • 知乎网站建设用的工具温岭建设局网站
  • 做网站图片路径做缓存吗广州市住房和城乡建设部网站
  • 成都网站建设小公司网站建设运营部部长岗位职责
  • 网站简繁转换网站对位
  • 网站实名认证需要什么宾馆酒店网站建设方案