当前位置: 首页 > news >正文

网站建设内容模板下载淘宝流量助手平台

网站建设内容模板下载,淘宝流量助手平台,怎么下载ppt模板,杭州做网站要多少钱Elasticsearch 聚合数据结果不精确 背景 近期我们项目中出现使用ES聚合某个索引的数据取TOP 10的数据和相同条件下查询所有数据然后按数据量排序取的TOP 10的数据不一致的问题。 下面我们简单分析一下这个问题#xff0c;列出一些常见的解决方案。 问题 Elasticsearch分片…Elasticsearch 聚合数据结果不精确 背景 近期我们项目中出现使用ES聚合某个索引的数据取TOP 10的数据和相同条件下查询所有数据然后按数据量排序取的TOP 10的数据不一致的问题。 下面我们简单分析一下这个问题列出一些常见的解决方案。 问题 Elasticsearch分片机制 Elasticsearch索引index有一个主分片primary shard和0个或者多个分片副本组成。 Elasticsearch检索/聚合数据 query then fetch query阶段 客户端将请求发到协调节点coordinate node协调节点将搜索请求广播到所有的primary shard 或者 replica。每个shard在本地执行搜索并构建一个匹配文档大小为from size的优先队列每个分片返回各自优先队列中所有的docId和打分值个协调节点。协调节点对各个分片分片返回的数据进行合并排序分页等操作产出最终的结果集。 fetch阶段 协调节点根据Query阶段产生的结果去各个节点上查询docId实际的文档内容最终有协调节点返回结果给客户端。 coordinate node 对 doc id 进行哈希路由将请求转发到对应的 node此时会使用 round-robin 随机轮询算法在 primary shard 以及其所有 replica 中随机选择一个让读请求负载均衡。接收请求的 node 返回 document 给 coordinate node 。coordinate node 返回 document 给客户端。 参考 https://www.elastic.co/cn/blog/understanding-query-then-fetch-vs-dfs-query-then-fetch https://blog.csdn.net/a745233700/article/details/115585342?spm1001.2014.3001.5506 问题分析 期望结果 c 40, a 40 , d 35 实际结果 d 35, c 35, a 30 导致聚合不精确的原因分析 效率因素每个分片的取值Top X并不是汇总全部的 TOP X。性能因素ES 可以不每个分片Top X而是全量聚合但势必这会有很大的性能问题。 解决方案 提高聚合的精确度 size是聚合结果的返回值客户期望返回聚合排名10size值就是 10。 shard_size: 每个分片上聚合的数据条数。shard_size 原则上要大于等于 size若设置小于size实则没有意义elasticsearch 会默认置为size 请求的size值越高结果将越准确但计算最终结果的成本也将越高。 方案 调大 shard_size的值 官方推荐: size * 1.5 10 使用场景数据量大、分片数多的集群业务场景 shard_size 值越大结果越趋近于精准聚合结果值。 此外还可以通过show_term_doc_count_error参数显示最差情况下的错误值用于辅助确定 shard_size 大小。 全量聚合不推荐 将size设置为分片支持的最大值来解决聚合的精度问题。 缺点当分片的数据量极大会消耗巨大的cpu用于对数据的计算排序对性能有较大影响。 参考https://blog.csdn.net/laoyang360/article/details/107133008?ops_request_miscrequest_id6783e0d839e34d91ac465bedac26b860biz_idutm_mediumdistribute.pc_search_result.none-task-blog-2blogkoosearch~default-1-107133008-null-null.268v1controlutm_term%E8%81%9A%E5%90%88%E4%B8%8D%E5%87%86spm1018.2226.3001.4450
http://www.hkea.cn/news/14359349/

相关文章:

  • 计算机网络网站甘肃做网站找谁
  • 电气网站建设wordpress head.php
  • 深圳地区5g微波网站建设计划网站建设与管理2018
  • 站长之家网页模板站长工具手机综合查询
  • 网站建设 厦门工业设计网站哪个最好
  • 网站制作推广方案电子商务网站建设与管理的有关论文
  • 如何设计网站装饰工程施工管理
  • 网站文章页做百度小程序本地网站建设
  • 北京网站制作多少钱WordPress源码带会员中心系统
  • 如何做地方网站医院网站建设需要注意什么
  • 企业建设网站网站建设公司商标注册网址
  • 免费发布广告信息的网站公司网站建设流程图
  • 网站管理公司 优帮云帮企业外卖网站做推
  • 方案 网站合肥网站开发培训
  • 做嗳嗳的网站湘潭网站建设湘潭
  • 个人网站设计作品图片泉州网站外包
  • 成品软件网站推荐saas小程序开发
  • 网站首页html大数据和网站开发
  • 做网站需要什么电脑配置建设银行兰州分行网站
  • 什么网站可以做网站测速对比如何设网站主页
  • 手机怎么建设视频网站网站修改标题有影响吗
  • 心理网站模板做网站有什么作用
  • 网站建设内容存储wordpress百万并发
  • 用微信怎么做企业网站wordpress 超过2m
  • 手机端网站建设备案wordpress弄个人博客好吗
  • 杭州网站建设及推广网站建设文字教程
  • 淘客做网站多少钱长春 网站 设计
  • 网站建设的主要内容包括wordpress获取分类下所有文章
  • 加强机关网站建设湛江人做寄生虫网站
  • 浙江二建建设集团有限公司网站wordpress主题安装在哪里