当前位置: 首页 > news >正文

网站在哪里搜索wordpress 前台多余代码

网站在哪里搜索,wordpress 前台多余代码,app制作公司十强,网站设计的优点和缺点倒排索引 idproductdesc1新版 小米 至尊-纪念版手机1小米 NFC 手机3NFC手机4小米 耳机5华为 耳机6扫地机器人7华为 Mata………………term_indexterm dictionaryposting list------------------------------------小米1……100W华为6,7,9NFC76,90耳机5352红米643,98机器人645,9…倒排索引 idproductdesc1新版 小米 至尊-纪念版手机1小米 NFC 手机3NFC手机4小米 耳机5华为 耳机6扫地机器人7华为 Mata………………term_indexterm dictionaryposting list------------------------------------小米1……100W华为6,7,9NFC76,90耳机5352红米643,98机器人645,9806……………… 我们引入这两个表格来理解倒排索引第一个表是真实的数据我们根据product这个字段进行分词然后拆分的词为term dictionary,然后将id,存在posting list。 对于倒排表有两种压缩算法进行存储 1 Frame OF Reference 索引帧FOR 真正的ES存储是类似于第二个例子采用分组的形式。这大概就是FOR的压缩逻辑但是缺陷就是如果数据特别离散压缩效果不会很好,采用RBM来进行存储。 2 Roaring BitMap 咆哮位图RBM 对于词项字典我们对应的也有方式来存储 1 先来了解一下前缀树 前缀树有一定的复用每一个终端节点就是一个单词我们发现如果不是终端节点比如我们查找AB在这里面是找不到的同时最后DF也是没有复用的存储了多次因此需要进一步优化。 2 基于前缀树的优化 2.1 有限状态机 有限个状态 同一时间只能处于同一个状态 不同状态之间可以相互转换 状态是无序的 就像下面这张图我只话了部分边就是哥哥状态可以相互转换。 2.2 有限状态接收机 在前缀树的基础上我们插入jksj jksjtech jkb estech 4 和 8 为终止节点 数据在边上 节点是数字 如果插入一个单词当前比如之前没有jkb当插入到b的时候发现没有这个字母则会选择一个红色的节点作为结束为什么不选4因为选四就会多一个单单词jksjb但实际我们没有不符合我们的期望。 这个里面是否存在ES呢 其实是不存在的我们没有插入ES但是es恰好在终止节点所以多存储了一些不存在的数据。所以这样优化还是不够需要进一步看下面的结构。 2.3 有限状态转换机FST FST最重要的功能是可以实现Key到Value的映射相当于HashMap。FST的查 询速度⽐HashMap要慢⼀点但FST的内存消耗要⽐HashMap少很多。FST在 Lucene中被⼤量使⽤例如倒排索引的存储同义词词典的存储搜索关键 字建议等 比如我们有下面这几个数据 后面这个数字一般是由机器算出来的这个值是来解决上面的问题也就是来校准是否真的存在例如es这种例子。 jksj/10 jksjtech/5 jkb/2 当我们插入jksj的时候 j:10 后面的字母都为0就可以 也可以k:10其它数字都为0 但是我们插入jksjtech 这个时候j前面的权重和必须要小于等于5不然jksjtech 不可能为5 所以这个时候可以j:5 然后把另外的5放到output也里面去,也就是在终止节点开外挂。当然前面值可以任意分配只要不超过5 比如j:3 k:2 s: 0 :j 外挂值 如果为终止节点则会加外挂这样就满足了我们的需要。 jkb/2 后面插入jkb的时候同样的原理会从新分配路径上的值。 2.4 ES的存储逻辑 frontier[] ⽤来存放UnCompiledNode即待处理的节点(未持久化的节点) current[] 存放CompiledNode即最终的节点存储(持久化以后的节点 ARC {label 值,output 节点字面信息, target(包含一个flag 下一个节点的头补信息 下一个节点的label) 指向的节点}。 abd abe abfi abfj abfk abgl abgm abgn abgo abgp abgq abgr abh ac 这个是字典序排好以后进行插入来理解FST的过程 首先插入abd 然后插入abe代表d结尾的Node结束了可以进行落盘按照这个逻辑只要后面与这个节点无关了就可以进行落盘然后如果达到了每个block的最大数量最后就会进行分裂整个过程就是不停的落盘生成子文件子文件进行分裂形成了上面这张图的文件结构。其中有一些术语pending block是等待落盘的floor block是已经落盘的。pending trem是一个单独的也就是没有其它字符共享block。 term index的存储 图片来源图片来源地址 参考资料 极客时间ES
http://www.hkea.cn/news/14435598/

相关文章:

  • 万网域名管理网站右翼网站
  • 国学大师网站是哪里做的网站下载的网页修改下面版权所有
  • 网站开发图片加载过慢如何优化xampp 查看wordpress模板
  • 合肥网站建设公司加盟代理网页在线
  • 四川住房和城乡建设部网站官网房地产网站开发
  • 佛山用户网站建设建立网站要钱吗?
  • 优良网站it外包公司为什么不能去
  • 张家界网站制作公司重庆专业网站开发服务
  • 深圳住房和建设局网站登录界面seo免费优化工具
  • 国外做免费的视频网站火车头wordpress发布模块制作
  • 泉州自助建站杭州专业的网站制作公司
  • 刚做的网站怎么在百度上能搜到网站服务器容量
  • 开发大型网站的最主流语言网站看不到预览图
  • 网站后台管理器怎么做响应式网站建设报价单
  • 建个普通网站多少钱wordpress会员vip插件
  • 青岛网站定制电商网站建设合同模板
  • 高端网站建设文案自学做网站可以吗
  • 北京高端定制网站建设专业企业网站制作怎么做
  • 快速搭建网站框架图电商网站搭建
  • 爱站网工具包网页教程网站
  • 苏州代做淘宝网站北京 顺义 网站制作
  • 把网站扒下来以后怎么做拓者网室内设计官网app
  • 坪山网站建设渠道广东新闻频道直播
  • 哪个网站能学做微商怎么制作自己的水印
  • 有哪些网站做的比较好看的WordPress注册不提示
  • 新一代 网站备案抓好门户网站建设
  • 网站建设与制作价格怎么看一个网站是谁做的
  • 摄影学习网站网站开发三大元素
  • 如何建设社区网站aso优化服务平台
  • 公司网站建设的好处网店设计理念