当前位置: 首页 > news >正文

开发网站教程本周最新新闻

开发网站教程,本周最新新闻,深圳建筑工地招聘信息,专业网架公司本文翻译自Elasticsearch官方指南的Proximity Matching一章。 邻近匹配(Proximity Matching) 使用了TF/IDF的标准全文搜索将文档#xff0c;或者至少文档中的每个字段#xff0c;视作一大袋的单词(Big bag of Words)。match查询能够告诉我们这个袋子中是否包含了…本文翻译自Elasticsearch官方指南的Proximity Matching一章。 邻近匹配(Proximity Matching) 使用了TF/IDF的标准全文搜索将文档或者至少文档中的每个字段视作一大袋的单词(Big bag of Words)。match查询能够告诉我们这个袋子中是否包含了我们的搜索词条但是这只是一个方面。它不能告诉我们关于单词间关系的任何信息。 考虑以下这些句子的区别 Sue ate the alligator.The alligator ate Sue.Sue never goes anywhere without her alligator-skin purse. 一个使用了sue alligator的match查询会匹配以上所有文档但是它无法告诉我们这两个词是否表达了部分原文的部分意义或者是表达了完整的意义。 理解单词间的联系是一个复杂的问题我们也无法仅仅依靠另一类查询就解决这个问题但是我们至少可以通过单词间的距离来判断单词间可能的关系。 真实的文档也许比上面几个例子要长的多Sue和alligator也许相隔了几个段落。也许我们仍然希望包含这样的文档但是我们会给那些Sue和alligator出现的较近的文档更高的相关度分值。 这就是短语匹配(Phrase Matching)或者邻近度匹配(Proximity Matching)。 TIP 本章中我们仍然会使用match查询中使用的示例文档。 短语匹配(Phrase Matching) 就像一提到全文搜索会首先想到match查询一样当你需要寻找邻近的几个单词时你会使用match_phrase查询 GET /my_index/my_type/_search {query: {match_phrase: {title: quick brown fox}} } 和match查询类似match_phrase查询首先解析查询字符串来产生一个词条列表。然后会搜索所有的词条但只保留含有了所有搜索词条的文档并且词条的位置要邻接。一个针对短语quick fox的查询不会匹配我们的任何文档因为没有文档含有邻接在一起的quick和box词条。 TIP match_phrase查询也可以写成类型为phrase的match查询 match: {title: {query: quick brown fox,type: phrase} } 词条位置 当一个字符串被解析时解析器不仅只返回一个词条列表它同时也返回每个词条的位置或者顺序信息 GET /_analyze?analyzerstandard Quick brown fox 会返回以下的结果 {tokens: [{token: quick,start_offset: 0,end_offset: 5,type: ALPHANUM,position: 1 },{token: brown,start_offset: 6,end_offset: 11,type: ALPHANUM,position: 2 },{token: fox,start_offset: 12,end_offset: 15,type: ALPHANUM,position: 3 }] } 位置信息可以被保存在倒排索引(Inverted Index)中像match_phrase这样位置感知(Position-aware)的查询能够使用位置信息来匹配那些含有正确单词出现顺序的文档在这些单词间没有插入别的单词。 短语是什么 对于匹配了短语quick brown fox的文档下面的条件必须为true quickbrown和fox必须全部出现在某个字段中。brown的位置必须比quick的位置大1。fox的位置必须比quick的位置大2。 如果以上的任何条件没有被满足那么文档就不能被匹配。 TIP 在内部match_phrase查询使用了低级的span查询族(Query Family)来执行位置感知的查询。span查询是词条级别的查询因此它们没有解析阶段(Analysis Phase)它们直接搜索精确的词条。 幸运的是大多数用户几乎不需要直接使用span查询因为match_phrase查询通常已经够好了。但是对于某些特别的字段比如专利搜索(Patent Search)会使用这些低级查询来执行拥有非常特别构造的位置搜索。 混合起来(Mixing it up) 精确短语(Exact-phrase)匹配也许太过于严格了。也许我们希望含有quick brown fox的文档也能够匹配quick fox查询即使位置并不是完全相等的。 我们可以在短语匹配使用slop参数来引入一些灵活性 GET /my_index/my_type/_search {query: {match_phrase: {title: {query: quick fox,slop: 1}}} } slop参数告诉match_phrase查询词条能够相隔多远时仍然将文档视为匹配。相隔多远的意思是你需要移动一个词条多少次来让查询和文档匹配 我们以一个简单的例子来阐述这个概念。为了让查询quick fox能够匹配含有quick brown fox的文档我们需要slop的值为1 Pos 1 Pos 2 Pos 3 ----------------------------------------------- Doc: quick brown fox ----------------------------------------------- Query: quick fox Slop 1: quick ↳ fox 尽管在使用了slop的短语匹配中所有的单词都需要出现但是单词的出现顺序可以不同。如果slop的值足够大那么单词的顺序可以是任意的。 为了让fox quick查询能够匹配我们的文档需要slop的值为3 Pos 1 Pos 2 Pos 3 ----------------------------------------------- Doc: quick brown fox ----------------------------------------------- Query: fox quick Slop 1: fox|quick ↵ Slop 2: quick ↳ fox Slop 3: quick ↳ fox
http://www.hkea.cn/news/14381402/

相关文章:

  • 如何进行网站关键词优化网站建站怎么报价
  • 上海网站建设咨久久建筑网如何下载资源
  • 中国网站建设服务中心上海网站建设 s
  • 网站开发成本有哪些山西建设厅八大员查询网站
  • 网站文件保护怎么做wordpress导入sql失败
  • 十堰网站制作公司电话室内设计学校哪家好
  • 电脑系统做的好的网站如何让网站被收录
  • 中国建设网官方网站地址网站备案图标代码
  • 外贸网站 wordpress武夷山网站制作
  • 佛山网站建设电话html5手机网站开发区别
  • 南京制作企业网站给网站做插画分辨率
  • 做任务领取礼品的网站牡丹江整站优化
  • 流放之路做长老环的网站软件工程师发展前景
  • 网站有访问量 为什么没有询盘湖北响应式网页建设哪家有
  • 电商网站的支付接入该怎么做呢移动端开发用什么编程语言
  • 影视怎么建设网站物联网开发用什么语言
  • 世界500强企业愿景成都网站建设优化公司电话
  • 网站转微信小程序哪个网站做的简历最好
  • 把网站做成app多少钱建网站 主流软件
  • 品牌展示型网站有哪些福建泉州做网站公司
  • 做微信营销网站建设seo顾问公司
  • 网站seo策划百度百家官网入口
  • 做下载网站用什么程序好公司网络营销推广软件
  • 英语网站的栏目名称wordpress更换服务器ip
  • 大连h5建站wordpress如何添加搜索到主菜单
  • 海南省建设厅网站首页昆明网站建设公司排名
  • 福州建站价格淘宝上网站开发
  • 织梦 音乐网站做网站怎么注册营业执照
  • 西安道桥建设有限公司网站网站开发亿玛酷给力5
  • 网站去掉index.html团队建设