当前位置: 首页 > news >正文

做网站和做微商城有什么区别微动网站建设

做网站和做微商城有什么区别,微动网站建设,学习软件编程,个人网站特点这篇发表于2020 WWW 上的会议论文#xff0c;提出一种MNS方式的负样本采样方法。众所周知#xff0c;MF方法难以解决冷启动问题#xff0c;于是进化出双塔模型#xff0c;但是以双塔模型为基础的召回模型的好坏十分依赖负样本的选取。为了解决Batch内负样本带来的选择性偏差… 这篇发表于2020 WWW 上的会议论文提出一种MNS方式的负样本采样方法。众所周知MF方法难以解决冷启动问题于是进化出双塔模型但是以双塔模型为基础的召回模型的好坏十分依赖负样本的选取。为了解决Batch内负样本带来的选择性偏差问题本文提出MNS方法融合了批采样和均匀采样。实验表明配合这种负样本的采样的双塔模型的召回能力得到了明显提升。 1. 贡献 本文提出一种新颖的负样本采样方法——MNS Mixed Negative Sampling用于缓解训练模型负样本的 selection bias问题。 MNS这一方法的主要是与之前通用的 batch / unigram sampling methods这两部分详见后面的介绍 相比较。 2. 思想 2.1 历史方法 有许多工作在研究基于Embedding的信息检索。其中的典型工作就是MF。 MF的关键问题在于冷启动i.e. it’s hard for this method to generalize to items that have no user interaction. 于是人们想到的方法是利用content feature 去建模从而避免这种对互动的依赖从而引出了双塔模型。content feature 范围很广。作者在文中给出了一些示例For instance, content features of an app could be text descriptions, creators, categories, etc. 2.2 当前方法 新提出的双塔模型Dual Encoder方法架构如下 但新的架构又出现了新的问题大家发现对于双塔模型来说其关键在于负样本的选取。 其背后的原因是 正样本用户参与点击、互动、反馈很好收集负样本则很难一是因为负样本太多二是因为负样本不直观。 之前的负样本采样方法主要是 unigram samplingbatch negatives 【也就是用同一batch类的样本做负样本】 batch negatives方法存在的问题有 1训练数据的选择偏差selection bias。batch negatives的弊端很明显因为用同batch内的正样本做为其它对的负样本就会导致负样本选择过于局限的问题因为正样本要么是新热高时鲜、要么就是质量好的无法代表用户不想点击的那波负样本。 2采样函数缺少灵活性 batch negatives 方法受限于训练数据的分布但是这个训练数据又是根据用户的点击得到很难被直接调整。 同时hierarchical softmax 和 sampled softmax 均不适合训练双塔结构原因是 如果我们将召回问题视作是一个多分类问题也就是如下表述 那么在反向传播更新梯度的时候就会遇到一个问题——很难在低时间复杂度的情况下计算出梯度原因见作者在文中给出的一个推导 这个推导说明的是在庞大的语料库中求出第二项是不切实际的而这第二项又是更新梯度的关键项。作者原文用的话是It is generally impractical to compute the second term over all items in a huge corpus. 综合分析上述种种本文提出方法In particular, in addition to the negatives sampled from batch training data, we uniformly sample negatives from the candidate corpus to serve as additional negatives. 该方法简称 MNS。 MNS 的优势在于 通过引入全局负样本因为作者使用了均匀负采样缓解选择偏差问题。调整采样分布通过改变额外的负样本的数目。 MNS的思想简图如下所示 3. 实验 3.1 实验细节 3.2 实验结果 实验结果从如下几个方面进行考量 离线RecallK指标表明MNS明显地提升了检索质量在线指标表明带来更多的高质量app安装本文的场景应该是谷歌play用于app 推荐。在线指标AB实验 3.2.1 比较模型性能 观察的结论 Two-tower with Batch Negatives 比 MLP with Sampled Softmax 的效果都要差。Batch Negatives 的这版模型召回了非常多的不相关的长尾app这也与作者前文所述的 selection bias 相符合。背后的真实原因就是Low-quality tail apps do not appear as negatives frequent enough. 3.2.2 取MNS的超参数 前文说到要对不常见的样本进行采样那么采多少条呢实验证明在作者的这个场景中取值是8192这个可借鉴意义不大。 4. 疑问 这里的with various formats 是什么意思unigram distribution是什么意思sampled softmax 是什么意思 有两篇论文可以参考学习label is associated with a rich set of content features. 5. 好句分享 a body of... 一群…This paper lies in this line of work. 本文就是这一类研究工作之一。Accordingly, sampling batch negatives only from training data will end up with a model lacking resolution for long-tail apps, which seldom appear in the training data. end up with 以 … 结束
http://www.hkea.cn/news/14360216/

相关文章:

  • 安徽网站排名优化公司苏州自助建站平台
  • 拼车平台网站开发中国建设银行青浦支行网站
  • 设计电子商务网站电商网站的程序有哪些
  • 百度推广是给做网站吗wordpress数据库邮箱
  • 桂林旅游攻略必去景点网站建设公司十年乐云seo
  • 珠海房地产网站建设网站建设南阳
  • 二级网站怎样做在什么网站做推广最好
  • 设计师 必备的网站app软件开发就是网站开发吗
  • 百度搜索指数查询网站应该如何进行优化
  • vs2013做登录网站百度推广账户怎么开
  • 外贸网站商城建设广州省建设厅官方网站
  • 网站底部广告代码电话销售做网站的术语
  • 做兼职的网站校园网络工程设计方案
  • 建设网站知乎网站定位与功能分析
  • 入门做外贸是先建网站还是先参展宁波关键词网站排名
  • 设计网站页面步骤外贸建站培训
  • 在一个网站下建设多个子网站html网页代码成品
  • 做网站 站内搜索引擎书签图片
  • 做网站维护需要什么证书wordpress 免费版广告
  • 网站招聘顾问做啥的自己做的网站手机不能看
  • 高端汽车网站建设新媒体营销案例分析
  • 网站建设 验收北京企业网站开发费用
  • 含山县查询建设工程的网站淘宝店铺去哪里买
  • 怎么做网站生意做化验的网站
  • 潍坊seo建站行业网站搭建
  • 服装网站建设策划企业云邮箱
  • 明年做哪些网站能致富网站设计 分辨率
  • 企业门户网站建设现状设计制作小车一微课
  • 定制棺材网站wordpress 登陆验证码插件
  • 天河网站(建设信科网络)深圳高端写字楼