当前位置: 首页 > news >正文

包头做网站的公司招聘信息wordpress 站群会员

包头做网站的公司招聘信息,wordpress 站群会员,wordpress管理员密码忘,宜兴市网站建设先说结论#xff0c;大语言模型除了作为聊天的Agent#xff0c;也可以为检索模型生成优质的文本对训练数据#xff0c;从而做到无监督场景下也能够适用。这里分享一篇AAAI2024的工作#xff0c;重点探讨如何生成比评估集更困难的训练数据来提升无监督句子表示学习质量…先说结论大语言模型除了作为聊天的Agent也可以为检索模型生成优质的文本对训练数据从而做到无监督场景下也能够适用。这里分享一篇AAAI2024的工作重点探讨如何生成比评估集更困难的训练数据来提升无监督句子表示学习质量应该对很多表示学习工作都有一定启发 论文题目Narrowing the Gap between Supervised and Unsupervised Sentence Representation Learning with Large Language Model 来源AAAI2024/实验室师兄/北航 方向文本表示学习 开源地址https://github.com/BDBC-KG-NLP/NGCSE 摘要 句子表示学习SRL是自然语言处理NLP中的一项基本任务句子编码对比学习CSE因其优越的性能而成为主流技术。CSE中一个有趣的现象是有监督方法和无监督方法之间的显著性能差异它们唯一的区别在于训练数据。以前的工作将这种性能差距归因于对齐和均匀性的差异。然而由于对齐和均匀性只衡量结果他们没有回答“训练数据的什么方面导致了性能差距”以及“如何才能缩小性能差距”。 本文进行了实验来回答这两个问题。首先通过彻底比较监督和无监督CSE在各自训练过程中的行为来回答“什么”的问题。从比较中我们确定了相似度模式是性能差距的关键因素并引入了一个度量称为相对拟合难度Relative Fitting DifficultyRFD来衡量相似度模式的复杂性。 然后基于从“什么”问题中获得的见解我们通过增加训练数据的模式复杂性来解决“如何”问题。我们通过利用大语言模型LLM的上下文学习ICL能力来生成模拟复杂模式的数据来实现这一点。通过利用LLM生成数据中的有层次的模式本文有效地缩小了有监督和无监督CSE之间的差距。 介绍 “什么”导致了性能差距 相似度模式一个数据集怎样定义相似和不相似的文本对。训练数据集的相似度模式越复杂训练效果越好。训练集的相似度模式可以用训练集与评估集间的对齐和均匀性的相对大小来衡量。用这种方式可以发现有监督训练集NLI中的相似度模式要比评估集更复杂而无监督训练集Wiki中的相似度模式要比评估集简单。下图说明了这一结论在对齐和均匀性两个指标上有监督训练集都要高于评估集而无监督训练集都要更低。 由此本文提出了相对匹配难度Relative Fitting Difficulty (RFD)来评估相似度模式的复杂性即计算对比学习训练过程中Bert每个时间步在训练集和评估集的表征的对齐和均匀性的差值再取平均 实验表明RFD较大的数据确实能获得更好的效果下图中右上角的五角星代表本文的训练方法的结果可以看到相比左下方的之前的无监督训练方式都有明显提升同时RFD也基本都更大 如何才能缩小性能差距 接着本文通过LLM的上下文学习提示LLM模拟了NLI数据即两个句子是违背还是不违背和STSSTS数据将两个句子的相似度分为positiveintermediatenegative其中中间等级是让语言模型生成比positive细节少一些的句子 为了有效利用STS生成数据中的层次化结构关系本文还提出了一种层次化结构的三元损失Hierarchical Triplet (HT) loss 并将这个损失和对比损失结合作为训练目标 STS实验结果表明确实缩小了有监督和无监督训练的差异在STS16上完成了反超不过大部分还是不能达到有监督的水平 分类任务上将差距缩小到一个点以内部分结果基本相当 大家好我是NLP研究者BrownSearch如果你觉得本文对你有帮助的话不妨点赞或收藏支持我的创作您的正反馈是我持续更新的动力如果想了解更多LLM/检索的知识记得关注我
http://www.hkea.cn/news/14497202/

相关文章:

  • 做网站对于不同的分辨率无锡微信手机网站制作
  • 网站做seo需要些什么优秀商业空间设计案例分析
  • js搜索网站开发oa系统的主要功能
  • 云南省建设工程招标投标行业协会网站哈尔滨做平台网站平台公司哪家好
  • 下载做蛋糕网站wordpress模板更改
  • 如何建CMS网站彩票网站 建设
  • 如何理解电子商务网站建设与管理企业网站建设采购
  • 宜昌平台网站建设网页设计是用什么软件
  • 网站注册域名与制作wap浏览器手机版
  • 昆山市有没有做网站设计的作图网站
  • 搭建网站多少费用郴州建设网站制作
  • 石家庄免费建站模板无锡建设执业资格注册中心网站
  • 合肥建设学校官网网站网站制作可以卖多少钱
  • 基于ssh框架的网站开发流程做网站公司好
  • 宁夏建网站报价wordpress 应用
  • 网上商城网站源码好玩的html网页代码
  • 建手机网站报价wordpress优惠券自动使用
  • 现在自己做网站卖东西行么萧山建设银行招聘网站
  • 景观设计师如何做网站科技网站首页欣赏
  • 做兼职写小说网站net网站开发手机网站
  • 网销具体怎么做网站网页设计html代码翻译
  • 国外建筑设计网站推荐教育网站设制下载
  • 个人公众号如何推广湛江seo排名外包
  • 大数据网站建设费用论文中参考文献对不上
  • 网站制作优质公司网络运营与网络营销是什么关系
  • 网站开发公司网站官网自己做的网站 360不兼容
  • 视频连接网站怎么做wordpress可以注册了
  • 温州网站建设优化公司苏州高端网站制作机构
  • 做发包业务网站温州网站建设新手
  • 网站关键词一般设置几个福建seo排名培训