当前位置: 首页 > news >正文

电子商务网站开发项目熊猫关键词挖掘工具

电子商务网站开发项目,熊猫关键词挖掘工具,跨境电商b2b平台,昆明网站建站平台本文是LLM系列文章,针对《Can Language Models Make Fun? A Case Study in Chinese Comical Crosstalk》的翻译。 语言模型能制造乐趣吗?中国滑稽相声个案研究 摘要1 引言2 问题定义3 数据集4 使用自动评估生成基准5 人工评估6 讨论7 结论与未来工作 摘要 语言是…

本文是LLM系列文章,针对《Can Language Models Make Fun? A Case Study in Chinese Comical Crosstalk》的翻译。

语言模型能制造乐趣吗?中国滑稽相声个案研究

  • 摘要
  • 1 引言
  • 2 问题定义
  • 3 数据集
  • 4 使用自动评估生成基准
  • 5 人工评估
  • 6 讨论
  • 7 结论与未来工作

摘要

语言是人类交流的主要工具,幽默是其中最具吸引力的部分之一。像人类一样使用计算机生成自然语言,也就是自然语言生成(NLG),已被广泛用于对话系统、聊天机器人、文本摘要以及人工智能生成内容(AIGC),例如创意生成和脚本编写。然而,自然语言的幽默方面的研究相对较少,特别是在预训练语言模型的时代。在这项工作中,我们的目的是初步测试NLG是否能像人类一样产生幽默。我们建立了由大量中国滑稽相声剧本(简称c3)组成的最大数据集,这是自19世纪以来中国流行的表演艺术“相声”或“相声”。我们对各种生成方法进行基准测试,包括从头开始训练Seq2seq,微调的中等规模plm,以及带和不带微调的大规模plm。此外,我们还进行了人工评估,结果表明:1)大规模预训练大大提高了相声生成的质量;2)即使是最好的PLM生成的脚本也远远达不到我们的期望。我们得出结论,使用大规模plm可以极大地改善幽默生成,但它仍处于起步阶段。数据和基准测试代码可在https://github.com/ anonNo2/crosstalk-generation中公开获得。

1 引言

2 问题定义

3 数据集

4 使用自动评估生成基准

5 人工评估

6 讨论

7 结论与未来工作

在本文中,我们收集了中国相声的数据集。基于数据集,我们评估了几种现有的生成模型,包括LSTM Seq2seq、GPT、UniLM、CPM、Pangu-α、Zhouwenwang和GPT-3。这是幽默生成的初步步骤,说明大规模的预训练在很大程度上提高了相声生成的质量,但生成的脚本与人工创作的脚本之间仍然存在很大的差距。请注意,人们对相声的偏见/刻板印象存在一些担忧,例如教育背景歧视和性别偏见。在未来的工作中,我们有兴趣收集相声音频,以适应幽默的口音来促进端到端的相声生成。

http://www.hkea.cn/news/3546/

相关文章:

  • 小程序游戏怎么赚钱西安网站seo
  • 长春网站建设小程含有友情链接的网页
  • 谁有人和兽做的网站网页开发用什么软件
  • 邯郸专业网站建设排行榜百度
  • 在国外做黄皮网站违法么如何做好平台推广
  • 做网站要用框架吗苏州市网站
  • 网站登录人数实时更新如何做互联网平台推广是什么意思
  • 有没有专业做效果图的网站最新消息新闻
  • asp 网站模板网站优化外包找谁
  • 网站推广一般怎么做百度下载安装免费版
  • 网站建设逻辑填写电话的广告
  • 镇政府网站建设百度学术官网论文查重免费
  • 江西做网站找谁宁波seo外包推广平台
  • 用yershop做网站重庆seo排名方法
  • 网站开发成本厦门网站制作全程服务
  • 软件技术专业毕业论文关键词自助优化
  • 怎么做电子商务的网站百度seo新规则
  • 链接分析属于网站开发谷歌推广哪家公司好
  • 网站开发培训深圳优秀的网页设计网站
  • 网站空间企业个人360社区app
  • p2p网站建设小红书网络营销策划方案
  • iis6无法新建网站宣传方式有哪些
  • 多个链接的网站怎么做的本周热点新闻事件
  • 烟台模板建站代理宿州百度seo排名软件
  • 盖世汽车是模仿美国哪个网站做的外贸营销策略都有哪些
  • 视频网站开发平台宣传软文
  • 日本向中国收二维码费用洛阳seo网站
  • seo快速优化软件网站360网站收录
  • 城中网站制作优化网站seo策略
  • 网页视频下载在线提取seo关键词排名优化专业公司