当前位置: 首页 > news >正文

互动营销型网站建设简单个人网站设计

互动营销型网站建设,简单个人网站设计,南通高端网站建设,网站内容建设与管理语音识别技术能够让计算机理解人类的语音#xff0c;从而支持多种语音交互的场景#xff0c;如手机应用、人车协同、机器人对话、语音转写等。然而#xff0c;在这些场景中#xff0c;语音识别的输入并不总是单一的语言#xff0c;有时会出现多语言混合的情况。例如#…语音识别技术能够让计算机理解人类的语音从而支持多种语音交互的场景如手机应用、人车协同、机器人对话、语音转写等。然而在这些场景中语音识别的输入并不总是单一的语言有时会出现多语言混合的情况。例如在中文场景中我们经常会使用一些英文专业术语来表达意思如“GPS信号弱”、“Java工程师”等这就给语音识别技术带来了新的挑战。本次PaddleSpeech发布的中英文语音识别预训练模型Conformer_talcs可以通过PaddleSpeech封装的命令行工具CLI或者Python接口快速使用开发者们可以基于此搭建自己的智能语音应用也可以参考示例训练自己的中英文语音识别模型。示例链接https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/tal_cs/asr1快速体验示例音频https://paddlespeech.bj.bcebos.com/PaddleAudio/ch_zh_mix.wav使用命令行工具CLI 快速体验语音识别效果命令如下bashpaddlespeech asr --model conformer_talcs --lang zh_en --codeswitch True --input ./ch_zh_mix.wav -v# 终端输出今天是monday 明天是tuesdayPython 接口快速体验代码实现如下pythonimport paddlefrom paddlespeech.cli.asr import ASRExecutorasr_executor  ASRExecutor()text  asr_executor(modelconformer_talcs,langzh_en,sample_rate16000,configNone, ckpt_pathNone,audio_file./ch_zh_mix.wav,codeswitchTrue,force_yesFalse,devicepaddle.get_device())print(ASR Result: \n{}.format(text)) ASR Result: 今天是 monday 明天是tuesday中英文语音识别技术中英文语音识别难点 中英文语音识别相较于单语言的语音识别而言主要难点如下数据量少中英混合数据相较于单语言的数据更少。目前开源的中文语音识别数据集如WenetSpeech10000小时有监督2500小时弱监督10000小时无监督、英文语音识别数据集Giga Speech10000小时有监督33000小时无监督都达到了万小时级别但是混合的开源中英文语音识别数据只有SEAME(120小时)和TAL_CSASR(587小时)两个开源数据混合数据集比单语言数据集会更少。中英相似发音易混淆中英文语音识别需要一个单一的模型来学习多种语音相似但具有不同含义的发音通常会导致模型的复杂度和计算量增加同时由于它需要区分处理不同语言的类似发音因此在模型建模时就需要按照不同语言区分不同的建模单元。PaddleSpeech 中英文语音识别方案模型选择与介绍 本方案使用了一种端到端语音识别模型Conformer U2模型其采用了Joint CTC/Attention with Transformer or Conformer的结构。训练时使用CTC 和 Attention Loss 联合优化并且通过dynamic chunk的训练技巧使Shared Encoder能够处理任意大小的chunk即任意长度的语音片段。其还使用CTC-Prefix Beam Search和Attention Decoder的方式进行解码得到最终结果同时实现了流式和非流式的语音识别支持控制推理延迟。 本次PaddleSpeech开源的预训练模型是非流式的端到端识别Conformer U2模型chunk中包含全部上下文信息需要整句输入进行识别。如果你想训练流式中英文语音识别模型也可以参考PaddleSpeech的Conformer U2/U2模型流式语音识别的示例训练自己的流式中英文语音识别模型。示例链接https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/wenetspeech/asr1Conformer U2 结构示意图[1]数据集介绍 本次使用了TAL_CSASR中英混合语音数据集。语音场景为语音授课音频包括中英混合讲课的情况总计587小时语音。数据集下载地址https://ai.100tal.com/dataset数据集介绍[2]中英混合语音识别建模单元在中文语音识别系统中常采用音素、汉字、词等作为声学模型的建模单元在英文语音识别系统中则常采用英文音素、国际音标、子词等作为声学模型的建模单元。 本次PaddleSpeech开源的预训练中英文语音识别模型是采用端到端语音识别模型Conformer U2未接入语言模型使用了中文字/词加英文子词的建模方法将中英文分开建模通过模型推理直接得到识别后的结果。试验结果对比 由于本项目使用的是中英文混合数据集所以我们选择混合错误率MERMix Error Rate作为评价指标中文部分计算字错误率CERCharacter Error Rate英文部分计算词错误率Word Error Rate。测试数据集选择TAL_CSASR中已经划分好的测试集。由于不同的解码方式识别的效果不同这里我们使用 Attention、CTC Greedy Search、CTC Prefix Beam Search、Attention Rescoring 四种解码方式进行试验解码效果最佳为Attention Rescoring混合错误率MER为0.084折算为我们常说的语音识别正确率91.6%。进一步优化与效果提升 当前中英文语音识别方案的效果还有进一步提升的空间比如在Conformer U2 模型后面加入Language Model通过语言模型学习中英文语言信息PaddleSpeech中提供了基于N-Gram的语言模型训练方案。此外可以在训练过程中加入Language ID使用token级别或者帧级别的语言ID标注信息可以进一步提高中英文语音识别的效果。如果你有更大的中英文混合数据集或者是场景相关的数据集可以通过微调或者进一步训练提高在业务场景中的识别效果。PaddleSpeech 语音识别技术介绍 除了中英文混合的Conformer U2模型以外飞桨语音模型库PaddleSpeech中包含了多种语音识别模型能力涵盖了声学模型、语言模型、解码器等多个环节支持多种语言。目前PaddleSpeech已经支持的语音识别声学模型包括DeepSpeech2、Transfromer、Conformer U2/U2 支持中文和英文的单语言识别以及中英文混合识别支持CTC前束搜索CTC Prefix Beam Search、CTC贪心搜索CTC Greedy Search、注意力重打分(Attention Rescoring)等多种解码方式支持 N-Gram语言模型、有监督多语言大模型Whisper、无监督预训练大模型wav2vec2同时还支持服务一键部署可以快速封装流式语音识别和非流式语音识别服务。通过PaddleSpeech提供的命令行工具CLI和Python接口可以快速体验上述功能。 通过PaddleSpeech精品项目合集可以在线体验PaddleSpeech的优秀项目上面更有PaddleSpeech核心开发者精心打造的《飞桨PaddleSpeech语音技术课程》帮助开发者们快速入门。项目传送门https://aistudio.baidu.com/aistudio/projectdetail/4692119?contributionType1 如果您想了解更多有关PaddleSpeech的内容欢迎前往PaddleSpeech主页学习更多用法Star 关注获取PaddleSpeech最新资讯。PaddleSpeech地址https://github.com/PaddlePaddle/PaddleSpeech引用[1] 模型结构图https://arxiv.org/pdf/2012.05481.pdf[2] 数据集介绍https://ai.100tal.com/dataset拓展阅读提速300%PaddleSpeech 语音识别高性能部署方案重磅来袭定制音库成本骤降98%PaddleSpeech小样本语音合成方案重磅来袭关注【飞桨PaddlePaddle】公众号获取更多技术内容~
http://www.hkea.cn/news/14440928/

相关文章:

  • 广西南宁建设银行招聘网站wordpress 体育
  • 吉安市建设技术培训中心网站做图片类型网站需要什么服务器
  • 网站做一个多少钱做网站需要租服务器
  • 网站建设信息模板开发app需要多少人
  • 网站策划方案如何做苏州知名高端网站建设机构
  • 网站项目开发流程及规范烟台快速建站公司
  • 北京网站开发浩森宇特h5免费制作平台无水印
  • 对比网站找项目
  • 那些网站可以接私活做百度广告竞价排名
  • 厦门建站比较好的公司app外包公司怎么找
  • 网站建设设计平台网站策划案需要包括哪些
  • 宜昌本地网站做导航网站用什么建站程序
  • 建设银行福州分行招聘网站阿帕奇网站搭建
  • 建设银行分期手机网站wordpress文章列表格子
  • 在线设计网站源码云南新闻最新消息今天
  • 锡林浩特网站建设注册城乡规划师考试教材
  • 澎湃动力网站建设公司品牌网站建设报价方案
  • 门户网站和社交网络的区别wordpress网站如何添加栏目
  • 网站数据库空间大小婚庆策划公司
  • 怎样注册一个自己的网站wordpress中的全站链接怎么改
  • 网页安全站点设置学校网站建设总结报告
  • 有哪些做软件的网站工地用木模板尺寸
  • 如何制作一般企业网站开发三味风车动漫无修
  • 建立学校网站如何建设一个子网站
  • 用dw怎么做用户登录页面的网站测评网站怎么做
  • 设计网站评分标准可信的邢台做网站
  • 浙江二建建设集团有限公司网站普洱网站建设
  • asp网站 访问 变慢 监测wordpress顶部菜单调用
  • js做网站登录框验证码企业网络搭建是什么
  • 东莞有哪些好的网站建设公司优惠券网站做淘客违规吗