当前位置: 首页 > news >正文

兰州彩票网站制作直播网站开发源码

兰州彩票网站制作,直播网站开发源码,重庆互联网公司招聘信息,商标设计logo免费生成器网站今天我要和大家分享一个新功能更新——微软的文本转语音和语音转文本功能。最近#xff0c;微软对其AI语音识别和语音合成技术进行了重大升级#xff0c;效果非常好#xff0c;现在我将分别为大家介绍这两个功能。 先来听下这个效果吧 微软文本转语音和语音转文本功能更新 …今天我要和大家分享一个新功能更新——微软的文本转语音和语音转文本功能。最近微软对其AI语音识别和语音合成技术进行了重大升级效果非常好现在我将分别为大家介绍这两个功能。 先来听下这个效果吧 微软文本转语音和语音转文本功能更新 文本转语音 文本转语音Text-to-Speech, TTS是一种将文本信息转换为自然听起来的语音的技术。微软的文本转语音功能提供了多种语言和语音选项支持多种平台和设备使得用户可以轻松将文本转换为语音。 更新后的文本转语音功能在语音合成方面有了很大的提升。它不仅能够更自然地模拟人类语音的语调、语速和语调变化还能够根据上下文智能调整发音使得合成的语音更加自然流畅。 python代码如下运行后会在终端运行的目录下生成一个output.mp3文件 from azure.cognitiveservices.speech import SpeechConfig, SpeechSynthesizer, AudioConfig from azure.cognitiveservices.speech.audio import AudioOutputConfig from azure.cognitiveservices.speech import ResultReason, CancellationReason# 创建SpeechConfig对象 speech_config SpeechConfig(subscriptionkey, regionservice_region)# 创建音频配置对象 audio_config AudioConfig(filenameoutput.mp3) # 输出到MP3文件# 创建语音合成器 speech_synthesizer SpeechSynthesizer(speech_configspeech_config, audio_configaudio_config) textHow To Unlock Cyberpunk 2077’s New Ending In Phantom Liberty# 定义SSML文本ssml_string2 !--IDB7267351-473F-409D-9765-754A8EBCDE05;Version1|{VoiceNameToIdMapItems:[{Id:390baec9-d867-4c01-bdcf-04e5848ee7dc,Name:Microsoft Server Speech Text to Speech Voice (zh-CN, XiaoxiaoMultilingualNeural),ShortName:zh-CN-XiaoxiaoMultilingualNeural,Locale:zh-CN,VoiceType:StandardVoice}]}-- !--IDFCB40C2B-1F9F-4C26-B1A1-CF8E67BE07D1;Version1|{Files:{}}-- !--ID5B95B1CC-2C7B-494F-B746-CF22A0E779B7;Version1|{Locales:{zh-CN:{AutoApplyCustomLexiconFiles:[{}]},de-DE:{AutoApplyCustomLexiconFiles:[{}]}}}-- speak xmlnshttp://www.w3.org/2001/10/synthesis xmlns:msttshttp://www.w3.org/2001/mstts xmlns:emohttp://www.w3.org/2009/10/emotionml version1.0 xml:langzh-CNvoice namezh-CN-XiaoxiaoMultilingualNeurallang xml:langzh-CNs /但我现在对这个职业的热爱还是非常的呵呵,非常的嗯,怎么说呢日月可鉴的哈哈嗯还是希望可以把这个职业做下去或者做这个声音相关领域的工作嗯就是把自己的优势发挥的大一点尽可能能用到自己擅长的东西而不是说为了工作为了挣钱而工作。s //lang/voice/speak # 使用SSML文本进行语音合成 result speech_synthesizer.speak_ssml_async(ssml_string2).get()# 检查结果 if result.reason ResultReason.SynthesizingAudioCompleted:print(Speech synthesized to [output.mp3] for text [{}].format(ssml_string2)) elif result.reason ResultReason.Canceled:cancellation_details result.cancellation_detailsprint(Speech synthesis canceled: {}.format(cancellation_details.reason))if cancellation_details.reason CancellationReason.Error:if cancellation_details.error_details:print(Error details: {}.format(cancellation_details.error_details))print(Did you update the subscription info?)其中Service_region和key值需要到azure中去获取先选语音服务 语音转文本 语音转文本Speech-to-Text, STT则是一种将语音信息转换为文本的技术。微软的语音转文本功能支持多种语言和方言能够实时将语音转换为文本并提供了强大的噪声抑制和回声消除功能使得识别准确率大大提高。 python代码如下 import os import tkinter as tk from tkinter import filedialog, ttk import azure.cognitiveservices.speech as speechsdk from datetime import datetime# 配置Azure语音服务的密钥和区域 speech_key key service_region service_regiondef recognize_speech():# 获取选择的WAV文件路径wav_file filedialog.askopenfilename(filetypes[(WAV Files, *.wav)])if wav_file:# 更新状态标签status_label.config(text正在识别...)# 创建语音配置对象,并设置语言为中文speech_config speechsdk.SpeechConfig(subscriptionspeech_key, regionservice_region)speech_config.speech_recognition_language zh-CN# 创建音频配置对象audio_config speechsdk.audio.AudioConfig(filenamewav_file)# 创建语音识别器对象speech_recognizer speechsdk.SpeechRecognizer(speech_configspeech_config, audio_configaudio_config)# 定义识别结果的回调函数recognized_text []def handle_final_result(evt):recognized_text.append(evt.result.text)progress_bar.step(10) # 每次识别结果更新进度条# 连接识别结果的事件处理程序speech_recognizer.recognized.connect(handle_final_result)# 定义识别状态的标志变量is_recognizing True# 定义识别结束的回调函数def handle_session_stopped(evt):nonlocal is_recognizingis_recognizing False# 连接识别结束的事件处理程序speech_recognizer.session_stopped.connect(handle_session_stopped)# 执行连续识别speech_recognizer.start_continuous_recognition()# 等待连续识别完成while is_recognizing:window.update()# 停止连续识别speech_recognizer.stop_continuous_recognition()# 获取当前时间戳timestamp datetime.now().strftime(%Y%m%d_%H%M%S)# 构建保存文件的路径save_path os.path.join(C:\\temp, frecognized_text_{timestamp}.txt)# 将识别结果保存到文件with open(save_path, w, encodingutf-8) as file:file.write(\n.join(recognized_text))# 更新状态标签status_label.config(text识别完成,结果已保存到文件: save_path)# 重置进度条progress_bar[value] 0# 创建图形化界面 window tk.Tk() window.title(语音识别)# 创建选择文件按钮 select_button tk.Button(window, text选择WAV文件, commandrecognize_speech) select_button.pack(pady10)# 创建状态标签 status_label tk.Label(window, text请选择要识别的WAV文件) status_label.pack()# 创建进度条 progress_bar ttk.Progressbar(window, length200, modedeterminate) progress_bar.pack(pady10)# 运行图形化界面 window.mainloop() 运行后效果如下 总结 总的来说微软的文本转语音和语音转文本功能的这次更新无疑是一次重大的技术突破。它不仅为用户提供了更加自然流畅的语音合成体验还极大地提高了语音识别的准确率。这对于需要使用语音识别和语音合成功能的用户来说无疑是一个巨大的福音。 好了今天的分享就到这里。如果你对这两个功能有更多的疑问或者想法欢迎在评论区留言讨论。我们下期再见
http://www.hkea.cn/news/14302964/

相关文章:

  • 自己做的网站出现广告品牌营销专业
  • 专注网站建站网站优化时间
  • 办网站需要什么做网站时怎么让边框细一点
  • 帮人网站开发维护违法网站行业
  • 在线音乐网站源码手机编程软件哪个好用
  • 视觉营销网站菠菜网站模板
  • 江苏电商网站开发电子商务搭建平台
  • 北京网站建设兴田德润电话多少整站网站优化价格
  • 怎么做外贸企业网站青岛百度整站优化服务
  • 静态网站建设教程wordpress编辑器文字颜色
  • 渭南网站建设做ic贸易去什么网站好
  • 网站开发 flex做义齿雕刻设备的网站
  • 百度站内搜索 wordpress做百度推广 建自己的网站
  • 百度推广登录账号首页抖音视频排名优化
  • 成都网站建设费用iis7.5 wordpress
  • 外贸一般在哪些网站网站加视频播放设计怎么做的
  • 如何看网站的语言佛山网站推广经理
  • 做网站的公司倒闭电脑端网站和手机网站区别
  • 教育网站设计案例wordpress h5 视频
  • 有没有什么排版的网站静态网站开发课程模板
  • 酒水招商网站大全seo短视频保密路线
  • 做网站用哪些语言找建设网站公司哪家好
  • 手机wap网页seo整站优化哪家专业
  • 网站的宣传推广一个专门做海鲜的网站
  • 网校网站建设方案360安全网址导航
  • 网站引量方法百度云盘登录
  • h5营销型网站suteng设计一套网站价格
  • 建设部网站房地产资质企业网站开发使用方法
  • js模板网站温州做网站制作哪家好
  • 广东网站建设seo优化莱芜都市网二手车