当前位置: 首页 > news >正文

商务网站建设与管理实训总结设计官网需要留言吗

商务网站建设与管理实训总结,设计官网需要留言吗,百度sem,江西网站建设技术Transformer输出张量的值全部相同#xff1f;#xff01;现象原因解决现象 输入经过TransformerEncoderLayer之后#xff0c;基本所有输出都相同了。 核心代码如下#xff0c; from torch.nn import TransformerEncoderLayer self.trans TransformerEncoderLayer(d_mode… Transformer输出张量的值全部相同现象原因解决现象 输入经过TransformerEncoderLayer之后基本所有输出都相同了。 核心代码如下 from torch.nn import TransformerEncoderLayer self.trans TransformerEncoderLayer(d_model2,nhead2,batch_firstTrue,norm_firstTrue) ... x torch.randn(2, 8, 2) print(x before transformer, x, x.shape) x self.trans(x) # Transformer Encoder Layers print(x after transformer, x, x.shape)输出 x before transformer tensor([[[ 0.2244, -1.9497],[ 0.4710, -0.7532],[-1.4016, 0.5266],[-1.1386, -2.5170],[-0.0733, 0.0240],[-0.9647, -0.9760],[ 2.4195, -0.0135],[-0.3929, 1.2231]],[[ 0.1451, -1.2050],[-1.1139, -1.7213],[ 0.5105, 0.4111],[ 2.1308, 2.5476],[ 1.2611, -0.7307],[-2.0910, 0.1941],[-0.3903, 1.3022],[-0.2442, 0.5787]]]) torch.Size([2, 8, 2]) x after transformer tensor([[[ 1.0000, -1.0000],[ 1.0000, -1.0000],[-1.0000, 1.0000],[ 1.0000, -1.0000],[-1.0000, 1.0000],[ 1.0000, -1.0000],[ 1.0000, -1.0000],[-1.0000, 1.0000]],[[ 1.0000, -1.0000],[ 1.0000, -1.0000],[ 1.0000, -1.0000],[-1.0000, 1.0000],[ 1.0000, -1.0000],[-1.0000, 1.0000],[-1.0000, 1.0000],[-1.0000, 1.0000]]], grad_fnNativeLayerNormBackward0) torch.Size([2, 8, 2])原因 在询问过全知全能的New Bing之后找到一篇文章。 简化Transformer模型训练技术简介 Understand the difficulty of training transformer 时间2020 引用124 期刊会议EMNLP 2020 代码https://github.com/LiyuanLucasLiu/Transformer-Clinic Transformer的Layer Norm的位置很关键。 如果我们使用Post-LN模型可能对参数不稳定导致训练的失败。 而Pre-LN却不会。 原始Transformer论文中为Post-LN。一般来说Post-LN会比Pre-LN的效果好。 针对这点Understand the difficulty of training transformer文中提出使用Admin初始化。在训练稳定的前提下拥有Post-LN的性能。 解决 这里我们使用Pre-LN。 torch.nn.TransformerEncodelayer就提供了norm_frist的选项。 self.trans TransformerEncoderLayer(d_model2,nhead2,batch_firstTrue,norm_firstTrue)修改后输出 x before transformer tensor([[[ 0.5373, 0.9244],[ 0.6239, -1.0643],[-0.5129, -1.1713],[ 0.5635, -0.7778],[ 0.4507, -0.0937],[ 0.2720, 0.7870],[-0.5518, 0.8583],[ 1.5244, 0.5447]],[[ 0.3450, -1.9995],[ 0.0530, -0.9778],[ 0.8687, -0.6834],[-1.6290, 1.6586],[ 1.2630, 0.4155],[-2.0108, 0.9131],[-0.0511, -0.8622],[ 1.5726, -0.7042]]]) torch.Size([2, 8, 2]) x after transformer tensor([[[ 0.5587, 0.9392],[ 0.5943, -1.0631],[-0.5196, -1.1681],[ 0.5635, -0.7765],[ 0.4341, -0.0819],[ 0.2943, 0.7998],[-0.5329, 0.8661],[ 1.5166, 0.5528]],[[ 0.3450, -1.9860],[ 0.0273, -0.9603],[ 0.8415, -0.6682],[-1.6297, 1.6686],[ 1.2261, 0.4175],[-2.0205, 0.9314],[-0.0595, -0.8421],[ 1.5567, -0.6847]]], grad_fnAddBackward0) torch.Size([2, 8, 2])
http://www.hkea.cn/news/14580856/

相关文章:

  • 高端大气的网站模板建设网站哪个便宜
  • 东莞网站推广哪家好wordpress泽七
  • 小说网站开发实录铁岭网站制作
  • 网站的空间是服务器吗网站开发交流
  • 网站建设 长安wordpress 食谱网站
  • 高校网站建设方案爱站seo
  • 有什么推广网站泉州市住房与城乡建设局网站
  • php网站开发数据列表排重优化方案官网
  • 深圳网站空间购买安丘网站建设开发
  • 创建网站的快捷方式wordpress安装主题实例 不成功
  • 设计公司网站应该包括的信息顺德手机网站设计价位
  • 营销型网站建设ppt北京工程建设有限公司
  • 免费的舆情网站app下载wordpress切换语言实现
  • 怎么做打码网站wordpress支持的邮箱
  • 网站建设颜色搭配轻量级服务器wordpress密钥
  • 网站做伪原创收录泰安网络营销推广
  • 昂昂溪网站建设长春互联网企业
  • 注册网站流程用ps制作网页步骤
  • 网站优化制作西安活动策划执行公司
  • 网站建设中翻译R2D安装wordpress
  • 临沧市网站建设大连龙采做网站
  • wordpress删除无分类文章网站移动端优化工具
  • 新手搭建网站教程python做网站好不好
  • 锤子 网站 模版好的手机端网站模板下载软件
  • 做物流的网站有哪些功能网站制作用什么
  • 广州做英文网站的公司网站的标签修改
  • 甘肃省城乡建设局网站怎么下载网站程序
  • 绘制网站结构图品牌建设情况
  • 钟祥网站制作网站建设便宜的公司哪家好
  • 苏州企业网站设计wordpress 后台编辑