当前位置: 首页 > news >正文

旅行社网站制作企业网站seo最好方法

旅行社网站制作,企业网站seo最好方法,石家庄做网站价格,无极网站站怎么有的下不了提示#xff1a;文章写完后#xff0c;目录可以自动生成#xff0c;如何生成可参考右边的帮助文档 Transformer学习 1 位置编码模块1.1 PE代码1.2 测试PE1.3 原文代码 2 多头自注意力模块2.1 多头自注意力代码2.2 测试多头注意力 3 未来序列掩码矩阵3.1 代码3.2 测试掩码 1 … 提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档 Transformer学习 1 位置编码模块1.1 PE代码1.2 测试PE1.3 原文代码 2 多头自注意力模块2.1 多头自注意力代码2.2 测试多头注意力 3 未来序列掩码矩阵3.1 代码3.2 测试掩码 1 位置编码模块 P E ( p o s , 2 i ) sin ⁡ ( p o s / 1000 0 2 i / d m o d e l ) PE(pos,2i)\sin(pos/10000^{2i/d_{\mathrm{model}}}) PE(pos,2i)sin(pos/100002i/dmodel​) P E ( p o s , 2 i 1 ) cos ⁡ ( p o s / 1000 0 2 i / d m o d e l ) PE(pos,2i1)\cos(pos/10000^{2i/d_\mathrm{model}}) PE(pos,2i1)cos(pos/100002i/dmodel​) pos 是序列中每个对象的索引 p o s ∈ [ 0 , m a x s e q l e n ] pos\in [0,max_seq_len] pos∈[0,maxs​eql​en], i i i 向量维度序号 i ∈ [ 0 , e m b e d d i m / 2 ] i\in [0,embed_dim/2] i∈[0,embedd​im/2], d m o d e l d_{model} dmodel​是模型的embedding维度 1.1 PE代码 import numpy as np import matplotlib.pyplot as plt import math import torch import seaborn as snsdef get_pos_ecoding(max_seq_len,embed_dim):# 初始化位置矩阵 [max_seq_len,embed_dim]pe torch.zeros(max_seq_len,embed_dim])position torch.arange(0,max_seq_len).unsqueeze(1) # [max_seq_len,1]print(位置:, position,position.shape)div_term torch.exp(torch.arange(0,embed_dim,2)*-(math.log(10000.0)/embed_dim)) # 除项维度为embed_dim的一半因为对矩阵分奇数和偶数位置进行填充。pe[:,0::2] torch.sin(position/div_term)pe[:,1::2] torch.cos(position/div_term)return pe1.2 测试PE pe get_pos_ecoding(8,4) plt.figure(figsize(8,8)) sns.heatmap(pe) plt.title(Sinusoidal Function) plt.xlabel(hidden dimension) plt.ylabel(sequence length)输出 位置: tensor([[0], [1], [2], [3], [4], [5], [6], [7]]) torch.Size([8, 1]) 除项: tensor([1.0000, 0.0100]) torch.Size([2]) plt.figure(figsize(8, 5)) plt.plot(positional_encoding[1:, 1], labeldimension 1) plt.plot(positional_encoding[1:, 2], labeldimension 2) plt.plot(positional_encoding[1:, 3], labeldimension 3) plt.legend() plt.xlabel(Sequence length) plt.ylabel(Period of Positional Encoding)1.3 原文代码 class PositionalEncoding(nn.Module):Implement the PE function.def __init__(self, d_model, dropout, max_len5000):# max_len 序列最大长度自定义的不是真正的最大长度# d_model 模型嵌入维度super(PositionalEncoding, self).__init__()# 实例化dropout层self.dropout nn.Dropout(pdropout)# Compute the positional encodings once in log space.# 初始化一个位置编码矩阵 shape: (max_len, d_model)pe torch.zeros(max_len, d_model)position torch.arange(0, max_len).unsqueeze(1)div_term torch.exp(torch.arange(0, d_model, 2) * -(math.log(10000.0) / d_model))pe[:, 0::2] torch.sin(position * div_term)pe[:, 1::2] torch.cos(position * div_term)#二维张量扩充为三维张量 shape: (1,max_len, d_model)pe pe.unsqueeze(0)# 将位置编码注册为模型的buffer注册为buffer之后不会进行更新# 注册为buffer后可以再模型保存后重新加载时候将这个位置编码器和模型参数加载进来self.register_buffer(pe, pe) # 注册的名字pe变量也是pedef forward(self, x):# x 序列的嵌入表示# pe是按max_len进行注册的太长了将第二个维度max_len对应的维度缩小为真正的序列x的最大长度# Variable(self.pe[:, :x.size(1)], requires_gradFalse) 即位置编码x x Variable(self.pe[:, :x.size(1)], requires_gradFalse)return self.dropout(x)2 多头自注意力模块 2.1 多头自注意力代码 import torch import torch.nn as nn import torch.nn.functional as F import copy# 复制网络即使用几层网络就改变N的数量 # 如 4层线性层 clones(nn.Linear(model_dim,model_dim),4) def clones(module, N):Produce N identical layers.return nn.ModuleList([copy.deepcopy(module) for _ in range(N)])# 计算注意力 def attention(q, k, v, maskNone, dropoutNone):# q,k,v [bs,-1,head,embed_dim//head], q.size(-1) embed_dim//headd_k q.size(-1)# (head,embed_dim//head)*(embed_dim//head,head)scores torch.matmul(q, k.transpose(-2, -1)) / math.sqrt(d_k)if mask is not None:# 如果使用mask, 0的位置用-1e9填充scores scores.masked_fill(mask 0, -1e9)# 对scores的最后一个维度进行softmaxp_attn F.softmax(scores, dim -1)# 判断是否需要进行dorpout处理if dropout is not None:p_attn dropout(p_attn)# 返回添加注意力后的结果注意力系数return torch.matmul(p_attn, v), p_attn# 计算多头注意力 class Multi_Head_Self_Att(nn.Module):def __init__(self,head,model_dim,dropout0.1):super(Multi_Head_Self_Att,self).__init__()# 判断嵌入维度能否被head整除不能整除抛出异常assert model_dim % head 0self.d_k model_dim//headself.head headself.linears clones(nn.Linear(model_dim,model_dim),4)self.att Noneself.dropout nn.Dropout(pdropout)def forward(self,q,k,v,maskNone):if mask is not None:# 掩码非空扩充维度代表多头中的第n个头mask mask.unsqueeze(1)nbatches q.size(0)# zip函数 将线性层与q,k,v分别对应(self.linears,q),(self.linears,k),(self.linears,v)# q,k,v [bs,-1,head,embed_dim/head]# 使用线性层l处理x,把处理后的x形状view成(nbatches,-1,int(self.head),int(self.d_k)).transpose(1,2)) 第二个维度自适应维度大小# transpose(1,2) 让代表序列长度的维度与词向量的维度相邻q,k,v [l(x).view(nbatches,-1,int(self.head),int(self.d_k)).transpose(1,2) for l,x in zip(self.linears,(q,k,v))] # 返回计算注意力之后的值作为x和注意力分数x, self.attn attention(q, k, v, maskmask, dropoutself.dropout)# 通过多头注意力计算后得到了每个头计算结果组成的4维张量需要将其转换成与输入一样的维度# 将第2个维度和第三个维度换回来维度组成(nbatches,-1,model_dim)# contiguous()使得转置之后的张量能够运用view方法x x.transpose(1, 2).contiguous().view(nbatches, -1, int(self.head * self.d_k))# 之前建立了四个线性层前面qkv用了三个线性层最后一个现成层对注意力结果进行一次线性变换return self.linears[-1](x),self.attn 2.2 测试多头注意力 # 模型参数 head 4 model_dim 128 seq_len 10 dropout 0.1# 生成示例输入 q torch.randn(seq_len, model_dim) k torch.randn(seq_len, model_dim) v torch.randn(seq_len, model_dim)# 创建多头自注意力模块 att Multi_Head_Self_Att(head, model_dim, dropoutdropout)# 运行模块 output,att att(q, k, v)# 输出形状 print(Output shape:, output.shape) print(att.shape()) sns.heatmap(att.squeeze().detach().cpu())输出 Output shape: torch.Size([10, 1, 128]) torch.Size([10, 4, 1, 1]) 3 未来序列掩码矩阵 作用 解码器中的掩码是防止泄露未来要预测的部分掩码矩阵是一个除对角线的上三角矩阵序列填充部分的掩码是判断哪些部位是填充的部位填充的部位在计算注意力时保证期注意力分数为0【以添加一个负无穷的小数使得其softmax值为0】 3.1 代码 def subsequent_mask(size):Mask out subsequent positions.attn_shape (1, size, size)subsequent_mask np.triu(np.ones(attn_shape), k1).astype(uint8)print(掩码矩阵,subsequent_mask)return torch.from_numpy(subsequent_mask) 0测试掩码 plt.figure(figsize(5,5)) print(subsequent_mask(8),subsequent_mask(8).shape) plt.imshow(subsequent_mask(8)[0])掩码矩阵 [[[0 1 1 1 1 1 1 1] [0 0 1 1 1 1 1 1] [0 0 0 1 1 1 1 1] [0 0 0 0 1 1 1 1] [0 0 0 0 0 1 1 1] [0 0 0 0 0 0 1 1] [0 0 0 0 0 0 0 1] [0 0 0 0 0 0 0 0]]] tensor([[[ True, False, False, False, False, False, False, False], [ True, True, False, False, False, False, False, False], [ True, True, True, False, False, False, False, False], [ True, True, True, True, False, False, False, False], [ True, True, True, True, True, False, False, False], [ True, True, True, True, True, True, False, False], [ True, True, True, True, True, True, True, False], [ True, True, True, True, True, True, True, True]]]) torch.Size([1, 8, 8]) 紫色部分为添加掩码的部分 3.2 测试掩码 import torch from torch.autograd import Variable# 函数接受两个参数 tgt 和 pad其中 tgt 是目标序列的张量pad 是表示填充的值 def make_std_mask(tgt, pad):Create a mask to hide padding and future words.# 首先创建一个掩码 tgt_mask其形状与 tgt 的形状相同用于指示哪些位置不是填充位置。# 这是通过将 tgt 张量中不等于 pad 的位置设置为 True1其余位置设置为 False0来实现的。# unsqueeze(-2) 的作用是在倒数第二个维度上添加一个维度以便后续的逻辑运算。tgt_mask (tgt ! pad).unsqueeze(-2)# 调用 subsequent_mask 函数生成一个用于遮挡未来词的掩码。这个掩码是一个上三角矩阵# 其对角线及其以下的元素为 True1其余元素为 False0。# tgt_mask tgt_mask Variable(subsequent_mask(tgt.size(-1)).type_as(tgt_mask.data))# 将 tgt_mask 和生成的未来词掩码进行逻辑与操作将未来词位置的掩码设置为 False即遮挡掉未来词。tgt_mask tgt_mask Variable(subsequent_mask(tgt.size(-1)).type_as(tgt_mask.data))return tgt_maskdef subsequent_mask(size):Mask out subsequent positions.attn_shape (1, size, size)subsequent_mask torch.triu(torch.ones(*attn_shape), diagonal1)return subsequent_mask 0# 示例数据 tgt torch.tensor([[1, 2, 3, 0, 0], [4, 5, 0, 0, 0], [6, 7, 8, 9, 10]]) # 目标序列假设填充值为 0 pad 0 # 填充值# 创建掩码 tgt_mask make_std_mask(tgt, pad)# 打印结果 print(目标序列) print(tgt) print(\n生成的掩码) print(tgt_mask)输出 目标序列 tensor([[ 1, 2, 3, 0, 0], [ 4, 5, 0, 0, 0], [ 6, 7, 8, 9, 10]]) 生成的掩码 tensor([[[ True, False, False, False, False], [ True, True, False, False, False], [ True, True, True, False, False], [ True, True, True, False, False], [ True, True, True, False, False]], [[ True, False, False, False, False], [ True, True, False, False, False], [ True, True, False, False, False], [ True, True, False, False, False], [ True, True, False, False, False]], [[ True, False, False, False, False], [ True, True, False, False, False], [ True, True, True, False, False], [ True, True, True, True, False], [ True, True, True, True, True]]])
http://www.hkea.cn/news/14338398/

相关文章:

  • 如何做网站答题领红包链接wordpress 简单
  • 做网站网页版和手机版如何建设类似大众点评网站
  • 怎么用vscode做网站优化网站的软件
  • 没有网站做分类信息群发wordpress仿站视频教程
  • 房产类网站开发广告公司名字免费起名大全
  • 企业如何做好网站的seo优化ui设计的工作流程
  • 外贸网站contact获取网站访客信息
  • 导购网站免费推广网站备案怎么换
  • 青色系网站计算机基础网页制作题
  • 做个网站需要什么步骤资源网站建设活动感受
  • 权威迷失传奇新开网站wordpress政企网站
  • 章丘营销型网站建设创客贴网页设计网站
  • 网站推广到海外怎么做360竞价推广怎么做
  • 宁波外贸网站推广wordpress通过tag获取文章
  • 网站找建站公司做网站需要空间
  • wordpress集团网站模板网站和定制网站有什么区别
  • 天津建设项目验收公示网站网站标题关键词描述
  • 娱乐游戏网站建设平面设计师培训
  • 东莞高端网站建设收费标准嵌入式软件开发工程师证书
  • 制作图网 专业图片在线制作网站软件兼职平台
  • 工业网站开发商做设计什么网站可以兼职
  • 阿里云1m 宽带做网站服务器番禺网站建设培训班
  • 购物网站设计的目的Wordpress屏蔽国内iip
  • 官方网站包括哪几个网站wordpress wp_term_taxonomy
  • 哪个网站在线做头像好网站设计论文的题目
  • 招代理网站怎么做wordpress图片收费
  • 网站建设业务员招聘广州网络引流公司
  • 青岛网站设计 网站建设淘宝客网站备案流程
  • 网站建设内容论文seo管家
  • 广东专业网站建设报价应用最广网站建设技术