当前位置: 首页 > news >正文

视频封面制作网站企业宣传文案模板

视频封面制作网站,企业宣传文案模板,工作手机,wordpress cdn配置位置编码 (Positional Encoding) 位置编码是在自然语言处理中#xff0c;特别是在 Transformer 架构中使用的一个重要概念。Transformer 架构由于其自注意力机制 (Self-Attention Mechanism) 的特性#xff0c;对序列中的元素没有固有的顺序感知。这意味着#xff0c;如果不…位置编码 (Positional Encoding) 位置编码是在自然语言处理中特别是在 Transformer 架构中使用的一个重要概念。Transformer 架构由于其自注意力机制 (Self-Attention Mechanism) 的特性对序列中的元素没有固有的顺序感知。这意味着如果不加以处理Transformer 无法区分序列中的元素的相对位置。为了解决这个问题位置编码被引入。 位置编码的重要性 位置编码的重要性主要体现在以下几点 序列顺序的感知在许多任务中如机器翻译、文本生成等元素的顺序是非常关键的。位置编码确保 Transformer 可以考虑到这种顺序。增强模型的表达能力位置编码为模型提供了额外的信息使其能够更好地理解和生成序列。灵活性位置编码是可学习的这意味着模型可以在训练过程中调整它以更好地适应特定的任务。与自注意力机制的结合位置编码与自注意力机制结合使 Transformer 能够考虑到序列中的长距离依赖关系。 图像中的位置编码 在图像处理中位置编码的引入与自然语言处理中的方法有所不同但基本的原理是相似的为模型提供空间位置信息。以下是几种在图像处理中引入位置编码的方法 1. 二维位置编码 与自然语言处理中的一维位置编码不同图像通常需要二维的位置编码来表示其宽度和高度。这可以通过为每个像素或区域分配一个二维编码来实现。 2. 绝对位置编码 为图像中的每个像素或区域分配一个固定的编码表示其在图像中的绝对位置。 3. 相对位置编码 与绝对位置编码不同相对位置编码表示一个像素或区域与其他像素或区域之间的相对位置关系。 4. 位置嵌入 (Position Embeddings) 这是一种学习位置信息的方法。与位置编码不同位置嵌入是在模型训练过程中学习的而不是预先定义的。 5. 卷积操作 卷积神经网络 (CNN) 通过其卷积操作隐式地捕获位置信息。但在某些无卷积的模型结构中如 Vision Transformer (ViT)需要显式地引入位置编码。 6. 扩展到更高维度 对于视频或3D图像可以考虑引入三维或更高维度的位置编码。 7. 组合方法 在某些应用中可能需要同时使用多种方法来捕获位置信息例如结合绝对位置编码和相对位置编码。 绝对位置编码 绝对位置编码是为序列中的每个位置分配一个固定的编码这个编码表示该位置在整个序列中的确切位置。这种编码方式不依赖于其他位置因此被称为“绝对”。 特点 固定编码每个位置都有一个预定义的编码不受其他位置的影响。独立性绝对位置编码不考虑其他位置只关注当前位置。常见实现在 Transformer 模型中通常使用正弦和余弦函数来生成绝对位置编码。 相对位置编码 相对位置编码不是直接编码每个位置而是编码两个位置之间的相对距离。例如对于一个给定的位置其与其他位置的相对位置编码将表示它们之间的距离或关系。 特点 距离感知相对位置编码捕获了两个位置之间的距离或关系。动态性相对于一个固定的参考点其他位置的编码会发生变化。应用场景在某些模型中如 Transformer 的自注意力机制相对位置编码可以帮助模型捕获长距离的依赖关系。 对比 稳定性绝对位置编码为每个位置提供了一个稳定的、不变的编码而相对位置编码则依赖于参考位置。灵活性相对位置编码可以更灵活地捕获位置之间的关系而绝对位置编码则更注重每个位置本身。实现复杂性相对位置编码的实现通常比绝对位置编码更复杂因为它需要考虑两个位置之间的关系。 绝对位置编码 绝对位置编码在 Transformer 模型中使用正弦和余弦函数来表示每个位置的信息。 公式 对于偶数维度 (i): P E ( p o s , 2 i ) sin ⁡ ( p o s 1000 0 2 i d model ) PE(pos, 2i) \sin\left(\frac{pos}{10000^{\frac{2i}{d_{\text{model}}}}}\right) PE(pos,2i)sin(10000dmodel​2i​pos​) 对于奇数维度 (i): P E ( p o s , 2 i 1 ) cos ⁡ ( p o s 1000 0 2 i d model ) PE(pos, 2i1) \cos\left(\frac{pos}{10000^{\frac{2i}{d_{\text{model}}}}}\right) PE(pos,2i1)cos(10000dmodel​2i​pos​) 其中 P E ( p o s , 2 i ) PE(pos, 2i) PE(pos,2i)是位置 p o s pos pos 在维度 i i i的位置编码。 d model d_{\text{model}} dmodel​是模型的维度。 代码分析 代码中的这一部分 div_term np.exp(np.arange(0, d_model, 2) * -(np.log(10000.0) / d_model))实际上是在计算上述公式的除数部分 div_term 1000 0 2 i d model \text{div\_term} 10000^{\frac{2i}{d_{\text{model}}}} div_term10000dmodel​2i​ 当我们对上述公式取自然对数我们得到 log ⁡ ( div_term ) 2 i d model log ⁡ ( 10000 ) \log(\text{div\_term}) \frac{2i}{d_{\text{model}}} \log(10000) log(div_term)dmodel​2i​log(10000) 这与代码中的形式相匹配其中 np.exp 是为了从对数形式回到原始的指数形式。 Python 实现 import numpy as np def get_positional_encoding(seq_len, d_model):position np.arange(seq_len)[:, np.newaxis]div_term np.exp(np.arange(0, d_model, 2) * -(np.log(10000.0) / d_model))position_encoding np.zeros((seq_len, d_model))position_encoding[:, 0::2] np.sin(position * div_term)position_encoding[:, 1::2] np.cos(position * div_term)return position_encoding相对位置编码 相对位置编码主要用于增强 Transformer 中的自注意力机制对位置信息的感知。在原始的 Transformer 模型中注意力权重是基于查询Q、键K和值V来计算的。当引入相对位置编码时我们会修改注意力权重的计算方式使其同时考虑相对位置信息。 使用相对位置编码的简化步骤 计算相对位置编码首先使用提供的 relative_positional_encoding 函数计算相对位置编码。计算注意力权重在计算自注意力的 Q 和 K 的点积时将相对位置编码添加到结果中。这可以通过将相对位置编码与 Q 的每一行相乘并求和来实现。归一化注意力权重使用 softmax 函数归一化注意力权重。计算输出使用归一化的注意力权重与 V 相乘得到自注意力的输出。 Python 代码示例 import numpy as npclass SelfAttentionWithRelativePosition:def __init__(self, d_model, seq_len):self.d_model d_modelself.seq_len seq_lenself.scale np.sqrt(d_model)# 初始化权重self.WQ np.random.rand(d_model, d_model)self.WK np.random.rand(d_model, d_model)self.WV np.random.rand(d_model, d_model)# 获取相对位置编码self.relative_pos_encoding self.relative_positional_encoding(seq_len, d_model)def relative_positional_encoding(self, seq_len, d_model):position np.arange(seq_len)relative_position_matrix position[:, np.newaxis] - position[np.newaxis, :]relative_position_matrix np.clip(relative_position_matrix seq_len, 0, 2 * seq_len - 1)div_term np.exp(np.arange(0, d_model, 2) * -(np.log(10000.0) / d_model))sinusoid_table np.zeros((2 * seq_len, d_model))sinusoid_table[:, 0::2] np.sin(relative_position_matrix * div_term)sinusoid_table[:, 1::2] np.cos(relative_position_matrix * div_term)return sinusoid_table[relative_position_matrix]def forward(self, Q, K, V):Q np.matmul(Q, self.WQ)K np.matmul(K, self.WK)V np.matmul(V, self.WV)attn_logits np.matmul(Q, K.T) / self.scaleattn_logits np.matmul(Q, self.relative_pos_encoding.T)attn_weights np.exp(attn_logits) / np.sum(np.exp(attn_logits), axis-1, keepdimsTrue)output np.matmul(attn_weights, V)return output# 示例 seq_len 10 d_model 512 Q np.random.rand(1, d_model) K np.random.rand(seq_len, d_model) V np.random.rand(seq_len, d_model)attention_layer SelfAttentionWithRelativePosition(d_model, seq_len) output attention_layer.forward(Q, K, V) print(output)
http://www.hkea.cn/news/14350431/

相关文章:

  • 在哪里创建网站平台wordpress改造微博主题
  • 网站安全检测工具网站做友链有行业要求吗
  • 网站建设合同附加协议中关村在线手机对比平台
  • 企业网站的建立wordpress 待办事项
  • 国际新闻最新消息今天乌克兰与俄罗斯视频自建网站怎么做优化
  • 如何知道网站有没有备案南京网络营销
  • 盐城做网站的公司地址wordpress客户端配置
  • 做电商网站都需要学什么软件装饰公司哪家口碑好
  • 商城微网站模板陕西网站制作电话
  • 自己做网站详细流程热点新闻
  • 怎么给公司注册网站空间查看网站
  • 公司名注册查询网站做网页和网站一样吗
  • 网站功能简介网络营销的本质
  • 网站维护的主要内容包括深圳建站公司品牌网站建设
  • 常用于网站推广的营销手段是php商城网站开发实例视频
  • 微信清粉网站开发免费投放广告平台
  • 河南平台网站建设公司公众号怎么制作内容
  • 只做移动端的网站网站不显示域名解析错误怎么办
  • 洛阳制作网站公司gta5买房子网站建设
  • 肥城做网站tahmwlkj网站开发需求统计
  • 贵州网站建设dede网站更新如何同步腾讯微博更新
  • 做电影网站如何不侵权网站优化目标
  • 云建站重庆建网站计划
  • 做海报的素材哪个网站免费建站网站排名
  • 锋云科技网站建设苏州seo怎么做
  • 怎样建网站得花多少钱qq手机版
  • 买个网站域名要多少钱dw制作wap网站怎么做
  • 版式网站有哪些百度网盟推广官方网站
  • 宜春市城乡规划建设局网站渭南建设网
  • python网站开发工程师win10系统优化软件哪个好