建网站浩森宇特,暴雪游戏有哪些,龙武工会网站怎么做,关于做网站的书籍nn.Linear 是 PyTorch 中的一个线性层#xff08;全连接层#xff09;#xff0c;用于将输入张量从一个维度空间映射到另一个维度空间。具体来说#xff0c;nn.Linear 执行以下操作#xff1a; outputinputweightTbias 其中#xff1a; input 是输入张量。 weight 是权重…nn.Linear 是 PyTorch 中的一个线性层全连接层用于将输入张量从一个维度空间映射到另一个维度空间。具体来说nn.Linear 执行以下操作 outputinput×weightTbias 其中 input 是输入张量。 weight 是权重矩阵。 bias 是偏置项如果 biasTrue。 具体作用 输入维度 假设键key的维度为 key_size即每个键是一个形状为 (key_size,) 的向量。 输出维度 通过 nn.Linear(key_size, num_hiddens)键被映射到一个新的维度空间即每个键被转换为一个形状为 (num_hiddens,) 的向量。 权重矩阵 nn.Linear 会自动创建一个形状为 (key_size, num_hiddens) 的权重矩阵 W_k。 这个权重矩阵将在训练过程中通过反向传播进行优化以学习如何将键从 key_size 维度映射到 num_hiddens 维度。 示例 - import torch
import torch.nn as nn# 假设 key_size 64, num_hiddens 128
key_size 64
num_hiddens 128# 定义线性层 W_k
W_k nn.Linear(key_size, num_hiddens, biasFalse)# 假设 K 的形状为 (batch_size, sequence_length, key_size)
batch_size 2
sequence_length 5
K torch.randn(batch_size, sequence_length, key_size)# 应用线性变换
K_transformed W_k(K)print(K_transformed.shape)输出为torch.Size([2, 5, 128]) 解释 输入键张量 K 的形状为 (2, 5, 64)表示批量大小为 2序列长度为 5每个键的维度为 64。 输出经过线性变换后K_transformed 的形状为 (2, 5, 128)表示每个键被映射到了 128 维的隐藏层空间。