株洲网站开发公司,哈尔滨建设网站平台,wordpress时间不准,做照片视频的网站这个是层归一化。我们输入一个参数#xff0c;这个参数就必须与最后一个维度对应。但是我们也可以输入多个维度#xff0c;但是必须从后向前对应。
import torch
import torch.nn as nna torch.rand((100,5))
c nn.LayerNorm([5])
print(c(a).shape)a torch.rand((100,5,…这个是层归一化。我们输入一个参数这个参数就必须与最后一个维度对应。但是我们也可以输入多个维度但是必须从后向前对应。
import torch
import torch.nn as nna torch.rand((100,5))
c nn.LayerNorm([5])
print(c(a).shape)a torch.rand((100,5,8,9))
c nn.LayerNorm([9])
print(c(a).shape)a torch.rand((100,5,8,9))
c nn.LayerNorm([8,9])
print(c(a).shape)a torch.rand((100,5,8,9))
c nn.LayerNorm([5,8,9])
print(c(a).shape)