当前位置: 首页 > news >正文

仿牌 镜像网站快速排名怎么做

仿牌 镜像网站,快速排名怎么做,中铁建设集团内网登录,中山网站建设哪家强InfoNCE Loss公式及源码理解–从交叉熵损失谈起 当谈论到信息论中的损失函数时#xff0c;InfoNCE#xff08;Noise Contrastive Estimation#xff09;和交叉熵损失都是两个关键的概念。它们不仅在衡量概率分布之间的差异方面发挥着重要作用#xff0c;而且在深度学习的自…InfoNCE Loss公式及源码理解–从交叉熵损失谈起 当谈论到信息论中的损失函数时InfoNCENoise Contrastive Estimation和交叉熵损失都是两个关键的概念。它们不仅在衡量概率分布之间的差异方面发挥着重要作用而且在深度学习的自监督学习领域扮演着重要角色。虽然它们的形式和应用环境有所不同但是我们可以发现它们之间存在着微妙的联系。 交叉熵损失作为衡量两个概率分布之间距离的指标在分类任务和神经网络训练中广泛使用。而InfoNCE Loss则是针对自监督学习任务中特征学习的一种损失函数。它通过比较正样本和负样本的相似性来学习模型参数从而提高特征的区分度。 在这篇博客中我们将深入探讨交叉熵损失和InfoNCE之间的联系探究它们在信息论和深度学习中的联系与异同。我们将分析两者的数学形式、应用领域以及它们之间可能的内在关系以期对这两个重要概念有更深入的理解。 InfoNCE InfoNCE LossNoise Contrastive Estimation Loss是一种用于自监督学习的损失函数通常用于学习特征表示或者表征学习。它基于信息论的思想通过对比正样本和负样本的相似性来学习模型参数。 公式介绍 InfoNCE Loss的公式如下 InfoNCE Loss − 1 N ∑ i 1 N log ⁡ ( exp ⁡ ( q i ⋅ k i τ ) ∑ j 1 N exp ⁡ ( q i ⋅ k j − τ ) ) \text{InfoNCE Loss} -\frac{1}{N} \sum_{i1}^{N} \log \left( \frac{\exp \left( \frac{q_i \cdot k_{i^}}{\tau} \right)}{\sum_{j1}^{N} \exp \left( \frac{q_i \cdot k_{j^-}}{\tau} \right)} \right) InfoNCE Loss−N1​i1∑N​log ​∑j1N​exp(τqi​⋅kj−​​)exp(τqi​⋅ki​​)​ ​ 其中 N N N是样本的数量 q i q_i qi​是查询样本 i i i的编码向量 k i k_{i} ki​是与查询样本 i i i相对应的正样本的编码向量 k i − k_{i-} ki−​是与查询样本 i i i不对应的负样本的编码向量 τ \tau τ是温度系数用于调节相似度得分的分布后面会详细讨论 算法思想 从INfoNCE的公式中我们可以发现分子只包含一对正样本分母则包含一个batch下的 N N N个所有样本即1个与 q i q_i qi​对应的正样本和 ( N − 1 ) (N-1) (N−1)个负样本那么上述公式我们也可以简化为下述形式 InfoNCE Loss − 1 N ∑ i 1 N log ⁡ A A B − \text{InfoNCE Loss} -\frac{1}{N} \sum_{i1}^{N} \log\frac{A_}{A_B_-} InfoNCE Loss−N1​i1∑N​logA​B−​A​​ 首先分式部分一定是介于(0,1)之间的而log在01之间是单增的且函数值小于0 在损失优化过程中我们希望达成的结果是 A A_ A​尽可能大也就是正样本之间的距离尽可能尽其实也隐含着与负样本之间的相似度尽可能低距离尽可能远。从公式上来看我们在最小化loss的过程中需要让公式接近0也就是让log内部的分式接近1要达到这个效果应该使 A B AB AB可以发现跟我们的训练思路是吻合的这就达到了对于查询向量而言推近它和正样本之间的距离拉远它和负样本的距离 写到这里基本上把InfoNCE的公式以及公式背后的主要思想讲清楚了下面就要说Cross Entropy Loss跟它的关系了其实主要还是InfoNCELoss代码是基于交叉熵损失实现的看不明白交叉熵损失的代码逻辑也看不懂InfoNCELoss了 Cross Entropy Loss 交叉熵损失是衡量两个概率分布之间差异的一种指标。在分类问题中我们通常有一个真实的概率分布 P P P通常是一个独热编码向量代表了样本的真实标签分布和一个模型预测的概率分布 Q Q Q。交叉熵损失用于衡量这两个概率分布之间的差异。 其数学公式为 CrossEntropy ( P , Q ) − ∑ i P ( i ) ⋅ log ⁡ ( Q ( i ) ) \text{CrossEntropy}(P, Q) - \sum_i P(i) \cdot \log(Q(i)) CrossEntropy(P,Q)−i∑​P(i)⋅log(Q(i)) P ( i ) P(i) P(i) 是真实标签的概率分布代表了样本属于类别 i i i的概率 Q ( i ) Q(i) Q(i)是模型预测的概率分布代表了模型对样本属于类别 i i i的预测概率 l o g log log 是自然对数函数。 交叉熵损失的含义和主要思想是在真实分布和模型预测分布之间衡量误差。当模型的预测与真实情况相符时交叉熵损失会趋近于0。换句话说交叉熵损失函数的优化目标是使得模型的预测概率分布尽可能地接近真实标签的概率分布以最小化误差。 在深度学习中交叉熵损失通常用作分类任务中的损失函数在训练过程中用来衡量模型预测与真实标签之间的差异并通过反向传播来优化模型参数。 结合上述解释下面来看一下交叉熵损失的代码 创建原始数据样例 x:3row x 4col的张量表示数据中包含三条数据每条数据预测四个类别 y:3d张量与三条数据对应每个元素属于0-3与四个类别对应# 1.创建原始数据 xtorch.rand((3,4)) ytorch.tensor([3,0,2])# 2.计算x_sfmsoftmax(x)求出归一化后的每个类别概率值 softmax_funcnn.Softmax() x_sfmsoftmax_func(x)# 3.计算log(x_sfm)由于原来的概率值位于0-1取对数后一定是负值 # 概率值越大取对数后的绝对值越小符合我们的损失目标 x_logtorch.log(x_sfm)# ls nn.LogSoftmax(dim1)# 也可以使用nn.LogSoftmax()进行测试二者结果一致 # print(ls(x))# 4.最后使用nn.NLLLoss求损失 # 思路按照交叉熵的计算过程将真值与经过LogSoftmax后的预测值求和取平均 indexrange(len(x)) lossx_log[index,y] print(abs(sum(loss)/len(x)))从代码中可以很好理解交叉熵如何发挥作用并且也能理解交叉熵的真值标签为啥只是一维张量 InfoNCE loss 代码 import torch import torch.nn.functional as Fdef approx_infoNCE_loss(q, k):# 计算query和key的相似度得分similarity_scores torch.matmul(q, k.t()) # 矩阵乘法计算相似度得分# 计算相似度得分的温度参数temperature 0.07# 计算logitslogits similarity_scores / temperature# 构建labels假设有N个样本N q.size(0)labels torch.arange(N).to(logits.device)# 计算交叉熵损失loss F.cross_entropy(logits, labels)return loss
http://www.hkea.cn/news/14260252/

相关文章:

  • 吴桥做网站东莞网页设计哪家设计网站好?
  • 郑州国际装备制造业会展网站的建设百度有专做优化的没
  • 公司网站制作服务烟台免费网站建设
  • 永州城乡建设网站上海市建设安装协会网站
  • 餐饮网站建设案例网页制作代码简单
  • 利用网站做淘宝客企业163邮箱登录
  • 仪征市城乡建设局网站佛山新网站建设怎么样
  • 单位网站建设情况调查情况安徽建设银行 招聘网站
  • 冷水江网站主题网站建设平台
  • 张家港网站建设桐柏微网站建设
  • 企业网站搭建费用wordpress 抱歉您不能访问此页面
  • 外贸网站建设长沙设计师建站网站
  • 网站建设新闻++常识网站建设基本功能
  • 网站用什么建设wordpress怎么修改菜单栏关键词
  • 建设网站必备的开发工具装饰工程预算与报价
  • 西安志成网站建设公司建筑公司网站管理员
  • 门户网站建设 考核温州做网站优化
  • 互动网站欣赏做外贸卖小商品是哪个网站
  • 东莞住房和城乡建设厅网站做百度手机网站点击
  • 展示网站开发软件开发详细流程
  • asp做网站的缺点湖南建筑人才网招聘
  • 自己用自己电脑做网站空间知乎 网站建设
  • 淘宝网站icp备案wordpress仿36kr主题
  • 学校官方网站个人信用信息服务平台
  • 网站建设付款页面WordPress导入hexo
  • 在建设局网站上怎么样总监解锁杭州网络营销推广公司
  • 怎么做黑客攻击网站网站域名收费
  • o2o平台网站建设wordpress前端验证
  • 建筑工程 技术支持 东莞网站建设360建筑网证书估价
  • 做网站需要多少深圳微信商城网站设计费用