当前位置: 首页 > news >正文

如何删除网站后台的文章idc数据中心排名

如何删除网站后台的文章,idc数据中心排名,摄影作品网站风景,北京网站制作很好 乐云践新理解 KL 散度及其公式推导过程 在信息论和概率论中#xff0c;KL散度#xff08;Kullback-Leibler Divergence#xff09;是衡量两个概率分布之间差异的重要工具。本文将从 KL 散度的定义入手#xff0c;详细解析其公式来源以及如何将其改写为一个可用于优化的形式。 1. 什…理解 KL 散度及其公式推导过程 在信息论和概率论中KL散度Kullback-Leibler Divergence是衡量两个概率分布之间差异的重要工具。本文将从 KL 散度的定义入手详细解析其公式来源以及如何将其改写为一个可用于优化的形式。 1. 什么是 KL 散度 KL 散度是一个非对称的测度用来衡量一个概率分布 ( p ( x ) p(x) p(x)) 与另一个近似分布 ( q ( x ) q(x) q(x)) 之间的距离。其数学定义为 D K L ( p ∣ ∣ q ) ∫ p ( x ) ln ⁡ p ( x ) q ( x ) d x D_{KL}(p || q) \int p(x) \ln \frac{p(x)}{q(x)} dx DKL​(p∣∣q)∫p(x)lnq(x)p(x)​dx 各符号含义 ( p ( x ) p(x) p(x))目标分布通常是数据生成的真实分布。( q ( x ) q(x) q(x))近似分布通常是由模型参数 ( θ \theta θ) 决定的分布。( D K L ( p ∣ ∣ q ) D_{KL}(p || q) DKL​(p∣∣q))衡量 ( p ( x ) p(x) p(x)) 和 ( q ( x ) q(x) q(x)) 差异的值越接近零表示两个分布越相似。 KL 散度具有以下性质 非负性( D K L ( p ∣ ∣ q ) ≥ 0 D_{KL}(p || q) \geq 0 DKL​(p∣∣q)≥0)只有当 ( p ( x ) q ( x ) p(x) q(x) p(x)q(x)) 时取等号。非对称性( D K L ( p ∣ ∣ q ) ≠ D K L ( q ∣ ∣ p ) D_{KL}(p || q) \neq D_{KL}(q || p) DKL​(p∣∣q)DKL​(q∣∣p))。 直观理解 KL 散度可以理解为在分布 ( q ( x ) q(x) q(x)) 下编码 ( p ( x ) p(x) p(x)) 数据的额外开销。它回答了这样一个问题“如果我们用 ( q ( x ) q(x) q(x)) 来近似 ( p ( x ) p(x) p(x))会带来多大的信息损失” 2. KL 散度的分解形式 我们可以将 KL 散度公式展开为以下形式 D K L ( p ∣ ∣ q ) ∫ p ( x ) ln ⁡ p ( x ) d x − ∫ p ( x ) ln ⁡ q ( x ) d x D_{KL}(p || q) \int p(x) \ln p(x) dx - \int p(x) \ln q(x) dx DKL​(p∣∣q)∫p(x)lnp(x)dx−∫p(x)lnq(x)dx 两部分含义 第一项( ∫ p ( x ) ln ⁡ p ( x ) d x \int p(x) \ln p(x) dx ∫p(x)lnp(x)dx) 表示分布 ( p ( x ) p(x) p(x)) 的熵是一个与 ( q ( x ) q(x) q(x)) 无关的常数。在优化过程中可以忽略因为它对参数 ( θ \theta θ) 不产生影响。 第二项( − ∫ p ( x ) ln ⁡ q ( x ) d x -\int p(x) \ln q(x) dx −∫p(x)lnq(x)dx) 这一项描述了分布 ( q ( x ) q(x) q(x)) 对目标分布 ( p ( x ) p(x) p(x)) 的拟合程度是我们关注的重点。 3. 样本均值近似的引入 在实际问题中我们通常无法直接获得目标分布 ( p ( x ) p(x) p(x))而是通过有限的训练样本 ( D { x 1 , x 2 , … , x N } D \{x_1, x_2, \ldots, x_N\} D{x1​,x2​,…,xN​}) 来对 ( p ( x ) p(x) p(x)) 进行估计。因此KL 散度公式中的期望 ( ∫ p ( x ) f ( x ) d x \int p(x) f(x) dx ∫p(x)f(x)dx) 可以通过样本均值进行近似 ∫ p ( x ) ln ⁡ q ( x ) d x ≈ 1 N ∑ i 1 N ln ⁡ q ( x i ∣ θ ) \int p(x) \ln q(x) dx \approx \frac{1}{N} \sum_{i1}^N \ln q(x_i|\theta) ∫p(x)lnq(x)dx≈N1​i1∑N​lnq(xi​∣θ) 这里 ( N N N)训练样本的数量。( { x 1 , x 2 , … , x N } \{x_1, x_2, \ldots, x_N\} {x1​,x2​,…,xN​})从分布 ( p ( x ) p(x) p(x)) 中采样得到的独立同分布数据。 将上述近似代入 KL 散度公式得到 D K L ( p ∣ ∣ q ) ≈ − 1 N ∑ i 1 N ln ⁡ q ( x i ∣ θ ) 常数项 D_{KL}(p || q) \approx -\frac{1}{N} \sum_{i1}^N \ln q(x_i|\theta) \text{常数项} DKL​(p∣∣q)≈−N1​i1∑N​lnq(xi​∣θ)常数项 4. 忽略常数项后的优化目标 由于第一项 ( ∫ p ( x ) ln ⁡ p ( x ) d x \int p(x) \ln p(x) dx ∫p(x)lnp(x)dx) 是与参数 ( θ \theta θ) 无关的常数项在优化过程中可以忽略。因此KL 散度的优化目标最终简化为 优化目标 − 1 N ∑ i 1 N ln ⁡ q ( x i ∣ θ ) \text{优化目标} -\frac{1}{N} \sum_{i1}^N \ln q(x_i|\theta) 优化目标−N1​i1∑N​lnq(xi​∣θ) 理解优化目标 这实际上是 负对数似然函数Negative Log-Likelihood, NLL即用模型分布 ( q ( x ∣ θ ) q(x|\theta) q(x∣θ)) 拟合训练样本的目标。 为了方便表达加入一项 ( 1 N ∑ i 1 N ln ⁡ p ( x i ) \frac{1}{N} \sum_{i1}^N \ln p(x_i) N1​∑i1N​lnp(xi​))使得最终结果变为 D K L ( p ∣ ∣ q ) ≈ 1 N ∑ i 1 N { − ln ⁡ q ( x i ∣ θ ) ln ⁡ p ( x i ) } D_{KL}(p || q) \approx \frac{1}{N} \sum_{i1}^N \{-\ln q(x_i|\theta) \ln p(x_i)\} DKL​(p∣∣q)≈N1​i1∑N​{−lnq(xi​∣θ)lnp(xi​)} 5. 总结与意义 通过以上分析我们将 KL 散度公式从理论形式逐步推导为一个可以应用于机器学习模型训练的形式。关键步骤包括 利用训练样本的经验分布对积分项进行近似忽略与参数无关的常数项聚焦于对分布 ( q ( x ∣ θ q(x|\theta q(x∣θ)) 的优化。 最终的形式表明最小化 KL 散度实际上等同于最大化模型的对数似然函数MLE。 KL 散度的这一性质广泛应用于生成模型如变分自编码器 VAE和深度学习优化中帮助我们更好地逼近目标分布。 6. 代码实现示例 我们还可以通过代码展示如何在实际中实现 KL 散度的计算 import numpy as np# 假设目标分布 p 和近似分布 q p np.array([0.2, 0.5, 0.3]) # 目标分布 q np.array([0.3, 0.4, 0.3]) # 近似分布# 计算 KL 散度 kl_divergence np.sum(p * np.log(p / q)) print(fKL散度: {kl_divergence:.4f})运行结果可以帮助我们直观理解 KL 散度的计算和其在概率分布拟合中的重要性。 希望这篇文章对你理解 KL 散度的公式推导过程有所帮助。 后记 2024年11月27日15点32分于上海。
http://www.hkea.cn/news/14294390/

相关文章:

  • 网站开发需要有登陆界面的网站长春 餐饮 网站建设
  • 做网站平台的营业执照wap是什么意思中文翻译
  • 网站建设亇金手指下拉排名亅用app怎么样建网站
  • 有什么软件可以做网站关于网站建设的论文
  • 网站设计不需要考虑宁波装修公司网站制作
  • 如何设置中国建设银行网站首页工业设计招聘
  • wordpress本地使用重庆seo俱乐部联系方式
  • 40个免费网站推广平台阿里云虚拟主机可以做两个网站
  • 腾讯网qq网站王也个人资料
  • 做吃穿住行网站网站建设中广告法绝对化用语整理
  • html网站欣赏网站开发工具书
  • 盐城网站建设制作工作室什么叫百度竞价推广
  • 怎么建设网站后台衡阳房产网站建设
  • 手机版网站建设报价易语言如何做网站
  • 南昌房产网官方网站wordpress 文章列表顺序
  • 2014个人网站备案扬中人才
  • 销售产品做单页还是网站章丘建设局网站
  • 小城镇建设网站并阐述观点西安做网站公
  • 建设网站时的常见故障分类广州专业展台制作
  • asp.net mvc5网站开发之美昆明企业免费建站
  • 东莞寮步网站建设上海网站建设备案号怎么恢复
  • 建个人网站需要钱嘛网站的大小
  • php空间放多个网站公司建设网站多少钱
  • qt 网站开发东莞大型企业
  • 长沙网络推广小公司深圳seo优化推广
  • 青岛网站建设哪个好wordpress iis7
  • 营销型网站设计模板网站预算表怎么做
  • 如何将vs做的网站备份出来网络推广宣传方式
  • 招商局网站建设管理总结优化关键词可以选择哪个工具
  • 建设平台网站协议品牌建设 网站