当前位置: 首页 > news >正文

做视频网站用什么云盘好政务网站开发方案

做视频网站用什么云盘好,政务网站开发方案,企业网站建设需求调研表,山东seo网络营销推广KAN: Kolmogorov-Arnold Networks code#xff1a;https://github.com/KindXiaoming/pykan Background ​ 多层感知机#xff08;MLP#xff09;是机器学习中拟合非线性函数的默认模型#xff0c;在众多深度学习模型中被广泛的应用。但MLP存在很多明显的缺点#xff1a;…KAN: Kolmogorov-Arnold Networks codehttps://github.com/KindXiaoming/pykan Background ​ 多层感知机MLP是机器学习中拟合非线性函数的默认模型在众多深度学习模型中被广泛的应用。但MLP存在很多明显的缺点 **参数量大**Transformer中MLP几乎消耗了所有非嵌入参数。**缺乏可解释性**在没有后期分析工具的情况下相较于注意力层通常难以解释。 Novelty ​ 受到Kolmogorov-Arnold 表示定理启发提出了一种有希望的MLP替代方案称为Kolmogorov-Arnold Networks(KANs)。 ​ MLP将固定的激活函数放在节点(“神经元”)上而KAN将可学习的激活函数放在边缘(“权重”)上。 ​ 对于PDE求解2x10 的KAN比4x100 MLP精确100倍10−7 vs 10−5 MSE参数效率高100倍 1 0 2 10^2 102 vs 1 0 4 10^4 104参数。 Method Kolmogorov-Arnold表示定理 基本形式 ​ 这个公式仅仅包含两层非线性和少量的隐藏层项2n1。这意味着原始的表示方法虽然理论上是完备的但在处理实际问题时可能因表达能力受限而不够有效。 ​ 本文将把网络泛化到任意宽度和深度可以增加模型的复杂度和学习能力使得网络能够更好地逼近和表达各种复杂的函数。 KAN结构 把网络泛化到任意宽度和深度 激活函数 ​ c i c_i ci​是可训练的。原则上w是多余的因为它可以被包括到b(x)和spline(x)中。然而KAN中仍使用了w以更好地控制激活函数的总体大小。 初始化 ​ 每个激活函数初始化为 s p l i n e ( x ) ≈ 0 spline(x)≈0 spline(x)≈0。w根据Xavier初始化进行初始化。 网格扩展 ​ 增加MLP的宽度和深度可以提高性能但不同大小的MLP训练是独立的训练这些模型的成本很高。 ​ KAN可以先用一个参数较少的模型进行训练然后通过使其样条网格更精细将其扩展到具有更多参数的KAN而不需要从头开始重新训练更大的模型。通过以下公式利用最小二乘法来获得细网格的参数 简化KAN ​ 从一个足够大的KAN开始用稀疏性正则化训练它然后进行修剪。 稀疏化 ​ 在训练MLP时通常使用L1范数来鼓励模型的权重向量中有更多的零从而达到稀疏化的效果。但L1不足以使KAN稀疏化需要一个额外的熵正则化。 ​ 定义每一个激活函数的L1范数为 ​ KAN的每一层的L1范数为所有激活函数的L1范数之和 ​ 定义KAN的每一层的熵为 ​ 总的训练损失为预测损失与所有KAN层的L1和熵正则化之和 剪枝 ​ 对于每个节点来对KAN进行剪枝定义每个结点的传入和传出分数为 如果传入和传出的分数都小于0.01则认为该神经元时不重要的将其修剪。 符号化 ​ 一些激活函数实际上是符号函数如cos、log等作者提供了一个接口来将他们设置为制定的符号函数f的形式。但激活函数的输出和输出可能有偏移和缩放因此从样本中获取预激活值x和后激活值y并拟合仿射函数 y ≈ c f ( a x b ) d y≈cf(axb)d y≈cf(axb)d。 人类用户可以通过观察KAN可视化的激活函数猜出这些符号公式并将这些激活函数直接设置为该公式再去拟合仿射函数。通过这样注入人类的归纳偏差或领域知识使得拟合的结果更加精准。 Experiment 神经标度律scaling lawKAN比MLP有着更快的标度变化速度。在求解偏微分方程任务中KANs也展现出更快的收敛速度、达到更低的损失并有着更陡峭的标度率表现。 **函数拟合**KAN比MLP更准确具有更好的Pareto边界 **偏微分方程求解**在求解泊松方程时KAN比MLP更准确敛速度更快损失更低并且具有更陡峭的神经标度率表现。 **持续学习**借助样条设计的局部性天然优势KAN可以在新数据上实现持续学习规避了机器学习中存在的灾难性遗忘问题。 **可解释性**KAN能通过符号公式揭示合成数据集的组成结构和变量依赖性。 人类用户可以与 KANs 交互使其更具可解释性。在 KAN 中注入人类的归纳偏差或领域知识非常容易。 Limitation ​ KAN最大的瓶颈在于训练速度慢。在参数数量相同的情况下KAN通常比MLP慢10倍这需要在未来加以改善。
http://www.hkea.cn/news/14307763/

相关文章:

  • 企业网站建站元素怎么用html做移动网站
  • 抚顺网站建设技术员招聘阿里巴巴网站建设公司
  • 做网站公司郑州郑州的网站建设公司哪家好河南省建设厅证件查询官网
  • 整人关不掉的网站怎么做主机屋 wordpress
  • 移动网站建设流程六盘水城乡住房建设厅网站
  • wordpress站内301万网免费网站
  • 吉林大学学院网站建设群帝国cms更改网站ico
  • 在哪个彩票网站是小黄人做头像的wordpress突然很慢
  • apache建立多个网站公司没有备案了网站
  • 上海网站开发薪资网站开发时间段
  • 宁波 做网站的网络营销推广策略
  • 网站空间500m是什么意思中鑫华源建设投资集团网站
  • 网站站内优化怎么做臭事百科wordpress
  • 网站建设哪便宜群晖 wordpress 设置
  • 海淀网站开发的公司域名备案网站备案查询
  • 做镜像网站利润小程序登录不了怎么办
  • 制作一个网站的成本南昌网站app开发
  • 在哪个网站可以做试卷多作者wordpress插件
  • 镇江智能网站建设哪家好程序员自己做网站赚钱
  • 公司做企业网站深圳有哪些外贸公司
  • 专业网站建设必要性今天特大军事新闻事件
  • 邢台建设局网站上中标公示查询德阳手机网站建设
  • 网站首眉怎么做seo免费网站建设
  • 没有网站怎么做网络推广帮非法集资公司做网站违法吗
  • 地图网站抓取石景山富阳网站建设
  • 大学网站建设管理办法网站后台 全局配置
  • 专业的公司网站开发教育培训网站
  • 网站建设七大步骤怎么给网站做超链接
  • 白银市住房与建设局网站网页制作官方网站
  • 网站空间与域名的关系仿腾讯视频网站源码