当前位置: 首页 > news >正文

编程学习入门网站wordpress apache伪静态

编程学习入门网站,wordpress apache伪静态,网站百度推广怎么做的,世界互联网巨头【深度学习】—激活函数、ReLU 函数、 Sigmoid 函数、Tanh 函数 4.1.2 激活函数ReLU 函数参数化 ReLU Sigmoid 函数背景绘制 sigmoid 函数Sigmoid 函数的导数 Tanh 函数Tanh 函数的导数总结 4.1.2 激活函数 激活函数#xff08;activation function#xff09;用于计算加权和… 【深度学习】—激活函数、ReLU 函数、 Sigmoid 函数、Tanh 函数 4.1.2 激活函数ReLU 函数参数化 ReLU Sigmoid 函数背景绘制 sigmoid 函数Sigmoid 函数的导数 Tanh 函数Tanh 函数的导数总结 4.1.2 激活函数 激活函数activation function用于计算加权和并加上偏置决定神经元是否被激活。它将输入信号转化为可微的输出大多数激活函数是非线性的。激活函数是深度学习的基础下面介绍几种常见的激活函数。 ReLU 函数 最受欢迎的激活函数是修正线性单元Rectified Linear Unit, ReLU它实现简单且在各种预测任务中表现优异。ReLU 提供了一种非常简单的非线性变换定义为 通俗地说ReLU 通过将负值设为 0仅保留正数。我们可以通过下列代码绘制 ReLU 函数的曲线来直观感受其行为。正如图中所示ReLU 是分段线性的。 import torch from d2l import torch as d2lx torch.arange(-8.0, 8.0, 0.1, requires_gradTrue) y torch.relu(x) d2l.plot(x.detach(), y.detach(), x, relu(x), figsize(5, 2.5))当输入为负时ReLU 的导数为 0当输入为正时导数为 1。当输入值精确等于 0 时ReLU 不可导但我们通常忽略这种情况假设导数为 0。我们可以绘制 ReLU 函数的导数曲线。 y.backward(torch.ones_like(x), retain_graphTrue) d2l.plot(x.detach(), x.grad, x, grad of relu, figsize(5, 2.5))ReLU 的求导性质使得参数要么消失要么通过从而优化效果更好缓解了神经网络中常见的梯度消失问题将在后续章节介绍。 参数化 ReLU ReLU 有许多变体其中包括参数化 ReLUParameterized ReLU, pReLU。pReLU 为 ReLU 添加了一个线性项使得即使输入为负仍有信息可以传递 pReLU ( x ) max ⁡ ( 0 , x ) α min ⁡ ( 0 , x ) . \text{pReLU}(x) \max(0, x) \alpha \min(0, x). pReLU(x)max(0,x)αmin(0,x). Sigmoid 函数 对于定义域在 R \mathbb{R} R 中的输入sigmoid 函数将输入变换为区间 ( 0 , 1 ) (0, 1) (0,1) 上的输出因此 sigmoid 通常称为挤压函数squashing function。它将任意输入压缩到区间 ( 0 , 1 ) (0, 1) (0,1) 中的某个值定义如下 背景 在早期的神经网络中科学家们通过 sigmoid 函数模拟生物神经元的激发和非激发。它是阈值单元的平滑可微近似当输入低于某个阈值时输出接近 0超过阈值时输出接近 1。由于 sigmoid 的平滑性和可导性它在基于梯度的学习中得到广泛应用特别是在将输出视为二元分类问题的概率时仍然使用 sigmoid 作为输出层的激活函数。 然而随着 ReLU 函数的引入sigmoid 在隐藏层中的应用逐渐减少因为 ReLU 更简单且更易于训练。在后续关于循环神经网络的章节中我们将探讨如何使用 sigmoid 来控制时序信息流。 绘制 sigmoid 函数 我们可以通过代码绘制 sigmoid 函数曲线。注意当输入接近 0 时sigmoid 函数近似线性。 y torch.sigmoid(x) d2l.plot(x.detach(), y.detach(), x, sigmoid(x), figsize(5, 2.5))Sigmoid 函数的导数 sigmoid 函数的导数公式如下 我们可以通过代码绘制 sigmoid 函数的导数曲线。注意当输入为 0 时sigmoid 函数的导数达到最大值 0.25而当输入远离 0 时导数逐渐趋近于 0。 # 清除以前的梯度 x.grad.data.zero_() y.backward(torch.ones_like(x), retain_graphTrue) d2l.plot(x.detach(), x.grad, x, grad of sigmoid, figsize(5, 2.5))这表明 sigmoid 函数在输入较大或较小时的梯度非常小这导致在深层网络中可能会出现梯度消失问题。 Tanh 函数 与 sigmoid 函数类似tanh双曲正切函数也可以将输入压缩到区间 ( − 1 , 1 ) (-1, 1) (−1,1) 上。tanh 函数的公式如下 我们可以通过代码绘制 tanh 函数。注意当输入在 0 附近时tanh 函数接近线性且函数关于原点对称。 y torch.tanh(x) d2l.plot(x.detach(), y.detach(), x, tanh(x), figsize(5, 2.5))Tanh 函数的导数 tanh 函数的导数为 当输入接近 0 时tanh 函数的导数接近最大值 1。类似于 sigmoid 函数当输入远离 0 时导数逐渐趋近于 0。我们可以绘制 tanh 函数的导数图像。 # 清除以前的梯度 x.grad.data.zero_() y.backward(torch.ones_like(x), retain_graphTrue) d2l.plot(x.detach(), x.grad, x, grad of tanh, figsize(5, 2.5))总结 我们已经了解了如何使用非线性激活函数如 ReLU、sigmoid 和 tanh来构建具有更强表达能力的多层神经网络。值得一提的是如今借助开源的深度学习框架只需几行代码即可快速构建模型而在 20 世纪 90 年代训练这些网络可能需要数千行 C 或 Fortran 代码。
http://www.hkea.cn/news/14385687/

相关文章:

  • 即墨城乡建设局网站网站空间可以自己买吗
  • 网站开发如何入账分销平台软件
  • 建设论坛网站大概多少钱南宁网站建设方案报价
  • 如何查询网站备案信息查询h5动态页面
  • qq刷赞网站咋做塘沽建设网站公司
  • 摄影师网站模板安徽鑫华建设有限公司网站
  • 蓝色科技企业网站模板网站用html模拟图片
  • 网站建设 考虑品牌推广的概念
  • 房地产管理网站浙江省建设信息网官网
  • 淄博网站设计方案建站公司用哪家服务器
  • 做营销的网站建设专门做中式装修的网站
  • 做电影网站哪个服务器好上海网站推广大全
  • 网站cms大全专业网站制作流程
  • 做网站需要备案吗青岛哪里可以建网站
  • 丽水市莲都区建设分局网站2817网站
  • 沧州做家装的公司网站建设规划
  • 大丰企业做网站多少钱上海外贸公司地址
  • 网站制作 毕业设计dw网站建设字体颜色
  • 建设网站开通网线多少钱现在网站建设还用测浏览器吗
  • 营销网站搭建建议松江网站开发培训课程
  • 网站建设推广语言网页设计公司有什么部门
  • 网站怎么做才软件外包合同模板
  • 网站开发 大学专业建设网站怎么查明细
  • 网站建设与管理的过程北京出啥事了最新情况
  • 网站设计论文前言怎么写对于给不良网站发律师函如何做
  • 什么网站可做浏览器首页wordpress怎么关注别人
  • 关键词网站建设价格wordpress 主题origin
  • 网站备案完毕 怎样建设网站公司网站 个人备案
  • 网站联盟名词解释搜索引擎网站推广法
  • 湖北自适应网站建设价格网站建设规划方案论文