当前位置: 首页 > news >正文

织梦后台怎么建设网站北辰集团网站建设

织梦后台怎么建设网站,北辰集团网站建设,免费app网站下载大全,望江县住房和城乡建设局网站L1正则化和L2正则化是常用的正则化技术#xff0c;用于在机器学习模型中控制过拟合。它们的主要区别在于正则化项的形式和对模型参数的影响。 L1正则化#xff08;Lasso正则化#xff09;#xff1a; 正则化项形式#xff1a;L1正则化使用模型参数的绝对值之和作为正则化…L1正则化和L2正则化是常用的正则化技术用于在机器学习模型中控制过拟合。它们的主要区别在于正则化项的形式和对模型参数的影响。 L1正则化Lasso正则化 正则化项形式L1正则化使用模型参数的绝对值之和作为正则化项即L1范数。影响模型参数L1正则化倾向于将一些模型参数压缩为0从而实现特征选择和稀疏性。因此它可以用于特征选择和模型简化。其他特点由于L1正则化的非光滑性优化问题在参数接近零时更容易找到解因此它对于具有大量无关特征的问题更有效。 L2正则化Ridge正则化 正则化项形式L2正则化使用模型参数的平方和作为正则化项即L2范数。影响模型参数L2正则化倾向于使模型参数趋向于较小的值但不会将其完全压缩为零。它通过减小模型参数的绝对值来控制参数的大小。其他特点L2正则化是光滑的优化问题在参数接近零时相对平滑因此对于许多问题都能得到较好的结果。 总结 L1正则化倾向于稀疏性和特征选择适用于具有大量无关特征的问题。L2正则化倾向于模型参数较小适用于控制模型复杂度和减少过拟合。在某些情况下可以同时使用L1和L2正则化形成弹性网络Elastic Net综合了两者的优点。 选择使用L1正则化还是L2正则化取决于具体问题和数据集的特点。通常建议先尝试L2正则化如果模型仍然过拟合或需要进行特征选择则可以考虑使用L1正则化。 对L1产生稀疏权值和L2产生平滑权值的理解 L1的定义是L1 |w1| |w2| |w3| ... |wn| L2的定义是L2 w1^2 w2^2 w3^2 ... wn^2 L1和L2分别对w求导可得 dL1/dw sign(wi) dL2/dw wi 假设wi为某个大于零的浮点数,学习率lr为0.5,根据梯度下降算法, L1的权值更新方式为wi wi - lr*(dL1/dw) wi - lr*1 wi - 0.5 L2的权值更新方式为wi wi - lr*(dL2/dw) wi - lr*wi wi - 0.5wi 可以看出,L1每次更新都是减去一个固定的值,那就可能在多次迭代之后,权值为0的情况 而L2虽然权值也在减小,但是总不为0 需要注意的是,通常情况下我们更倾向于对权值进行正则化而不是对偏置进行正则化的原因有以下几点 偏置的作用偏置bias是模型中的一个常数项它的作用是调整模型预测值与实际值之间的偏差。偏置通常用来解决模型在数据特征上的平移问题而不会引入过多的复杂性。由于偏置只是一个常数它的取值并不像权值那样会随着训练过程而变化因此对偏置进行正则化对于控制模型的复杂度影响较小。 影响模型容量正则化的目的是通过限制参数的取值范围来控制模型的复杂度避免过拟合。权值在模型中起到了控制特征的重要作用对权值进行正则化可以有效地减少模型的复杂度提高泛化能力。而偏置的作用相对较小对偏置进行正则化往往对模型的泛化能力影响较小。 数据中的偏移在实际的数据中通常会存在一些偏移bias即使我们对权值不进行正则化模型也可以通过调整偏置来适应这种偏移。因此对偏置进行正则化可能会导致对数据中的偏移进行过度拟合而忽略了模型对其他特征的学习能力。 测试代码如下 import torch import matplotlib.pyplot as plttorch.manual_seed(25)x_train torch.tensor([1,2,3,4,5,6,7,8,9,10],dtypetorch.float32).unsqueeze(-1) y_train torch.tensor([0.52,8.54,6.94,20.76,32.17,30.65,40.46,80.12,75.12,98.83],dtypetorch.float32).unsqueeze(-1) plt.scatter(x_train.detach().numpy(),y_train.detach().numpy(),markero,s50,cr)class Linear(torch.nn.Module):def __init__(self):super().__init__()self.layers torch.nn.Sequential(torch.nn.Linear(in_features1, out_features3),torch.nn.Sigmoid(),torch.nn.Linear(in_features3,out_features5),torch.nn.Sigmoid(),torch.nn.Linear(in_features5, out_features10),torch.nn.Sigmoid(),torch.nn.Linear(in_features10,out_features5),torch.nn.Sigmoid(),torch.nn.Linear(in_features5, out_features1),torch.nn.ReLU(),)def forward(self,x):return self.layers(x)linear Linear()opt torch.optim.Adam(linear.parameters(),lr 0.005) loss_fn torch.nn.MSELoss()for epoch in range(1000):for iter in range(10):L1 0L2 0for name,param in linear.named_parameters():if bias not in name:L1 torch.norm(param, p1) * 1e-3L2 torch.norm(param, p2) * 1e-3opt.zero_grad()output linear(x_train[iter])loss loss_fn(output, y_train[iter]) L1 L2loss.backward()opt.step()if __name__ __main__:predict_loss 0for i in range(1000):x torch.tensor([i/100], dtypetorch.float32)y_predict linear(x)plt.scatter(x.detach().numpy(),y_predict.detach().numpy(),s2,cb)plt.scatter(i/100,i*i/10000,s2,cy)predict_loss (i*i/10000 - y_predict)**2/(y_predict)**2 predict_loss plt.show()不使用L1,L2正则化的情况如下 只使用L1正则化的情况如下 只使用L2正则化的情况如下 同时使用L1和L2正则化的情况如下
http://www.hkea.cn/news/14584323/

相关文章:

  • 网易官网建立个人网站电台 主题 wordpress
  • jsp网站开发中英文页面切换目前有哪些跨境电商平台
  • 智能网站建设报价网站建设着
  • 国内网站设计案例族蚂建站怎么样
  • 网站备案要幕布车培训网站建设
  • 网店网站设计论文网页制作教程第三版赵丰年pdf
  • 在虚拟机中如何做二级域名网站上海电商网站建设费用
  • 网站哪个公司好网站模版参考
  • 济南做网站的价格wordpress公司主题破解版
  • 潍坊市作风建设年活动网站如何写手机适配网站
  • 高邮企业网站建设广州 骏域网站建设 陶瓷
  • 深圳制作网站推荐一起做网站注册地址
  • 用dw做的网站怎么发布到网上银州手机网站建设
  • 做网站怎么在国外服务器租用泰安东平房产信息网
  • 备案通过后 添加网站做购买网站
  • 动漫网站建设规划书模板贵阳网站建设葫芦岛
  • 注册网站商标多少钱深圳沙头角网站建设
  • 河南省建设执业资格注册中心网站cn免费域名注册网站
  • 福安市教育局建设网站足球世界排名
  • 潍坊知名网站建设服务商wordpress没有插件
  • 域名解析到别的网站乐温州网站建设
  • 周口在线网站建设免费做初中试卷的网站
  • 怎样做网站吸引人wordpress 编辑器设置
  • wordpress主题站模板下载具有设计感的网站
  • 龙岩网站设计找哪家好河北省住房建设厅官方网站
  • 济南网站建设多少费用老男孩搭建wordpress
  • 网站颜色搭配案例网站暂时关闭怎么做
  • 集团网站网页模板小红书小程序入口
  • 邳州城乡建设局网站公司网站制作开发公司
  • 网站错误模板网站建设案例 星座