当前位置: 首页 > news >正文

网站制作公司要文化建设费如何注册咨询公司

网站制作公司要文化建设费,如何注册咨询公司,网站新闻稿模板,河南专业的做网站的公司L1正则化和L2正则化是常用的正则化技术#xff0c;用于在机器学习模型中控制过拟合。它们的主要区别在于正则化项的形式和对模型参数的影响。 L1正则化#xff08;Lasso正则化#xff09;#xff1a; 正则化项形式#xff1a;L1正则化使用模型参数的绝对值之和作为正则化…L1正则化和L2正则化是常用的正则化技术用于在机器学习模型中控制过拟合。它们的主要区别在于正则化项的形式和对模型参数的影响。 L1正则化Lasso正则化 正则化项形式L1正则化使用模型参数的绝对值之和作为正则化项即L1范数。影响模型参数L1正则化倾向于将一些模型参数压缩为0从而实现特征选择和稀疏性。因此它可以用于特征选择和模型简化。其他特点由于L1正则化的非光滑性优化问题在参数接近零时更容易找到解因此它对于具有大量无关特征的问题更有效。 L2正则化Ridge正则化 正则化项形式L2正则化使用模型参数的平方和作为正则化项即L2范数。影响模型参数L2正则化倾向于使模型参数趋向于较小的值但不会将其完全压缩为零。它通过减小模型参数的绝对值来控制参数的大小。其他特点L2正则化是光滑的优化问题在参数接近零时相对平滑因此对于许多问题都能得到较好的结果。 总结 L1正则化倾向于稀疏性和特征选择适用于具有大量无关特征的问题。L2正则化倾向于模型参数较小适用于控制模型复杂度和减少过拟合。在某些情况下可以同时使用L1和L2正则化形成弹性网络Elastic Net综合了两者的优点。 选择使用L1正则化还是L2正则化取决于具体问题和数据集的特点。通常建议先尝试L2正则化如果模型仍然过拟合或需要进行特征选择则可以考虑使用L1正则化。 对L1产生稀疏权值和L2产生平滑权值的理解 L1的定义是L1 |w1| |w2| |w3| ... |wn| L2的定义是L2 w1^2 w2^2 w3^2 ... wn^2 L1和L2分别对w求导可得 dL1/dw sign(wi) dL2/dw wi 假设wi为某个大于零的浮点数,学习率lr为0.5,根据梯度下降算法, L1的权值更新方式为wi wi - lr*(dL1/dw) wi - lr*1 wi - 0.5 L2的权值更新方式为wi wi - lr*(dL2/dw) wi - lr*wi wi - 0.5wi 可以看出,L1每次更新都是减去一个固定的值,那就可能在多次迭代之后,权值为0的情况 而L2虽然权值也在减小,但是总不为0 需要注意的是,通常情况下我们更倾向于对权值进行正则化而不是对偏置进行正则化的原因有以下几点 偏置的作用偏置bias是模型中的一个常数项它的作用是调整模型预测值与实际值之间的偏差。偏置通常用来解决模型在数据特征上的平移问题而不会引入过多的复杂性。由于偏置只是一个常数它的取值并不像权值那样会随着训练过程而变化因此对偏置进行正则化对于控制模型的复杂度影响较小。 影响模型容量正则化的目的是通过限制参数的取值范围来控制模型的复杂度避免过拟合。权值在模型中起到了控制特征的重要作用对权值进行正则化可以有效地减少模型的复杂度提高泛化能力。而偏置的作用相对较小对偏置进行正则化往往对模型的泛化能力影响较小。 数据中的偏移在实际的数据中通常会存在一些偏移bias即使我们对权值不进行正则化模型也可以通过调整偏置来适应这种偏移。因此对偏置进行正则化可能会导致对数据中的偏移进行过度拟合而忽略了模型对其他特征的学习能力。 测试代码如下 import torch import matplotlib.pyplot as plttorch.manual_seed(25)x_train torch.tensor([1,2,3,4,5,6,7,8,9,10],dtypetorch.float32).unsqueeze(-1) y_train torch.tensor([0.52,8.54,6.94,20.76,32.17,30.65,40.46,80.12,75.12,98.83],dtypetorch.float32).unsqueeze(-1) plt.scatter(x_train.detach().numpy(),y_train.detach().numpy(),markero,s50,cr)class Linear(torch.nn.Module):def __init__(self):super().__init__()self.layers torch.nn.Sequential(torch.nn.Linear(in_features1, out_features3),torch.nn.Sigmoid(),torch.nn.Linear(in_features3,out_features5),torch.nn.Sigmoid(),torch.nn.Linear(in_features5, out_features10),torch.nn.Sigmoid(),torch.nn.Linear(in_features10,out_features5),torch.nn.Sigmoid(),torch.nn.Linear(in_features5, out_features1),torch.nn.ReLU(),)def forward(self,x):return self.layers(x)linear Linear()opt torch.optim.Adam(linear.parameters(),lr 0.005) loss_fn torch.nn.MSELoss()for epoch in range(1000):for iter in range(10):L1 0L2 0for name,param in linear.named_parameters():if bias not in name:L1 torch.norm(param, p1) * 1e-3L2 torch.norm(param, p2) * 1e-3opt.zero_grad()output linear(x_train[iter])loss loss_fn(output, y_train[iter]) L1 L2loss.backward()opt.step()if __name__ __main__:predict_loss 0for i in range(1000):x torch.tensor([i/100], dtypetorch.float32)y_predict linear(x)plt.scatter(x.detach().numpy(),y_predict.detach().numpy(),s2,cb)plt.scatter(i/100,i*i/10000,s2,cy)predict_loss (i*i/10000 - y_predict)**2/(y_predict)**2 predict_loss plt.show()不使用L1,L2正则化的情况如下 只使用L1正则化的情况如下 只使用L2正则化的情况如下 同时使用L1和L2正则化的情况如下
http://www.hkea.cn/news/14318321/

相关文章:

  • 做网站赚什么钱广州石井做网站
  • 怎么做网址导航网站网络营销策略内容
  • 渝北集团网站建设如何给网站做排名
  • 传智播客php网站开发实例教程深圳网深圳网站开发公司
  • c2c网站有哪些?免费注册com域名
  • 莱芜网站优化加徽信xiala5效果好加强网站技术建设
  • 最权威的网站推广公司山东正元建设网站
  • 个人做网站的流程新版wordpress文章编辑界面
  • 网站怎么注册怎样做金融理财网站
  • phpcms建站流程怀化网站优化推荐
  • 杭州网站建设规划外贸单在哪些网站做
  • 上海市安全建设监理协会网站小城镇建设期刊网站
  • 普陀网站开发培训学校临沂市建设工程监理公司网站
  • 公司网站建设论文自己设计图片的软件
  • 网站建设实验报告手写增加网站关键词
  • 网站如何接广告赚钱厦门seo排名外包
  • 网页设计及网站建设的相关概念成都企业网站备案流程
  • 金华金东区建设局网站网站建设 设计
  • 百度站长工具seoseo优化实训总结
  • 不会编码可以做网站优化吗网站关键词百度指数
  • 黄冈便宜的网站推广怎么做网站点击量设计
  • 网站有免费的域名和空间么做美容仪器的网站
  • 建筑行业招聘网站推荐一级a做爰片_相关网站
  • 做网站网站加载内容慢怎么解决查找做影评的工作网站
  • 辽宁省建设工程信息网官网新网站入口建站之家官网
  • 注册网站公司企业官网的意义
  • 鹤岗住房和城乡建设局网站wordpress 图集功能
  • 网站建设与实现毕业答辩ppt甘肃机械化建设工程有限公司网站
  • 服饰 视频 网站建设装修公司手机网站模板
  • 浙江省建设职业技术学院网站好建设网站