当前位置: 首页 > news >正文

网站建设管理考核办法注册公司注册资金要实缴吗

网站建设管理考核办法,注册公司注册资金要实缴吗,外国小孩和大人做网站,济南哪里有网站建设公司本文作者#xff1a;杨健#xff0c;九章云极 DataCanvas 主任架构师 如何有效提高模型的泛化能力#xff0c;始终是机器学习领域的重要课题。经过大量的实践证明比较有效的方式包括#xff1a; 利用Early Stopping防止过拟合通过正则化降低模型的复杂度使用更多的训练数…本文作者杨健九章云极 DataCanvas 主任架构师 如何有效提高模型的泛化能力始终是机器学习领域的重要课题。经过大量的实践证明比较有效的方式包括 利用Early Stopping防止过拟合通过正则化降低模型的复杂度使用更多的训练数据尽量使用更少的特征使用CV来选择模型和超参数使用Ensemble来提升泛化能力 Early stopping以及正则化是比较基本的方法这里就不赘述此外HyperGBM中还提供了4种高级特性专门用来提升模型的泛化能力 Pseudo-labeling半监督学习二阶特征筛选K-fold Cross-validationGreedy ensemble 1.Pseudo-labeling 伪标签技术主要应用在分类任务上本质上是通过半监督学习的方法来增加更多的训练数据以提升模型的泛化能力。其过程如下图所示主要分为三个阶段 1.第一阶段用训练数据训练模型 2.第二阶段使用第一阶段训练好的模型在无标注的数据上预测将其中置信度较高的数据合并到训练集中 3.第三阶段使用合并后的数据重新训练模型 Image from: https://www.analyticsvidhya.com/blog/2017/09/pseudo-labelling-semi-supervised-learning-technique/ 示例代码HyperGBM中只需设置pseudo_labeling会自动完成伪标签学习 from tabular_toolbox.datasets import dsutils from sklearn.model_selection import train_test_split from hypergbm.search_space import search_space_general from hypergbm import make_experiment # load data into Pandas DataFrame df dsutils.load_bank() target y train, test train_test_split(df, test_size0.3) test.pop(target)#create an experiment experiment make_experiment(train,targettarget,pseudo_labelingTrue) #run experiment estimator experiment.run() # predict on test data without target values pred estimator.predict(test)2.二阶特征筛选 通过特征筛选过滤掉无效特征或者噪音数据能有效降低模型的复杂度。传统的特征筛选方法一类是在训练之前通过相关性指标评估或者是基于模型的特征评估排序然后根据阈值或者是排序选择n个特征用于训练另一类是先训练模型然后根据模型本身提供的特征重要性来选择一部分特征重新训练。第一类方法有明显的缺陷就是特征的评估标准和实际用于训练的模型无关也不会考虑特征之间的交互关系。第二类方法有明显的改进但也存在一个问题就是模型提供是在训练数据上的重要性并不能体现在评估数据或测试数据上特征的重要性。因此HyperGBM中引入了独特的二阶特征筛选策略来克服以上缺点。它的工作方式如下首先执行一阶段AutoML过程然后选择其中表现最好的n个模型使用permutation模式评估特征重要性删除低于某一阈值的特征后重新执行AutoML过程。 这里主要介绍一下permutation特征筛选首先基于已经训练好的模型在评估集上得到一个baseline评分然后分别将每一列特征变成噪音数据后重新评估评分等于或高于baseline评分说明该特征对模型没有增益甚至于是有损的如果评分下降说明该特征是对模型有益的用这个和baseline评分的差值做为特征筛选的参考值选择特征。 示例代码如下 #create an experiment experiment make_experiment(train,targettarget, feature_reselectionTrue, feature_reselection_estimator_size10, feature_reselection_threshold1e-5, )3.K-fold Cross-validation 交叉验证被证明是模型选择和超参数优化中最有效的验证方式示例代码如下 #create an experiment experiment make_experiment(train,targettarget, cvTrue, num_folds3, )4.Greedy Ensemble Greedy Ensemble是使用基于voting的集成学习方法实现原理可以参考: https://www.sciencedirect.com/science/article/abs/pii/S0031320310005340 示例代码 #create an experiment experiment make_experiment(train,targettarget, ensemble_size20, # 0 to disable ensemble )以上四种方法可以组合起来使用。
http://www.hkea.cn/news/14468383/

相关文章:

  • 网站如果不备案吗做电影网站收入
  • 网站推广营销收费网址大全实用网址
  • 网站建设合同附件wordpress 弹窗注册登录
  • 秦皇岛网站关键词推广贵州企业网站开发公司
  • 有什么做h5的网站wordpress 无广告视频
  • 企业网站建设费用入哪个科目泉州网站建设方案维护
  • 做网站运营如何提升用户粘度网站网站开发逻辑
  • 外包项目网站seo报告
  • 手机网站模板 优帮云wordpress 说明手册
  • 网站推广策划报告wordpress 自动汉化
  • 网站的建设步骤有哪些沈阳网站建设公司哪个好
  • 网站如何做优化推广空包网站分站怎么做
  • 网站制作 php全国信息网查询平台
  • 下载专门做初中数学题的网站邯郸匿豪网络科技有限公司
  • 有自己的域名怎么建立网站网站备案账号密码
  • 微信小程序自己制作网站优化一般怎么做
  • 怎么做同城购物网站备案号放网站下面居中
  • seo网站诊断文档案例网站页面确认书
  • 淘宝客网站建设任务晋城网络公司做网站的
  • 网站建设友情链接怎样交换群辉wordpress端口
  • wordpress易语言网站优化的监测评估
  • 个人建什么样的网站开源cms框架
  • 电影视频网站怎么做你买域名我送网站
  • 公司申请网站建设的工作方案手机网页编辑器中文版
  • 兴义市住房城乡建设局网站小说网站风格
  • 自己做网站需要服务器凡客精选
  • 为什么要先创建站点后建立文件?能否改变两者的顺序?wordpress页脚怎么修改
  • 网站宣传的手段有哪些?(写出五种以上)免费申请qq号码免费申请注册
  • 十大免费跨境网站网络营销方案规范
  • 美食网站建设书app开发公司哪里好