当前位置: 首页 > news >正文

沈阳商城网站开发自己怎么设计公众号

沈阳商城网站开发,自己怎么设计公众号,学ps网课平台哪个好,wordpress怎么调度主题〇、两个预测任务 #xff08;1#xff09;任务一#xff1a;银行预测偿还能力 当前#xff0c;某银行正致力于发掘潜在的放贷用户。他们掌握了每位用户的三个关键特征#xff1a;房产状况、婚姻状况以及年收入。此外#xff0c;银行还拥有过往这些用户的债务偿还能力的…〇、两个预测任务 1任务一银行预测偿还能力 当前某银行正致力于发掘潜在的放贷用户。他们掌握了每位用户的三个关键特征房产状况、婚姻状况以及年收入。此外银行还拥有过往这些用户的债务偿还能力的数据。面对这一情境银行现需制定一套有效的策略用以评估新用户的偿债能力从而做出是否向其提供贷款的决策。 2任务二相亲优质男性 一位母亲想要为她的女儿介绍合适的男朋友女孩对此提出了四个明确的要求年龄、相貌、收入、公务员。她明确表示只有满足条件的男性她才愿意与之相亲。面对如此具体的条件母亲该如何在浩渺的婚恋市场中挑选出一位优质男性让女儿愿意与之相见呢 一、什么是决策树 相信你看到上面两个例子的时候心中已经有了一个判断。你是怎么做的判断呢我先来说说我是怎么做出决策的。将我所做的决策画成树这就被称为决策树。 1直观理解 对与任务一来说如果我是银行我肯定选择对有房子、结了婚、年收入高的人进行放贷。这里思考几个问题有房子难道就一定能还贷嘛万一他的房子很偏僻很小不值几个钱呢不结婚的人也许存款更多还款能力还强些呢到底怎么定义高收入呢 图1 对于任务二来说如果我是这个女孩儿我也许会选择年轻点的、长得还行就好、收入中等就行、最好是公务员。同样思考一下从我的决策中就能够看出有许多的模糊字眼。 图2 2定义 决策树是一种有监督学习算法通过特征选择和递归分割数据集构建树状模型用于分类或回归分析。其中每个内部节点代表一个特征测试分支表示不同的测试结果而叶节点则对应最终的类别或数值预测。分支节点又叫决策节点叶子节点又叫预测结果节点。 每个内部节点代表一个特征或属性测试。每个分支表示该特征可能的输出或取值。每个叶节点终端节点则代表一个决策结果或者分类标签在分类任务中对应某个类别的预测而在回归任务中叶节点会对应一个连续数值的预测。 二、不就是if-else语句吗怎么被称为机器学习模型 如果你也有这种疑问不妨回顾一下先前我们做的两个小预测任务上面提出了的思考问题可以总结为两个我们为什么会这样的特征来辅助决策以及我们要用怎样的阈值做为判断依据 决策树确实可以被视为一系列嵌套的if-else语句但其作为机器学习模型的意义在于这些if-else规则不是由人类程序员手动编写而是通过从训练数据中自动学习得出。在构建决策树的过程中特征的选择和阈值的确立都是根据优化准则自动生成的。 1该选哪些特征 在构建决策树时算法会遍历所有可能的特征并计算每个特征用于划分数据集时带来的信息增益、基尼不纯度或者其他类似的评价指标取决于所使用的具体算法。信息增益是衡量一个特征对分类纯度提升程度的一种量度而基尼不纯度则用来表示样本集合不确定性或随机性的大小。在每一轮迭代中算法会选择当前能够带来最大信息增益或最小基尼不纯度的特征作为节点来划分数据集。这样做的目的是逐步形成一个能最好地描述输入数据与输出类别之间关系的树状结构。 2该选哪个阈值 对于数值型特征来说在确定了使用该特征进行分割之后算法需要找到一个最优的阈值来划分数据。这个阈值通常是在当前特征的所有可能取值中搜索出来的使得基于此阈值划分数据后子集的信息增益或基尼不纯度达到最优。例如在CARTClassification and Regression Trees算法中对于连续特征会在特征的所有不同取值上尝试以找到最佳分割点。 三、决策树的优缺点 1优点 易于理解和解释决策树的结构直观且易于理解可以生成易于解释的规则对于非专业人士来说也很友好可以可视化展示整个决策过程。 可处理多种类型的数据无论是离散型、连续型还是混合型数据决策树都可以直接处理无需进行复杂的预处理。 能够处理缺失值在一定程度上决策树算法可以自动处理特征值缺失的情况通过特定策略如基于均值、中位数或众数填充来决定缺失值所在分支。 特征选择能力决策树能够对输入变量的重要性进行排序帮助识别哪些特征对预测结果影响最大。 并行性决策树训练过程中不同节点的划分可以相对独立地计算理论上支持并行化构建。 2缺点 过拟合问题决策树容易生成过于复杂的树结构导致过拟合训练数据不适用于未见过的新数据即泛化能力可能较差。 不擅长处理连续数值特征虽然决策树可以处理连续特征但在处理连续变量时可能不如其他模型如线性回归那样准确有效。 偏向于选择类别较多的特征决策树倾向于选择拥有更多类别的特征进行分割这可能导致忽略那些对决策真正重要的但类别较少的特征。 无法捕捉非线性关系和光滑边界对于数据分布较为复杂或者分类边界平滑的问题决策树的表现可能不尽如人意。 不稳定对于数据的小幅变动敏感尤其是当多个特征具有相近重要性时决策树的结果可能会因为样本顺序的变化而产生较大差异。 四、如何避免决策树的过拟合 避免决策树过拟合的主要策略包括 设置树的最大深度限制决策树的最大深度可以防止模型过于复杂减少节点划分的次数从而降低过拟合的风险。 最小样本数或叶子节点最少样本数要求每个内部节点或者叶子节点至少包含一定数量的样本这样可以防止在训练集上构建过度复杂的分支结构。 剪枝通过后剪枝或预剪枝的方法来简化决策树。后剪枝是先生成一颗完整的决策树然后从底部开始自下而上地删除对验证集性能改善不大的子树预剪枝则是在构建过程中每当扩展一个节点时都基于验证集的表现决定是否继续划分。
http://www.hkea.cn/news/14546309/

相关文章:

  • 甘肃网站建设网站制作1688自然排名怎么做好
  • 绍兴市网站建设树莓派搭建wordpress
  • 大型网站开发用的技术公司网站建设费用入账
  • 鄂州做网站的公司望牛墩网站建设
  • 文化书院网站建设方案深圳app网站建设陈俊兵
  • 重庆手机网站推广价格wordpress如何设置目录
  • 谷歌怎么做网站优化无锡本地做网站
  • 企业网站建设需了解什么wordpress 修改默认路径
  • 做网站多少钱西宁君博相约网站的建设流程
  • 郑州高端网站建设是什么意思网站外贸推广
  • 学做婴儿衣服的网站北京网站建设方案哪家好
  • ui外包网站长沙竞价网站建设价格
  • 桂林网站制作哪家好怎样做旅游网站设计
  • 手机网站制作解决方案怎么建个废品网站
  • 一个新的网站怎么做SEO优化seo门户网
  • 响应式网站是什么情况南宁市网站建设价格
  • 联系人网站设计上海公司注销需要多少钱费用?
  • 做网站的公司介绍微信分销网站建设多少钱
  • 网站开发亿玛酷适合5wordpress使用密码
  • 网站模板套用如何创建企业邮箱
  • 在线做网站黄农村自建房设计图纸
  • 深圳市做网站建设手机管理wordpress站
  • 珠海网站系统建设自学网站制作教程
  • 源码网站程序wordpress多个边栏
  • 贴吧做网站建设网站运营收入
  • 做微信头图的网站wordpress标签生成图片
  • 做的比较好的美食网站vs做的网站源代码
  • 建设营销型网站广州黄骅港船舶动态
  • 织梦cms可以做淘宝客网站么wordpress 代码压缩
  • 洛阳市政建设集团网站教师可以做网站吗