当前位置: 首页 > news >正文

c 网站开发 简单例子百度推广账户搭建

c 网站开发 简单例子,百度推广账户搭建,室内建筑设计,vs做网站教程1.简介 k-最近邻算法#xff0c;也称为 kNN 或 k-NN#xff0c;是一种非参数、有监督的学习分类器#xff0c;它使用邻近度对单个数据点的分组进行分类或预测。虽然它可以用于回归问题#xff0c;但它通常用作分类算法#xff0c;假设可以在彼此附近找到相似点。 对于分类…1.简介 k-最近邻算法也称为 kNN 或 k-NN是一种非参数、有监督的学习分类器它使用邻近度对单个数据点的分组进行分类或预测。虽然它可以用于回归问题但它通常用作分类算法假设可以在彼此附近找到相似点。 对于分类问题根据比重分配类别标签即使用在给定数据点周围最多表示的标签。虽然这在技术上被认为是plurality voting多数表决但majority vote一词在书面语中更常用。这些术语之间的区别在于majority voting在技术上需要超过 50% 这主要适用于只有两个类别的情况。当您有多个类别时 - 例如四个类别您不一定需要 50% 才能对一个类别做出结论您可以分配一个占比超过 25% 的类别标签。Wisconsin-Madison大学用了一个例子很好地总结了这一点。 回归问题使用与分类问题类似的概念但在这种情况下取 k 个最近邻的平均值来对分类进行预测。主要区别是分类用于离散值而回归用于连续值。但是在进行分类之前必须定义距离。欧几里得距离是最常用的我们将在下面深入研究。 值得注意的是kNN 算法也是lazy learning模型家族的一部分这意味着所有计算都发生在进行分类或预测时。由于它严重依赖内存来存储其所有训练数据因此也称为基于实例或基于内存的学习方法。 Evelyn Fix 和 Joseph Hodges 在 1951 年的这篇论文中提出了围绕 kNN 模型的最初想法而 Thomas Cover 在他的研究中扩展了他们的概念“Nearest Neighbor Pattern Classification”。虽然它不像以前那么受欢迎但由于其简单性和准确性它仍然是人们在数据科学中学习的首批算法之一。然而随着数据集的增长kNN 变得越来越低效影响了模型的整体性能。它通常用于简单的推荐系统、模式识别、数据挖掘、金融市场预测、入侵检测等。 2. 距离度量 kNN距离指标计算 回顾一下k-最近邻算法的目标是识别给定查询点的最近邻以便我们可以为该点分配一个类标签。为了做到这一点kNN 有几个要求 确定距离度量 为了确定哪些数据点最接近给定查询点需要计算查询点与其他数据点之间的距离。这些距离度量有助于形成决策边界将查询点划分为不同的区域。您通常会看到使用 Voronoi 图可视化的决策边界。 虽然您可以选择多种距离度量但本文仅涵盖以下内容 欧几里得距离p2这是最常用的距离度量仅限于实值 real-valued 向量。使用下面的公式它测量查询点和被测量的另一个点之间的直线。 曼哈顿距离p1这也是另一种流行的距离度量它测量两点之间的绝对值。它也被称为出租车taxicab距离或城市街区city block距离因为它通常用网格可视化说明人们如何通过城市街道从一个地址导航到另一个地址。 闵可夫斯基Minkowski距离该距离度量是欧几里得和曼哈顿距离度量的广义形式。下面公式中的参数 p 允许创建其他距离度量。当 p 等于 2 时这个公式表示欧几里得距离p 等于 1 表示曼哈顿距离 。 汉明Hamming距离这种技术通常与布尔或字符串向量一起使用识别向量不匹配的点。因此它也被称为重叠度量。可以用以下公式表示 例如如果您有以下字符串Hamming距离将为 2因为只有两个值不同。 3.K的选择 k-NN 算法中的 k 值定义了将检查多少个邻居以确定查询点的分类。例如如果 k1实例将被分配到与其单个最近邻相同的类。定义 k 是一种平衡行为因为不同的值可能会导致过拟合或欠拟合。 较低的 k 值可能具有较高的方差但较低的偏差较大的 k 值可能导致较高的偏差和较低的方差。k 的选择将很大程度上取决于输入数据因为有许多异常值或噪声的数据可能会在 k 值较高时表现更好。总之建议 k 使用奇数以避免分类歧义交叉验证策略可以帮助您为数据集选择最佳 k。 4.K-近邻算法伪代码 ①计算已知类别数据集中的点与当前点之间的距离 ②按照距离递增次序排序 ③选择与当前点距离最小的k个点 ④确定前k个点所在类别(标签)的出现频率 ⑤返回前k个点出现频率最高的类别作为当前点的预测分类 5.K-近邻算法程序清单 希望深入研究可以通过使用Python 和 scikit-learn 来了解有关 k-NN 算法的更多信息。以下代码是如何使用 kNN 模型创建和预测的示例 from sklearn.neighbors import KNeighborsClassifiermodel_name ‘K-Nearest Neighbor Classifier’kNNClassifier KNeighborsClassifier(n_neighbors 5, metric ‘minkowski’, p2)kNN_model Pipeline(steps[(‘preprocessor’, preprocessorForFeatures), (‘classifier’ , kNNClassifier)])kNN_model.fit(X_train, y_train)y_pred kNN_model.predict(X_test) 6. 应用 k-NN 算法已在各种问题中得到应用主要是在分类中。其中一些用例包括 数据预处理 数据集经常有缺失值但 kNN 算法可以在缺失数据插补的过程中估计这些值。 推荐问题 使用来自网站的clickstream点击流数据kNN 算法已用于向用户提供有关其他内容的自动推荐。这项研究表明用户被分配到特定组并根据该组的用户行为为他们提供推荐。然而考虑到 kNN 的应用规模这种方法对于较大的数据集可能不是最优的。 金融 它还用于各种金融和经济用例。例如一篇论文展示了如何在信用数据上使用 kNN 可以帮助银行评估向组织或个人提供贷款的风险。它用于确定贷款申请人的信用状况。 生命健康 kNN 还应用于医疗保健行业预测心脏病发作和前列腺癌的风险。该算法通过计算基因的表达来工作。 模式识别 kNN 还有助于识别模式例如文本和数字分类。这对于识别在表格或邮寄信封上的手写数字特别有帮助。 7. 优缺点 就像任何机器学习算法一样k-NN 也有其优点和缺点。根据实际情况它可能是也可能不是最优的选择。 7.1. 优势 易于实现 鉴于算法的简单性和准确性它是新数据科学家将学习的首批分类器之一。 适应性强 随着新训练样本的添加算法会根据任何新数据进行调整因为所有训练数据都存储在内存中。 超参数少 kNN 只需要一个 k 值和一个距离度量与其他机器学习算法相比参数是很少的。 7.2. 不足 数据规模 由于 kNN 是一种惰性算法与其他分类器相比它占用了更多的内存和数据存储。从时间和金钱的角度来看这可能是昂贵的。更多的内存和存储将增加业务开支而更多的数据可能需要更长的时间来计算。虽然已经创建了不同的数据结构例如 Ball-Tree来解决计算效率低下的问题但根据业务问题采用其他的分类器可能更好。 维度 kNN 算法往往会成为维度灾难的受害者这意味着它在高维数据输入时表现不佳。这有时也称为峰值现象在算法达到最佳特征数量后额外的特征会增加分类错误的数量尤其是当样本尺寸更小。 过拟合 由于“curse of dimensionality”维度灾难kNN 更容易出现过拟合。虽然利用特征选择和降维技术可以防止这种情况发生但 k 的值也会影响模型的行为。较低的 k 值可能会过度拟合数据而较高的 k 值往往会“平滑”预测值因为它是对更大区域或邻域的值进行平均。但是k 值太高模型可能会欠拟合。
http://www.hkea.cn/news/14497319/

相关文章:

  • 成都企业网站设计服务商浙江网站建设
  • 企业网站深圳常州网站建设百科
  • 网站建设费包括网站上面的彩票快3怎么做
  • 基层建设期刊上什么网站查询文章icp备案添加网站
  • 外贸推广网站哪家中国东凤网站制作
  • 佛山网站制作咨询网站建设需求登记表 免费下载
  • 网站meta标签怎么做推广赚钱的app有哪些
  • 湘潭手机网站网站建设美工招聘
  • 白云鄂博矿区网站建设wordpress破解主题教程
  • 山西省建设注册中心网站首页智慧团建电脑版登录入口官网
  • 哪种源码做视频网站好用许昌城乡建设局网站
  • 网站开发设计书籍wordpress空页面模板
  • 贵州城乡建设部网站首页无锡网络公司无锡网站制作
  • 怎么做网站百度经验石家庄网站建设费用
  • 药理学网站建设方案山东省住房建设部网站首页
  • 福田做网站怎么样怎么利用网站上的图片
  • 网站的交互怎么做上海什么公司最有名
  • 做区位分析的网站建设类网站有哪些
  • 网站卡的原因陕西省建设工程质量监督站网站
  • 盘锦网站建设策划网站外链怎么做
  • 做地方网站要办什么证wordpress手机图片站
  • pc网站如何转为手机版西安网站建设孙正学
  • 网站建设实训实训心得后端开发是什么
  • 电子商务网站建设读书笔记dede wap网站模板下载
  • 响应式网站代理用vs2012做asp网站
  • 3d地图网站模板html网站建设与推广范文
  • asia 域名 知名网站全网搜索软件下载
  • 二级目录怎么做网站阜阳seo
  • 个人网站备案可以盈利吗dw php网站开发
  • 建设银行网银官方网站如何在百度创建网站