当前位置: 首页 > news >正文

手机餐饮网站开发常州网站建设百科

手机餐饮网站开发,常州网站建设百科,用php做的网站软件,网站网页直播怎么做的Python中聚类算法API的使用指南 聚类分析是数据分析中一种常见的无监督学习方法#xff0c;通过将相似的对象分组在一起#xff0c;我们能够识别出数据集中的自然分群。本文将介绍如何使用Python中的聚类算法接口#xff0c;KMeans和层次聚类方法。 K-Means 聚类 K-Means…Python中聚类算法API的使用指南 聚类分析是数据分析中一种常见的无监督学习方法通过将相似的对象分组在一起我们能够识别出数据集中的自然分群。本文将介绍如何使用Python中的聚类算法接口KMeans和层次聚类方法。 K-Means 聚类 K-Means是一种广泛使用的聚类算法它的目标是将数据点分成K个组使得组内的点彼此相似而组间的点不相似。下面是如何使用K-Means聚类分析的步骤 步骤一导入必要的库 首先需要导入KMeans类它在sklearn.cluster模块中。 from sklearn.cluster import KMeans步骤二加载数据 我们使用pandas库来加载数据。确保数据文件的路径是正确的。 import pandas as pddf pd.read_excel(CLUS_FILE_PATH, index_col0)步骤三应用K-Means聚类 创建一个KMeans实例并通过.fit()方法应用于数据。 kmeans KMeans(n_clusters3, random_state0).fit(df)步骤四保存聚类结果 将聚类标签添加到原始数据框中并保存到Excel文件。 df[Cluster] kmeans.labels_ df.to_excel(kmeans聚类分析结果.xlsx)层次聚类 层次聚类是另一种常见的聚类方法它通过构建一个多层次的嵌套分群树来组织数据这个树被称为树状图Dendrogram。相对于K-Means层次聚类不需要指定k值就可以完成聚类但是要分类出标签的话我们需要指定一个距离如果两个样本超出这个距离则不属于同一类。 步骤一导入库 导入进行层次聚类和绘制树状图所需的库。 from scipy.cluster.hierarchy import dendrogram, linkage, fcluster from scipy.spatial.distance import pdist步骤二加载数据并计算距离矩阵 同样地我们先加载数据然后计算距离矩阵使用欧式距离。 df pd.read_excel(CLUS_FILE_PATH, index_col0) distance_matrix pdist(df, metriceuclidean)步骤三执行层次聚类 使用linkage函数进行层次聚类这里采用了’ward’方法。 Z linkage(distance_matrix, methodward)步骤四确定聚类数并保存结果 通过选择一个最大距离阈值来确定聚类数并把聚类结果保存到Excel。 clusters fcluster(Z, max_d50, criteriondistance) df[Cluster] clusters df.to_excel(层次聚类分析结果.xlsx)步骤五绘制树状图并保存 最后利用dendrogram函数绘制树状图并保存为图片。 plt.figure(figsize(10, 50)) dendrogram(Z, orientationleft, labelsdf.index, leaf_rotation0, leaf_font_size10) plt.title(层次聚类的树状图) plt.ylabel(中药名称) plt.xlabel(距离) plt.tight_layout() plt.savefig(层次聚类树状图.png) plt.show()层次聚类的树状图 我们可以看到各个中药被层次聚类组织成了一颗一颗嵌套的树这些树描述了不同中药之间的距离关系。 上面的步骤展示了如何使用Python进行K-Means聚类和层次聚类分析。聚类是一个强大的工具可以帮助我们发现数据中的模式和结构。通过实践这些步骤你会对聚类分析有更深的了解。 利用PCA降维以可视化聚类结果 绘图函数可直接复制然后按下文调用 def plot_clus_2D(clustered_data, class_col, method):n_clusters clustered_data[class_col].nunique()# 执行PCA降维降至2维pca PCA(n_components2)data_reduced pca.fit_transform(clustered_data.drop(columns[class_col]))# 创建一个新的DataFrame来保存降维后的数据和聚类标签data_2D pd.DataFrame(data_reduced, columns[PC1, PC2])data_2D[class_col] clustered_data[class_col].values# 设置绘图参数fig, ax plt.subplots(figsize(10, 8))# 为每个聚类设置不同的颜色colors [red, green, blue] # 你可以根据需要的聚类数修改颜色if n_clusters 3: # 如果聚类数超过3扩展颜色列表import matplotlib.colors as mcolorscolors list(mcolors.TABLEAU_COLORS.values())[:n_clusters]# 绘制每个聚类的散点图for i in range(n_clusters):# 从聚类数据中提取当前聚类的数据cluster_data data_2D[data_2D[class_col] i]# 绘制散点图ax.scatter(cluster_data[PC1], cluster_data[PC2],colorcolors[i], labelfCluster {i}, alpha0.5)# 添加图例和标题ax.legend()ax.set_title(f{method} 聚类结果 - PCA降维可视化2D)ax.set_xlabel(Principal Component 1)ax.set_ylabel(Principal Component 2)# 显示图表save_path os.path.join(IMAGE_FOLDER, f{method} 聚类结果 - PCA降维可视化2D.png)plt.savefig(save_path)plt.show()def plot_clus_3D(clustered_data, class_col, method)::param clustered_data: 带有聚类结果标签的数据集:param class_col: 代表聚类结果的列名:param n_clusters: 有多少个:param method::return:n_clusters clustered_data[class_col].nunique()# 执行PCA降维降至3维pca PCA(n_components3)data_reduced pca.fit_transform(clustered_data.drop(columns[class_col]))# 创建一个新的DataFrame来保存降维后的数据和聚类标签data_3D pd.DataFrame(data_reduced, columns[PC1, PC2, PC3])data_3D[class_col] clustered_data[class_col].values# 设置绘图参数fig plt.figure(figsize(10, 8))ax fig.add_subplot(111, projection3d)# 为每个聚类设置不同的颜色colors [red, green, blue] # 根据需要的聚类数修改颜色if n_clusters 3: # 如果聚类数超过3扩展颜色列表import matplotlib.colors as mcolorscolors list(mcolors.TABLEAU_COLORS.values())[:n_clusters]# 绘制每个聚类的散点图for i in range(n_clusters):# 从聚类数据中提取当前聚类的数据cluster_data data_3D[data_3D[class_col] i]# 绘制散点图ax.scatter(cluster_data[PC1], cluster_data[PC2], cluster_data[PC3],colorcolors[i], labelfCluster {i}, alpha0.5)# 添加图例和标题ax.legend()ax.set_title(f{method} 聚类结果 - PCA降维可视化3D)ax.set_xlabel(Principal Component 1)ax.set_ylabel(Principal Component 2)ax.set_zlabel(Principal Component 3)# 显示图表save_path os.path.join(IMAGE_FOLDER, f{method}_聚类结果_PCA降维可视化3D.png)plt.savefig(save_path)plt.show() 示例调用 clus_data pd.read_excel(kmeans聚类分析结果.xlsx, index_col0) plot_clus_2D(clustered_dataclus_data, class_colCluster, methodK-means) plot_clus_3D(clustered_dataclus_data, class_colCluster, methodK-means)clus_data pd.read_excel(层次聚类分析结果.xlsx, index_col0) plot_clus_2D(clustered_dataclus_data, class_colCluster, method层次聚类) plot_clus_3D(clustered_dataclus_data, class_colCluster, method层次聚类) 2D可视化 K-Means聚类结果 层次聚类结果 3D可视化 K-Means聚类结果 层次聚类结果
http://www.hkea.cn/news/14511609/

相关文章:

  • 程序员用来做笔记的网站网站的结构布局
  • 内蒙古城乡和建设厅网站谷歌seo网站建设
  • 哈尔滨住房城乡建设局网站首页家具设计软件有哪些
  • 深圳网站制作哪家价格便宜手机怎样创建网站
  • 昌吉网站建设wdcp wordpress搬家
  • 爱站网seo综合查询工具百度智能小程序是什么
  • 福州哪里做网站做布料的著名网站
  • 淄博市建设档案馆网站wordpress 邮件
  • 服务器IP做网址打开网站wordpress特定用户特定分类
  • 企业网站名称怎么写网站开发用什么系统比较好?
  • 礼品回收网站建设网站建设买服务器还是数据库
  • 安徽网站排名优化公司网站布局结构主要分为
  • php做商城网站步骤如何做免费网络推广
  • 自己做网站运营wordpress 显示异常
  • 上海虹口网站建设昆山网站开发建设公司
  • 做分销商城网站的常州百度关键词优化
  • 郑州网站建设seo优化wordpress shortlink
  • 北京学校网站建设公司有关网站建设国内外现状的文献
  • 沈阳网站制作聚艺科技帮传销做网站
  • 中国最好的网站器域名统一天津网站设计建设
  • 织梦个人博客网站源码常州妇幼做的无创 在哪个网站查
  • 长春网站建设索q479185700客户案例 网站设计
  • 网站备案建设方案温州网站制作哪家好
  • 网站建设需要ui吗营销型网站策划怎么做
  • 网站建设费专用票做网站软件frontpage
  • 个人网站建设价格策划案格式模板和范文
  • 莱芜企业建站公司杭州鼎易科技做网站太坑
  • 环保材料东莞网站建设ui基础教程入门
  • 手表网站欧米茄价格手机之家官网首页
  • 自己做网站必须要学哪些广州市移动网站建设服务公司