当前位置: 首页 > news >正文

j昆明网站制作公司软件开发服务费

j昆明网站制作公司,软件开发服务费,免费企业网站报价,网站使用条款模板数据的截图#xff0c;数据的说明#xff1a; # 字段 数据类型 # 城市 string # 名称 string # 星级 string # 评分 float # 价格 float # 销量 int # 省/市/区 string # 坐标 string # 简介 string # 是否免费 bool # 具体地址 string拿到数据… 数据的截图数据的说明 # 字段 数据类型 # 城市 string # 名称 string # 星级 string # 评分 float # 价格 float # 销量 int # 省/市/区 string # 坐标 string # 简介 string # 是否免费 bool # 具体地址 string 拿到数据第一步我们先导入数据查看一下数据的分布类型等 import pandas as pd import numpy as np import matplotlib.pyplot as pltdata pd.read_excel(旅游景点.xlsx) pd.set_option(display.max_columns,100) # print(data.head())print(data.info()) print(data.isnull().sum()) 接下来我们来看具体的问题 # 问题先大概分析一下 # 1、全国景点分布 我们分析城市的分布即可 # 2、国民出游分析 我们可以分析评分城市销量之间的关系 # 3、景区价格分析 我们分析价格因素 # 问题看完之后我们开始对数据进行预处理 # 由于星级对我们问题的分析帮助很大所以我们无法用删除或者众数等方式填充因此我们用无来填充将其划分为一个新的类别 data[星级] data[星级].fillna(无) print(data[星级].isnull().sum()) 至于简介和地址缺失数据无关紧要这里我们可以选择用无来填充也可以用删除来处理为了不破坏数据的完整性这里我选择用无来填充 data data.fillna(无) # print(data.isnull().sum()) # 这样我们的数据就没有了缺失值 # print(data.info()) # 1、全国景点分布 我们分析城市的分布即可 scenic data[城市].value_counts().sort_values(ascendingFalse) plt.figure() scenic.plot(kindbar,stackedFalse,colormapviridis,figsize(10,6)) plt.title(各个城市景点数量分布图) plt.xlabel(城市) plt.ylabel(景点个数) # plt.show() # 2、国民出游分析 我们可以分析评分城市销量之间的关系 # data[销量] data[销量].astype(int) 这种转换类型的方法如果有无法转换的值则无法转换 data[评分] pd.to_numeric(data[评分], errorscoerce) data[销量] pd.to_numeric(data[销量],errorscoerce) data[价格] pd.to_numeric(data[价格],errorscoerce)city_sales data.groupby(城市)[销量].sum() city_sales city_sales.sort_values(ascendingFalse)plt.figure() city_sales.plot(kindbar,stackedTrue,colormapplasma,figsize(10,6)) plt.title(各个城市景点门票销量) plt.xlabel(城市) plt.ylabel(销量)# 从销量可以看出北京上海江苏四川陕西广东的销量较高因此我们着重分析这六个地方的景点评分 shanghai data[data[城市].str.contains(上海)] beijing data[data[城市].str.contains(北京)] jiangsu data[data[城市].str.contains(江苏)] sichuan data[data[城市].str.contains(四川)] shanxi data[data[城市].str.contains(陕西)] guangdong data[data[城市].str.contains(广东)]shanghai_group shanghai.groupby(名称)[销量].sum().reset_index() beijing_group beijing.groupby(名称)[销量].sum().reset_index() jiangsu_group jiangsu.groupby(名称)[销量].sum().reset_index() sichuan_group sichuan.groupby(名称)[销量].sum().reset_index() shanxi_group shanxi.groupby(名称)[销量].sum().reset_index() guangdong_group guangdong.groupby(名称)[销量].sum().reset_index()shanghai_sort shanghai_group.merge(shanghai[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) beijing_sort beijing_group.merge(beijing[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) jiangsu_sort jiangsu_group.merge(jiangsu[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) sichuan_sort sichuan_group.merge(sichuan[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) shanxi_sort shanxi_group.merge(shanxi[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) guangdong_sort guangdong_group.merge(guangdong[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10)shanghai_sort.reset_index(dropTrue,inplaceTrue) beijing_sort.reset_index(dropTrue,inplaceTrue) jiangsu_sort.reset_index(dropTrue,inplaceTrue) sichuan_sort.reset_index(dropTrue,inplaceTrue) shanxi_sort.reset_index(dropTrue,inplaceTrue) guangdong_sort.reset_index(dropTrue,inplaceTrue)plt.figure() plt.bar(shanghai_sort[名称],shanghai_sort[销量]) for i, v in enumerate(shanghai_sort[评分]):plt.text(i, shanghai_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(上海市销量排名前十的景点) plt.xticks(rotation45)plt.figure() plt.bar(beijing_sort[名称], beijing_sort[销量]) for i, v in enumerate(beijing_sort[评分]):plt.text(i, beijing_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(北京市销量排名前十的景点) plt.xticks(rotation45)plt.figure() plt.bar(jiangsu_sort[名称], jiangsu_sort[销量]) for i, v in enumerate(jiangsu_sort[评分]):plt.text(i, jiangsu_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(江苏省销量排名前十的景点) plt.xticks(rotationvertical)plt.figure() plt.bar(sichuan_sort[名称], sichuan_sort[销量]) for i, v in enumerate(sichuan_sort[评分]):plt.text(i, sichuan_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(四川省销量排名前十的景点) plt.xticks(rotation45)plt.figure() plt.bar(shanxi_sort[名称], shanxi_sort[销量]) for i, v in enumerate(shanxi_sort[评分]):plt.text(i, shanxi_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(陕西省销量排名前十的景点) plt.xticks(rotation45)plt.figure(figsize(10,6)) plt.bar(guangdong_sort[名称], guangdong_sort[销量]) for i, v in enumerate(guangdong_sort[评分]):plt.text(i, guangdong_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(广东省销量排名前十的景点) plt.xticks(rotation45) 由此我们结合这几个分析来回答这几个问题
http://www.hkea.cn/news/14362563/

相关文章:

  • 安徽平台网站建设设计莱芜车管所网站
  • 三位效果网站模版自适应网站建设方案
  • 泰州网站制作平台做网站的费用属于什么费用
  • 长春餐饮网站建设设计新颖的网站建站
  • 织梦教育网站开发辽宁高速公路建设管理局网站
  • 安徽振兴集团网站开发怎么自己学做电商
  • 赣州网站建设价位263邮箱注册
  • 上海微网站公司孝感网站开发优搏好
  • steam做皮肤网站163网易免费邮箱
  • 免费建站自助建站服务器中安装网站
  • 展示型网站一样做seo优化建设互联网站的目的
  • 国外做家居类的网站让人做网站需要准备什么软件
  • 弄一个关于作文的网站怎么做wordpress短代码教程
  • 有不花钱做网站网站怎么做优化推广
  • 漫画网站源码中国建设银行龙卡网站
  • 网站没有百度权重可信网站认证代理
  • 怎么建立一个网站让百度搜到做网站必须搭框架么
  • 做导航网站不侵权吗怎么设网站
  • 网站建设与优化标准wordpress用lanmp
  • 印刷网站建设wordpress建站实例
  • 网站信息建设总结PHP套模板做网站
  • 网站公司打电话来说做网站h5海报怎么制作
  • wordpress 加密小旋风seo官网
  • 网站里面的图片做桌面不清晰度厦门网站关键词推广
  • 河南住房和城乡建设厅职称网站seo招聘
  • 广州石井做网站网站是用什么做的吗
  • 郑州网站建设e橙网熊掌号建网站的详细技术
  • 网站建设与管理教学视频下载产品发布网站模板
  • 阿里巴巴国际站买家入口做网站创新互联
  • 网站的主域名网页qq表情