网站建设相关视频教程,网站建设的一些问题,wordpress 增量备份,百度广州分公司是外包吗文章目录 #x1f3f3;️#x1f308; 1. 导入模块#x1f3f3;️#x1f308; 2. Pandas数据处理2.1 读取数据2.2 过滤数据2.3 行政区处理2.4 地址处理2.5 房屋信息处理2.6 面积处理2.7 楼层处理2.8 年份处理2.9 房价处理2.10 删除不用的列2.11 数据类型转换2.12 查看… 文章目录 ️ 1. 导入模块️ 2. Pandas数据处理2.1 读取数据2.2 过滤数据2.3 行政区处理2.4 地址处理2.5 房屋信息处理2.6 面积处理2.7 楼层处理2.8 年份处理2.9 房价处理2.10 删除不用的列2.11 数据类型转换2.12 查看数据信息 ️ 3. Pyecharts数据可视化3.1 各行政区二手房数量地图3.2 各行政区二手房数量柱状图3.3 各行政区二手房均价地图3.4 户型占比分布3.5 楼层数量分布3.6 朝向数量分布3.7 面积-总价分布3.8 建设年份分布3.9 小区房价词云 ️ 4. 可视化项目源码数据 大家好我是 【Python当打之年(点击跳转)】
本期利用 python 分析一下「杭州二手房数据」 看看杭州市各区二手房数量、二手房价格分布、户型分布、年份分布、小区分布 等希望对大家有所帮助如有疑问或者需要改进的地方可以联系小编。
涉及到的库
Pandas — 数据处理Pyecharts — 数据可视化
️ 1. 导入模块
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings(ignore)️ 2. Pandas数据处理
2.1 读取数据
df pd.read_excel(./二手房数据.xlsx)2.2 过滤数据
df1 df.copy()2.3 行政区处理
names [拱墅, 西湖, 滨江, 上城, 临平, 余杭, 萧山, 富阳, 桐庐, 临安, 淳安,建德, 钱塘]2.4 地址处理
df1[小区] df1[地址].str.split( , n2 ,expandTrue)[1]2.5 房屋信息处理
df1[房屋信息].str.split(|,expandTrue)2.6 面积处理
df1[面积(㎡)] df1[面积].apply(lambda x: re.findall(r\d, x))2.7 楼层处理
df1[楼层] df1[楼层].apply(lambda x: re.findall(r\d, x))2.8 年份处理
df1[年份] df1[年份].apply(lambda x: re.findall(r\d, x))2.9 房价处理
df1[总价(万)] df1[房价].apply(lambda x: re.findall(r\d, x))2.10 删除不用的列
df1 df1.drop([房屋信息,房价,联系人,面积, 地址,地铁])2.11 数据类型转换
for col in [楼层,年份, 卧室, 客厅, 面积(㎡),总价(万),单价(元/㎡)]:df1[col] df1[col].astype(int)2.12 查看数据信息
df1.info()️ 3. Pyecharts数据可视化
3.1 各行政区二手房数量地图
def get_chart():chart (Map().add(,[list(z) for z in zip(x_data, y_data)],杭州,).set_global_opts(title_optsopts.TitleOpts(title1-各行政区二手房数量地图,subtitlesubtitle,pos_top2%,pos_leftcenter,),visualmap_optsopts.VisualMapOpts(pos_left3%,)))萧山区、拱墅区、西湖区、上城区、临安区的二手房数量要高于其他城区。东部二手房数量高于西部地区。
3.2 各行政区二手房数量柱状图
def get_chart2():chart (Bar().add_xaxis(x_data).add_yaxis(, y_data).set_global_opts(title_optsopts.TitleOpts(title2-各行政区二手房数量,pos_top2%,pos_leftcenter,),visualmap_optsopts.VisualMapOpts(is_showFalse),))return chart3.3 各行政区二手房均价地图 上城区、滨江区二手房均价在600万以上富阳区、淳安县、拱墅区均价在500万以上。
3.4 户型占比分布
def get_chart():chart (Pie().add(,sorted_by_value,).set_global_opts(title_optsopts.TitleOpts(title4-户型占比分布,pos_top2%,pos_leftcenter,),visualmap_optsopts.VisualMapOpts(is_showFalse,),).set_series_opts(label_optsopts.LabelOpts(formatter{b}: {d}%,)))3室2厅户型的二手房共1905套占比约45%。4室2厅户型的二手房共876套占比约20%。2室2厅户型的二手房共509套占比约12%。3室2厅、4室2厅、2室2厅户型的二手房占比约77%。
3.5 楼层数量分布
def get_chart3():chart (Pie().add(, [list(z) for z in zip(x_data, y_data)]).set_global_opts(title_optsopts.TitleOpts(title5-出行团体占比,pos_top2%,pos_leftcenter),legend_optsopts.LegendOpts(is_showFalse),visualmap_optsopts.VisualMapOpts(is_showFalse,),).set_series_opts(label_optsopts.LabelOpts(formatter{b}: {d}%)))return chart7层、8层、12层、19层的二手房数量明显高于其他楼层。除此之外的二手房楼层分布高层的数量比低层的多也就是说出售低层房屋的住户较高层少。
3.6 朝向数量分布 90%以上的二手房朝向都是南向、南北向的。
3.7 面积-总价分布
def get_chart():chart (Scatter().add_xaxis(x_data).add_yaxis(,y_data,label_optsopts.LabelOpts(is_showFalse)).set_global_opts(title_optsopts.TitleOpts(title7-面积-总价分布,pos_top2%,pos_leftcenter),visualmap_optsopts.VisualMapOpts(is_showFalse),))呈现面积越大房价越高的走势基本符合二手房市场的现状。
3.8 建设年份分布
def get_chart4():chart (WordCloud().add(,words,word_size_range[10,50]).set_global_opts(title_optsopts.TitleOpts(title8-旅游行程景点词云,pos_top2%,pos_leftcenter,),legend_optsopts.LegendOpts(is_showFalse),visualmap_optsopts.VisualMapOpts(is_showFalse),))return chart近10年的房屋出售数量普遍不较高尤其是2018年和2020年的房屋出售数量超过400套房屋建设年限算是比较短的了。
3.9 小区房价词云
def get_chart():chart (WordCloud().add(,words,word_size_range[10,50]).set_global_opts(title_optsopts.TitleOpts(title9-小区房价词云,pos_top2%,pos_leftcenter,),visualmap_optsopts.VisualMapOpts(is_showFalse),))【下期杭州二手房数据爬虫】
️ 4. 可视化项目源码数据 点击跳转【全部可视化项目源码数据】 以上就是本期为大家整理的全部内容了赶快练习起来吧原创不易喜欢的朋友可以点赞、收藏也可以分享注明出处让更多人知道。