海东企业网站建设,广告平台推广渠道,中国建设招标网是私人网站吗,包头网站网站建设1. 实验目的
①掌握Matplotlib绘图基础#xff1b; ②运用Matplotlib#xff0c;实现数据集的可视化#xff1b; ③运用Pandas访问csv数据集。
2. 实验内容
①绘制散点图、直方图和折线图#xff0c;对数据进行可视化#xff1b; ②下载波士顿数房价据集#xff0c;并…1. 实验目的
①掌握Matplotlib绘图基础 ②运用Matplotlib实现数据集的可视化 ③运用Pandas访问csv数据集。
2. 实验内容
①绘制散点图、直方图和折线图对数据进行可视化 ②下载波士顿数房价据集并绘制数据集中各个属性与房价之间的散点图实现数据集可视化 ③使用Pandas访问鸢尾花数据集对数据进行设置列标题、读取数据、显示统计信息、转化为Numpy数组等操作并使用Matpoltlib对数据集进行可视化。
3. 实验过程
题目一 这是一个商品房销售记录表请根据表中的数据按下列要求绘制散点图。其中横坐标为商品房面积纵坐标为商品房价格。 要求 (1)绘制散点图数据点为红色圆点 (2)标题为:“商品房销售记录”字体颜色为蓝色大小为16 (3)横坐标标签为:“面积(平方米)”纵坐标标签为“价格(万元)”字体大小为14。
源代码
import numpy as np
import matplotlib.pyplot as plt#设置rc参数
plt.rcParams[font.family] SimHei#设置默认字体为中文黑体
plt.rcParams[axes.unicode_minus] False #坐标轴上负号的显示可能会出错
area np.array([137.97,104.50,100.00,124.32,79.20,99.00,124.00,114.00,106.69,138.05,53.75,46.91,68.00,63.02,81.26,86.21])
price np.array([145.00,110.00,93.00,116.00,65.32,104.00,118.00,91.00,62.00,133.00,51.00,45.00,78.50,69.65,75.69,95.30])plt.scatter(area,price,color red)
plt.title(商品房销售记录,fontsize 16,color blue)
plt.xlabel(面积(平方米),fontsize 14)
plt.ylabel(价格(万元),fontsize 14)plt.show()题目二 按下列要求完成程序。 (1)下载波士顿数据集读取全部506条数据放在NumPy数组x、y中x属性y标记 (2)使用全部506条数据实现波士顿房价数据集可视化如图1所示 (3)要求用户选择属性如图2所示根据用户的选择输出对应属性的散点图如图3所示
图1 波士顿房价数据集可视化图 请用户输入属性
图2 属性选择图 运行结果
图3 运行结果图 import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as npboston_housing tf.keras.datasets.boston_housing
(train_x, train_y), (test_x, test_y) boston_housing.load_data(test_split0)plt.rcParams[font.sans-serif] SimHei
plt.rcParams[axes.unicode_minus] Falsetitles [CRIM, ZN, INDUS, CHAS, NOX, RM, AGE, DIS, RAD, TAX,PTRATIO, B-1000, LSTAT, MEDV
]plt.figure(figsize(14, 14))for i in range(13):plt.subplot(4, 4, i 1)plt.scatter(train_x[:, i], train_y)plt.xlabel(titles[i])plt.ylabel(Price($1000s))plt.title(str(i 1) . titles[i] - Price)plt.tight_layout(rect[0, 0, 1, 0.95])
plt.suptitle(各个属性与房价的关系, x0.5, y0.98, fontsize20)
plt.show()plt.close()print(请输入所选择的属性)
print( 1--CRIM\n, 2--ZN\n, 3--INDUS\n, 4--CHAS\n, 5--NOX\n, 6--RM\n, 7--AGE\n, 8--DIS\n, 9--RAD\n, 10--TAX\n,11--PTRATIO\n, 12--B-1000\n, 13--LSTAT\n, 14--MEDV)
n int(input())
sc titles[i - 1] Price($1000s)
plt.figure(figsize(5,5))
plt.scatter(train_x[:,i-1],train_y)
plt.xlabel(titles[i - 1])
plt.ylabel(Price($1000s))
plt.title(sc)
plt.show()题目三 使用鸢尾花数据集绘制如下图形其中对角线为属性的直方图。
提示绘制直方图函数 plt.hist(x, align ‘mid’, color, edgecolor)
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np
import pandas as pdTRAIN_URL http://download.tensorflow.org/data/iris_training.csv
train_path tf.keras.utils.get_file(TRAIN_URL.split(/)[-1],TRAIN_URL)#设置列标题
COLUMN_NAMES [SepalLEngth, SePalWidth, PetalLength, PetalWidth, Species
]
#下载鸢尾花数据集并设置列标题
dr_iris pd.read_csv(train_path, namesCOLUMN_NAMES, header0)iris np.array(dr_iris)fig plt.figure(figsize(15, 15))fig.suptitle(Andersons Iris Data Set\n(Bule-Setosa | Red-Versicolor | Green-Virginica)
)
for i in range(4):for j in range(4):plt.subplot(4, 4, 4 * i (j 1))if (i j):plt.hist(iris[:, j], alignmid)else:plt.scatter(iris[:, j], iris[:, i], ciris[:, 4], cmapbrg)plt.title(COLUMN_NAMES[j]) # 横坐标标签使用子图标题来实现plt.ylabel(COLUMN_NAMES[i])plt.tight_layout(rect[0, 0, 1, 0.93])plt.show()4.实验小结讨论题
① 实验过程中遇到了哪些问题你是如何解决的 没有熟悉使用pycharm询问了同学。
② 根据题目二的数据进行可视化结果分析波士顿数据集中各个属性对房价的影响。 占地面积与房价大致呈线性相关。
③ Numpy和Pandas各有什么特点和优势在应用中应如何选择 Pandas拥有Numpy一些没有的方法例如describe函数。其主要区别是Numpy就像增强版的List而Pandas就像列表和字典的合集Pandas有索引。Pandas有两种结构分别是Series和DataFrame。其中Series拥有Numpy的所有功能可以认为是简单的一维数组而DataFrame是将多个Series按列合并而成的二维数据结构每一列单独取出来是一个Series。
④ 在题目基本要求的基础上你对每个题目做了那些扩展和提升或者你觉得在编程实现过程中还有哪些地方可以进行优化 完全按照题目的要求来做的。