1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > 散点图绘制+纵向条形图+横向条形图+多组条形图绘制+直方图(原始数据和非原始数据的处

散点图绘制+纵向条形图+横向条形图+多组条形图绘制+直方图(原始数据和非原始数据的处

时间:2021-02-08 06:54:30

相关推荐

散点图绘制+纵向条形图+横向条形图+多组条形图绘制+直方图(原始数据和非原始数据的处

目录

一、散点图

1、代码实现

1、代码实现

(1)纵向条形图

(2)横向条形图

2、应用场景

三、直方图

1、代码实现

(1)原始数据处理

(2)经过处理的数据——需要通过条形图来实现

2、应用场景

一、散点图

1、代码实现

假设通过爬虫你获取到了北京3,10月份每天白天的最高气温(分别位于列表a,b),那么此时如何寻找出气温和随时间(天)变化的某种规律?

a = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]

b = [26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15,11,15,5,13,17,10,11,13,12,13,6]

重点:设置了x_3和x_10,是为了将两组数据区分开来

#在同一个图像里表示出3月和10月的气温变化散点图from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\HGXC_CNKI.TTF")y_3 = [11, 17, 16, 11, 12, 11, 12, 6, 6, 7, 8, 9, 12, 15, 14, 17, 18, 21, 16, 17, 20, 14, 15, 15, 15, 19, 21, 22, 22, 22, 23]y_10 = [26, 26, 28, 19, 21, 17, 16, 19, 18, 20, 20, 19, 22, 23, 17, 20, 21, 20, 22, 15, 11, 15, 5, 13, 17, 10, 11, 13, 12, 13, 6]x_3 = range(1, 32)x_10 = range(51, 82)plt.figure(figsize=(20, 8), dpi=80)plt.scatter(x_3, y_3, label="3月气温变化")plt.scatter(x_10, y_10, label="10月气温变化")#设置坐标轴刻度_x = list(x_3) + list(x_10)_xtick_labels = ["3月{}日".format(i) for i in x_3]_xtick_labels += ["10月{}日".format(i-50) for i in x_10]plt.xticks(_x[::3], _xtick_labels[::3], rotation=45, fontproperties=my_font)plt.xlabel("时间", fontproperties=my_font)plt.ylabel("气温 单位(摄氏度)", fontproperties=my_font)plt.legend(prop=my_font, loc="upper left")plt.show()

2、应用场景•不同条件(维度)之间的内在关联关系•观察数据的离散聚合程度

二、条形图

1、代码实现

假设你知道了列表a中电影分别在-09-14(b_14), -09-15(b_15), -09-16(b_16)三天的票房,为了展示列表中电影本身的票房以及同其他电影的数据对比情况,应该如何更加直观的呈现该数据?

(1)纵向条形图

from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STZHONGS.TTF")a = ["战狼2", "速度与激情8", "功夫瑜伽", "西游伏妖篇", "变形金刚5:最后的骑士", "摔跤吧!爸爸", "加勒比海盗5:死无对证", "金刚:骷髅岛", "极限特工:终极回归", "生化危机6:终章", "乘风破浪", "神偷奶爸3", "智取威虎山", "大闹天竺", "金刚狼3:殊死一战", "蜘蛛侠:英雄归来", "悟空传", "银河护卫队2", "情圣", "新木乃伊"]b = [56.01, 26.94, 17.53, 16.49, 15.45, 12.96, 11.8, 11.61, 11.28, 11.12, 10.49, 10.3, 8.75, 7.55, 7.32, 6.99, 6.88, 6.86, 6.58, 6.23]plt.bar(range(len(a)), b)#设置横坐标plt.xticks(range(len(a)), a, fontproperties=my_font, rotation=90)plt.show()#由于x轴的刻度标注特别长,横向直方图更好看一点

(2)横向条形图

注意,在横向条形图里,barh()函数的第一个参数是纵坐标,第二个参数是横坐标,其实就是bar()函数里的x坐标和y坐标,顺序不需要调整,但是bar的第三个参数是width,对应到barh函数的height

'''from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STZHONGS.TTF")a = ["战狼2", "速度与激情8", "功夫瑜伽", "西游伏妖篇", "变形金刚5:最后的骑士", "摔跤吧!爸爸", "加勒比海盗5:死无对证", "金刚:骷髅岛", "极限特工:终极回归", "生化危机6:终章", "乘风破浪", "神偷奶爸3", "智取威虎山", "大闹天竺", "金刚狼3:殊死一战", "蜘蛛侠:英雄归来", "悟空传", "银河护卫队2", "情圣", "新木乃伊"]b = [56.01, 26.94, 17.53, 16.49, 15.45, 12.96, 11.8, 11.61, 11.28, 11.12, 10.49, 10.3, 8.75, 7.55, 7.32, 6.99, 6.88, 6.86, 6.58, 6.23]plt.barh(range(len(a)), b, width=0.3)#设置横坐标plt.yticks(range(len(a)), a, fontproperties=my_font)plt.xlabel("票房", fontproperties=my_font)plt.ylabel("电影名称", fontproperties=my_font)plt.show()Traceback (most recent call last):File "D:/developer_tools/python/机器学习库/横向直方图.py", line 16, in <module>plt.barh(range(len(a)), b, width=0.3)TypeError: barh() got multiple values for argument 'width'出现这个问题之后可以找一下barh源码def barh(y, width, height=0.8, left=None, *, align='center', **kwargs):return gca().barh(y, width, height=height, left=left, align=align, **kwargs)前两个是y轴和x轴的坐标,第三个是直方图的线条粗细'''from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STZHONGS.TTF")a = ["战狼2", "速度与激情8", "功夫瑜伽", "西游伏妖篇", "变形金刚5:最后的骑士", "摔跤吧!爸爸", "加勒比海盗5:死无对证", "金刚:骷髅岛", "极限特工:终极回归", "生化危机6:终章", "乘风破浪", "神偷奶爸3", "智取威虎山", "大闹天竺", "金刚狼3:殊死一战", "蜘蛛侠:英雄归来", "悟空传", "银河护卫队2", "情圣", "新木乃伊"]b = [56.01, 26.94, 17.53, 16.49, 15.45, 12.96, 11.8, 11.61, 11.28, 11.12, 10.49, 10.3, 8.75, 7.55, 7.32, 6.99, 6.88, 6.86, 6.58, 6.23]plt.figure(figsize=(20, 8), dpi=80)plt.barh(range(len(a)), b, height=0.3, color="#87CEEB")#设置横坐标plt.yticks(range(len(a)), a, fontproperties=my_font)plt.xlabel("票房", fontproperties=my_font)plt.ylabel("电影名称", fontproperties=my_font)plt.grid(alpha=0.4)plt.show()

(3)多种类条形图

from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STZHONGS.TTF")a = ["猩球崛起3:终极之战", "敦刻尔克", "蜘蛛侠:英雄归来", "战狼2"]b_16 = [15746, 312, 4497, 319]b_15 = [12357, 156, 2045, 168]b_14 = [2358, 399, 2358, 362]bar_width = 0.2 #在直方图里面,快度最好是0.1或者0.2,0.4就会重叠了x_14 = list(range(len(a)))x_15 = [i+0.2 for i in x_14]x_16 = [i+0.2*2 for i in x_14]#设置图形大小plt.figure(figsize=(20, 8), dpi=80)plt.bar(range(len(a)), b_14, width=bar_width)plt.bar(x_15, b_15, width=bar_width)plt.bar(x_16, b_16, width=bar_width)#设置x轴的刻度plt.xticks(x_15, a, fontproperties=my_font) #因为x_15在中间,所以用x_15来更中文字符串对应plt.show()

2、应用场景

• 数量统计 • 频率统计 ( 市场饱和度 )

三、直方图

1、代码实现

(1)原始数据处理

假设你获取了250部电影的时长(列表a中),希望统计出这些电影时长的分布状态(比如时长为100分钟到120分钟电影的数量,出现的频率)等信息,你应该如何呈现这些数据?

注意:直方图中的hist函数第一个参数需要传入原始数据,没有经过处理的原始数据!

from matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname=r"C:\Windows\Fonts\STZHONGS.TTF")a = [131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119, 128, 121, 142, 127, 130, 124, 101, 110, 116, 117, 110, 128, 128, 115, 99, 136, 126, 134, 95, 138, 117, 111,78, 132, 124, 113, 150, 110, 117, 86, 95, 144, 105, 126, 130,126, 130, 126, 116, 123, 106, 112, 138, 123, 86, 101, 99, 136,123, 117, 119, 105, 137, 123, 128, 125, 104, 109, 134, 125, 127,105, 120, 107, 129, 116, 108, 132, 103, 136, 118, 102, 120, 114,105, 115, 132, 145, 119, 121, 112, 139, 125, 138, 109, 132, 134,156, 106, 117, 127, 144, 139, 139, 119, 140, 83, 110, 102,123,107, 143, 115, 136, 118, 139, 123, 112, 118, 125, 109, 119, 133,112, 114, 122, 109, 106, 123, 116, 131, 127, 115, 118, 112, 135,115, 146, 137, 116, 103, 144, 83, 123, 111, 110, 111, 100, 154,136, 100, 118, 119, 133, 134, 106, 129, 126, 110, 111, 109, 141,120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114, 125, 126,114, 140, 103, 130, 141, 117, 106, 114, 121, 114, 133, 137, 92,121, 112, 146, 97, 137, 105, 98, 117, 112, 81, 97, 139, 113,134, 106, 144, 110, 137, 137, 111, 104, 117, 100, 111, 101, 110,105, 129, 137, 112, 120, 113, 133, 112, 83, 94, 146, 133, 101,131, 116, 111, 84, 137, 115, 122, 106, 144, 109, 123, 116, 111,111, 133, 150]#设置合适的组距#print(max(a), min(a), max(a)-min(a))#156 78 78 那么接下来要设置一个把78整除的数值,由于电影时长分布也比较密集,当我们相看处主要时长时,组距可以设置紧密一点,例如d=3#如果组数不能整除最大值和最小值的差,方格图的间距就不能很好得与图形间距相对应d = 3num_bins = (max(a) - min(a))//3 #这里必须是取模,不然会报错print(num_bins)#绘制直方图时,需要用到hist函数,需要传入被分析的数据和组数plt.figure(figsize=(20, 10), dpi=80)plt.hist(a, num_bins, density=1)#如果希望纵坐标表示的频率,则需要加density=True或者是density=1plt.xticks(range(min(a), max(a)+d, d))plt.grid(alpha=0.4)plt.show()

(2)经过处理的数据——需要通过条形图来实现

#通常情况下,我们绘制直线图的时候,需要的是原始数据,而非进行过统计分析的数据,如果是非原始的数据,只能通过折线图来绘制直方图from matplotlib import pyplot as pltinterval = [0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 60, 90]width = [5, 5, 5, 5, 5, 5, 5, 5, 5, 15, 30, 60]quantity = [836, 2737, 3723, 3926, 3596, 1438, 3273, 642, 824, 613, 215, 47]plt.figure(figsize=(20, 10), dpi=80)plt.bar(range(12), quantity, width=1)#默认的width=0.8 绘制出来的图像有空隙,为了补足空隙,我们将快宽度加宽#设置x轴刻度,需要右移0.5,左加右减_x = [i-0.5 for i in range(12)]_xtick_label = intervalplt.xticks(_x, interval)plt.grid(alpha=0.4)plt.show()

2、应用场景

• 用户的年龄分布状态 • 一段时间内用户点击次数的分布状态 • 用户活跃时间的分布状态

散点图绘制+纵向条形图+横向条形图+多组条形图绘制+直方图(原始数据和非原始数据的处理)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。