1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > 初学数据挖掘——数据探索(三):数据特征分析之对比分析

初学数据挖掘——数据探索(三):数据特征分析之对比分析

时间:2022-07-07 15:55:10

相关推荐

初学数据挖掘——数据探索(三):数据特征分析之对比分析

一、对比分析:

对比分析是将两个相互联系的指标进行比较,从数量上展示和说明研究对象的各种关系(规模的大小、水平的高低、速度的快慢等)是否协调。分析其中的差异,从而揭示这些事物代表的发展变化情况以及变化规律。

二、对比分析的原则:

对比对象相似:对比对象越相似,就越具有可比性。对比指标同质

三、对比分析的特点:

简单:因为与其他分析比较对比分析操作步骤少,不需要太复杂的计算。直观:是指能够直接看出事物的变化或差距,非常明显的知晓对比数据的相同或不同。量化:是指能够准确表示出变化或差距是多少,然后根据变化或差距的度量值,进行细分找到原因。

四、对比分析分类

1、绝对数比较

利用绝对数进行比较,从而寻找差异的一种方法。

2、相对数比较

由两个有联系的指标对比计算,用来反映客观现象之间数量联系程度的综合指标,其数值表现为相对数。

相对数可分为以下几种:

结构相对数:将同一总体内的部分数值与全部数值进行对比求得比重,用以说明事物的性质、结构或质量。比例相对数:将同一总体内不同部分的数值进行对比,展示总体内各部分的比例关系。比较相对数:将同一时期两个性质相同的指标数值进行对比,说明同类对象在不同空间条件下的数量对比关系。强度相对数:将两个性质不同有一定联系的总量指标进行对比,用来说明现象的强度、密度和普遍程度。计划完成程度相对数:将某一时期实际完成数与计划数进行对比,用以说明计划完成程度。动态相对数:将同一现象不同时期的指标数值进行对比,用以说明发展方向和变化速度。

五、实例

1、动态相对数

现有各菜品的销售数据:

链接:/s/1cWn6JmnmwZUDQ7bgv7_V-A

提取码:2677

以及B部门的销售数据:

链接:/s/1b3TXAq_9qjziy8RCRiA9xw

提取码:2677

部分数据示例:

现分析各部门销售金额随时间的变化趋势:

# 不同部门在各月份的销售对比情况# 部门之间销售金额比较import pandas as pdimport matplotlib.pyplot as pltdata=pd.read_excel("./data/dish_sale.xls") #读入数据plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号plt.figure(figsize=(8, 4))plt.plot(data['月份'], data['A部门'], color='green', label='A部门',marker='o') #绘制A部门曲线plt.plot(data['月份'], data['B部门'], color='red', label='B部门',marker='s') #绘制B部门曲线plt.plot(data['月份'], data['C部门'], color='skyblue', label='C部门',marker='x') #绘制C部门曲线plt.legend() # 显示图例plt.ylabel('销售额(万元)')plt.show()

# B部门各年份之间销售金额的比较data=pd.read_excel("./data/dish_sale_b.xls")plt.figure(figsize=(8, 4))plt.plot(data['月份'], data[''], color='green', label='',marker='o')plt.plot(data['月份'], data[''], color='red', label='',marker='s')plt.plot(data['月份'], data[''], color='skyblue', label='',marker='x')plt.legend() # 显示图例plt.ylabel('销售额(万元)')plt.show()

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。