1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > 「SPSS数据分析」SPSS非参数假设检验

「SPSS数据分析」SPSS非参数假设检验

时间:2021-03-14 06:34:37

相关推荐

「SPSS数据分析」SPSS非参数假设检验

-09-21 12:28:00

非参数检验小贴士

非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。

参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。

非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。

SPSS二项检验

系统学习了参数类假设检验的相关方法后,开始来系统的学习与之相对的非参数检验的一些列统计分析方法。

本课程详细介绍一种常用的SPSS非参数检验方法:二项检验。二项检验所检验的变量为二分类,且分类为互相对立,比如患病和未患病,比如是和否,或者大于50岁和小于50岁等等。研究此类变量的二项分布与我们既定的检验比例之间的差异。

我们搜集了472例样本,孩子是否为独生子女的数据,其中0表示非独生,1表示是独生。我们要分析独生子女与非独生子女的比例是否达到了我们既定70%,30%这样一个比例。(图1)

图1

二项检验操作步骤:

①点击“分析”--“非参数检验”--“旧对话框”--“二项”(图2)

图2

②将变量“是否为独生子女”选入右侧“检验变量列表”(图3)

图3

③将“检验比例”中填入0.7,也就是我们想检验的70%既定比例(图4)

图4

④点击“确定”,运算并分析结果

图5

由上表(图5)可以看出:基于二项检验的原假设H0,是本次检验的独生子女比例为70%之间不存在显著差异,而原假设的P<0.05,因此要拒绝原假设H0,接受备选假设H1,即是独生子女与非独生子女的实测比例与既定比例之间存在着显著的差异。

而且,结合实测比例结果,看出本例当中是独生子女比例仅为10%,显著小于既定检验比例70%。

(2)SPSS游程检验

游程检验小贴士

游程检验亦称“连贯检验”,是根据样本标志表现排列所形成的游程的多少进行判断的检验方法,游程检验是一种非参数性统计假设的检验方法,游程总数检验和最大游程检验的总称,用于观测结果随机性的检验测试。

游程检验在SPSS中的操作

在研究中,我们会随机收集一定数量的样本,对样本进行数据统计分析来反映总体的情况。

那么收集回来的样本数据是否真的具有随机性呢?或者说我们在收集过程中是否无意间进行了针对性的收集导致样本数据并不随机呢?

为了确定数据的随机性,我们需要对样本进行随机性的检验,也就是本次课程所介绍的游程检验。

游程检验需要检验变量为二分类数据,下面通过实际案例数据来详细讲解。我们搜集了472例被调查者“是否为独生子女”的数据,检验其是否为随机数据(图1)

图1

SPSS游程检验操作步骤:

①点击“分析”--“非参数检验”--“旧对话框”--“游程”(图2)

图2

②将“是否为独生子女”选入右侧检验变量列表内,并将勾选“定制”,填入1,由于“是否为独生子女”为二分类变量,并且编码为0和1,因此需要这样设置(图3)

图3

③结果分析

图4

由上表(图4)可以看出:本结果的原假设H0为,被检验变量是符合随机样本分布的,这里的显著性水平大于0.05,因此接受原假设,说明“是否为独生子女”是符合随机分布的,通过了游程检验。

那么,如果当我们需要检验的变量为连续型变量或者多分类变量的时候,该如何分析操作呢?下面通过实际案例来详细讲解。以本数据为例,检验“教养方式”和“Q1”,分别为多分类变量和连续型变量(图5)

图5

操作的关键区别在于通过设置“分割点”的设置不同,将多分类变量和连续变量转换为二分类,从而适应游程检验。图6-图7

图6

图7

这里多分类变量需要将分割点设置为“众数”,而连续型变量则根据需求可设置为“均值”或“中位数”。

结果分析则与二分类变量一样分析即可。这里不再赘述。

(3)单样本K-S检验

单样本K-S检验是一种针对单个变量的数据分布进行的探索类别的检验方法。它不需要将数据分组,直接对原始数据的n个观测值进行检验,单样本K-S检验主要用于连续型数据。其中可检验分布类别有正态分布、平均分布、泊松分布、指数分布等。通常用到最多的就是检验是否服从正常性分布。

下面,我们通过实际案例来详细讲解单样本K-S检验数据是否符合正态分布。我们搜集了472例减肥前体重数据,检验该数据整体上是否服从正态性分布(图1)

图1

SPSS中的操作步骤

①点击“分析”--“非参数检验”--“旧对话框”--“单样本K-S”(图2)

图2

②将减肥前体重选入右侧检验变量列表内(图3)

图3

③勾选下方检验分布中的“正态”标签(图4),后点击确定

图4

④对SPSS的输出结果进行分析

图5

由上图(图5)可以看出:本检验的原假设H0为被检验变量是服从正态性分布,这里基于原假设H0的显著性水平为0小于0.05,意味着减肥前体重服从正态性的概率为0%,因此需要拒绝原假设H0,接受备选假设,即减肥前体重不服从正态性分布。

(4)两独立样本检验

在前期的参数类假设检验课程中,我们已经讲解过两独立样本的t检验,有兴趣的朋友请看:

《SPSS差异分析(3)独立样本T检验》

非参数类假设的两独立样本检验与独立样本T检验大同小异,唯一的区别在于:检验变量类型。独立样本T检验适用的检验变量类型为服从正态性分布的连续型变量,而两独立样本检验适用的检验变量类型为非正态分布的连续型变量。

本期我们通过实际案例数据来详细讲解两独立样本检验的操作步骤及结果解读。我们搜集了472例样本数据,来分析“减肥前体重”在“是否为独生子女”上有无显著的差异(图1)

图1

SPSS中的操作步骤:

①点击“分析”--“非参数检验”--“旧对话框”--“两个独立样本”(图2)

图2

②将减肥前体重选入右侧检验变量列表,将是否独生子女选入分组变量(图3)

图3

③点击“定义组”,定义分组范围赋值,这里编码为0-1(图4)

图4

④勾选下方检验类型为“曼-惠特尼 U”(图5)

图5

上图中(图5)的四种检验类型简单的说明一下:

曼-惠特尼U检验(Mann-Whitney U test),考查了每一个样本中各测定值所排的秩。

柯尔莫哥洛夫-斯米诺夫检验(Kolmogorov-Smirnov),也就是K-S检验,将理论累积频率分布与观测的经验累积频率分布加以比较,求出它们最大的偏离值,然后在既定的显著性水平上检验。

莫斯极端反应,将两样本分别作为对照和处理。以对照为参考标准,检验处理是否存在极端反应。

瓦尔德-沃尔福威茨游程检验,将两样本混合升序排列,计算分组标志序列的游程数。

通常我们使用的都是曼-惠特尼U检验,能效性在这些中相对较强。

⑤结果分析

图6

由上表(图6)看出:两独立样本的非参数检验原假设H0为,两独立组之间不存在显著的差异,基于此假设的显著性水平大于0.05,因此接受原假设,因此独生和非独生组之间的减肥前体重不存在显著的差异。

(5)K个独立样本检验

两个独立样本的非参数检验,适用的是2个独立组之间一列非正态性分布连续变量的比较。

当需要比较的独立组别为3个或者3个以上的时候,上法则不再适用,这时就需要用到本方法——K个独立样本的非参数检验。

下面通过实际案例数据来进行详细讲解,我们搜集了472例“渴求性”和“教养方式(4种)”的数据,想比较4种不同教养方式下的“渴求性”是否存在显著差异。(图1)

图1

SPSS中的操作步骤:

①点击“分析”--“非参数检验”--“旧对话框”--“K个独立样本”(图2)

图2

②将“渴求性”选入右侧检验变量列表,将“教养方式”选入分组变量(图3)

图3

③点击“定义范围”,设置“教养方式”分组编码范围,这里分为4组,编码为1-4,(图4)

图4

④勾选下方检验类型为“克鲁斯卡尔-沃利斯 H”检验(图5)

图5

这里需要简单介绍一下图5中的3种检验:

1. K-W H检验,这里与之前的两独立样本的曼惠特尼U检验类似,为其扩展,比较3组或3组上的秩的均值是否存在显著的差异。

2. 中位数检验,比较3组的中位数之间是否存在显著的差异。

3. 约克海尔-塔帕斯特拉检验,是针对分组变量为有序等级变量的差异比较。

这里我们的教养方式为无序分组变量,因此采用K-W H检验,而中位数检验能效不如K-W H检验。

⑤结果分析

图6

从上表(图6)可以看出:原假设H0为多组之间的渴求性不存在显著差异,基于这个假设的显著性水平为0.052大于0.05,因此要接受原假设H0,故不同“教养方式”的“渴求性”不存在显著的差异。

如果存在显著的差异,还需要进一步分析是哪两组之间存在显著的差异,需要进一步进行两两比较,具体方法在前期课程中有详细的讲解。

(6)两个相关样本

SPSS非参数检验——两个相关样本,与之对应的是参数检验中的配对样本T检验。简单的说:配对样本T检验适用于参数类型数据,而两个相关样本则适用于非参数类型数据。

下面通过实际案例来进行详细讲解。我们搜集了472人减肥前和减肥后的体重数据,为非正态性分布数据(想学习如何检验正态性可以查阅之前的对应课程),比较减肥前和减肥后的体重是否存在显著的差异(图1)

图1

SPSS中的操作步骤:

①点击“分析”--“非参数检验”--“旧对话框”--“两个相关样本”(图2)

图2

②将减肥前体重和减肥后体重选入右侧的“检验对”框中(图3)

图3

③勾选下方的威尔科克森检验类型(图4)

图4

检验类型的四种方法:

威尔科克森:比较两个变量的秩的均值是否存在差异。

符号:通过分析两个相关样本的正负符号个数来分析是否存在差异。

麦克尼马尔:简阳两个相关的无序2分类变量。

边际齐性:检验两个相关的有序等级变量。

这里由于我们的体重变量为非正态连续变量,而符合检验的能效性显著较低,因此采用威尔科克森的秩和检验。

④结果分析

图5

由上表(图5)可以看出:原假设H0为两个相关样本不存在显著的差异,基于此假设的显著性水平为0,小于0.05,因此拒绝原假设H0,接受备选假设,即减肥前和减分后的体重存在显著的差异。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。