• 优质范文
  • 工作总结
  • 工作计划
  • 作文大全
  • 心得体会
  • 述职报告
  • 实习报告
  • 写作方案
  • 教案反思
  • 演讲稿
  • 发言稿
  • 读书笔记
  • 精美散文
  • 读观后感
  • 范文大全
  • 当前位置: 博通范文网 > 演讲稿 > 正文

    非参数检验(卡方检验),实验报告

    时间:2021-09-14 来源:博通范文网 本文已影响 博通范文网手机站

    评分

    大理大学 实验报告

    课程名称

    生物医学统计分析

    实验名称

    非参数检验( 卡方检验)

    专业班级

    实验日期

    实验地点

    2015—2016 学年度第

    2

    学期 一、

    实验目得 对分类资料进行卡方检验。

    二、实验环境

    1 、硬件配置:处理器:Intel(R) Core(TM) i5-4210U CPU 1、7GHz 1、7GHz 安装内存(RAM):4、00GB

    系统类型:64 位操作系统 2 、软件环境:IBM SPSS Statistics 19、0 软件

    三、实验内容 (包括本实验要完成得实验问题及需要得相关知识简单概述) (1)

    课本第六章得例 6、1-6、5 运行一遍,注意理解结果; (2)

    然后将实验指导书得例 1-4 运行一遍,注意理解结果。

    四、实验结果与分析

    (包括实验原理、数据得准备、运行过程分析、源程序(代码)、图形图象界面等) 例 例 6 、1 表 1 灭螨A A 与灭螨B B 杀灭大蜂螨效果得 交叉制表

    效果 合计 杀灭 未杀灭 组别 灭螨A 32 12 44 灭螨B 14 22 36 合计 46 34 80 分析: 表1就是灭螨A与灭螨B杀灭大蜂螨效果得样本分类得频数分析表,即交叉列联表。

    表 2 卡方检验

    X2 值 df 渐进 Sig、(双侧) 精确 Sig、(双侧) 精确 Sig、(单侧) Pearson 卡方 9、277a

    1 、002

    连续校正b

    7、944 1 、005

    似然比 9、419 1 、002

    Fisher 得精确检验

    、003 、002 有效案例中得 N 80

    a、0 单元格(、0%) 得期望计数少于 5。最小期望计数为 15、30。

    b、仅对 2x2 表计算

    分析: 表2就是卡方检验得结果。因为两组各自得结果互不影响,即相互独立。对于这种频数表格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。

    Pearson 卡方:皮尔逊卡方检验计算得卡方值(用于样本数n≥40且所有理论数E≥5);

    连续校正b : 连续性校正卡方值(df=1,只用于2*2列联表);

    似然比:对数似然比法计算得卡方值(类似皮尔逊卡方检验);

    Fisher 得精确检验:精确概率法计算得卡方值(用于理论数E<5)。

    不同得资料应选用不同得卡方计算方法。

    例6、1为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行得统计结果。

    X2 = 7、944, P(Sig)=0、005<0、01,表明灭螨剂A组得杀螨率极显著高于灭螨剂B组。

    例6 6 、2 2

    表 3

    治疗方法 * 治疗效果

    交叉制表 计数

    治疗效果 合计 1 2 3 治疗方法 1 19 16 5 40 2 16 12 8 36 3 15 13 7 35 合计 50 41 20 111 分析: 表3就是治疗方法* 治疗效果资料分析得列联表。

    表 4

    卡方检验

    X2 值 df 渐进 Sig、(双侧) Pearson 卡方 1、428a

    4 、839 似然比 1、484 4 、830 线性与线性组合 、514 1 、474 有效案例中得 N 111

    a、0 单元格(、0%) 得期望计数少于 5。最小期望计数为 6、31。

    分析: 表4就是卡方检验得结果。自由度df=4,表格下方得注解表明理论次数小于5得格子数为0,最小得理论次数为6、13。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)得检验结果,即X2 =1、428,P=0、839>0、05,差异不显著,可以认为不同得治疗方法与治疗效果无关,即三种治疗方法对治疗效果得影响差异不显著。

    例6 6 、3 3

    表 5

    灌溉方式 * 稻叶情况

    交叉制表 计数

    稻叶情况 合计 1 2 3 灌溉方式 1 146 7 7 160 2 183 9 13 205 3 152 14 16 182 合计 481 30 36 547 分析: 表5就是灌溉方式* 稻叶情况资料分析得列联表。

    表 6

    卡方检验

    X2 值 df 渐进 Sig、(双侧) Pearson 卡方 5、622a

    4 、229 似然比 5、535 4 、237 线性与线性组合 4、510 1 、034 有效案例中得 N 547

    a、0 单元格(、0%) 得期望计数少于 5。最小期望计数为 8、78。

    分析: 表6就是卡方检验得结果。自由度df=4,样本数n=547。表格下方得注解表明理论次数小于5得格子数为0,最小得理论次数为8、78。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)得检验结果,即X2 =5、622,P=0、229>0、05,差异不显著,即不同灌溉方式对稻叶情况得影响差异不显著。

    例 例 6 6 、4 4

    表 7

    场地 * 奶牛类型

    交叉制表 计数

    奶牛类型 合计 1 2 3 场地 1 15 24 12 51 2 4 2 7 13 3 20 13 11 44 合计 39 39 30 108 分析: 表5就是场地* 奶牛类型资料分析得列联表。

    表 8

    卡方检验

    X2 值 df 渐进 Sig、(双侧) 精确 Sig、(双侧) 精确 Sig、(单侧) 点概率 Pearson 卡方 9、199a

    4 、056 、056

    似然比 8、813 4 、066 、079

    Fisher 得精确检验 8、463

    、072

    线性与线性组合 、719b

    1 、397 、404 、217 、036 有效案例中得 N 108

    a、3 单元格(33、3%) 得期望计数少于 5。最小期望计数为 3、61。

    b、标准化统计量就是 -、848。

    分析: 表 8 就是卡方检验得结果。自由度 df=4,样本数 n=108。表格下方得注解表明理论次数小于 5 得格子数为 3,最小得理论次数为 3、61。需采用精确概率法计算,即用第三行(Fisher 得精确检验)得检验结果,即 X2 =8、463,P=0、072>0、05,差异不显著,即 3 种奶牛牛场不同类型奶牛得构成比对差异不显著。

    例 例 6 6 、5 5

    表 9

    LPA* FA 交叉制表

    FA 合计 1 2 LPA 1 17 0 17 2 4 7 11 合计 21 7 28 分析: 表9就是LPA* FA资料分析得列联表。

    表 10

    配对 卡方检验

    值 精确 Sig、(双侧) McNemar 检验

    、125a

    有效案例中得 N 28

    a、使用得二项式分布。

    分析: 表10就是LPA与FA两种检测方法得配对卡方检验。由于b+c<40,SPSS选用二项分布得直接计算概率法(相当于进行了精确校正),计算该配对资料得检验得精确双侧概率,并且不能给出卡方值。本例P=0、125>0、05,差异不显著,即LPA法与FA法对番鸭细小病毒抗原得检出率差异不显著。

    表 11

    对称度量

    值 渐进标准误差 a

    近似值 T b

    近似值 Sig、一致性度量 Kappa 、680 、140 3、798 、000 有效案例中得 N 28

    a、不假定零假设。

    b、使用渐进标准误差假定零假设。

    分析: 表11为LPA与FA两种检测结果得得一致性检验。Kappa值就是内部一致性系数,除数据P值判断一致性有无统计学意义外,根据经验,Kappa≥0、75,表明两者一致性较好0、7>Kappa≥0、4,表明一致性一般,Kappa<0、4,则表明一致性较差。

    本例Kappa值为0、680,P=0、000<0、01,拒绝无效假设,即认为两种检测方法结果存在一致性,Kappa值=0、680,0、7>Kappa≥0、4,表明一致性一般。

    例1 1

    表 12

    周 内日频数表

    观察数 期望数 残差 1 11 16、0 -5、0 2 19 16、0 3、0 3 17 16、0 1、0 4 15 16、0 -1、0 5 15 16、0 -1、0 6 16 16、0 、0 7 19 16、0 3、0 总数 112

    分析: 表12结果显示一周内各日死亡得理论数(Expected)为16、0,即一周内各日死亡均数;还算出实际死亡数与理论死亡数得差值(Residual)。

    表 13

    检验统计量

    周日 卡方 2、875a

    df 6

    渐近显著性 、824 a、0 个单元 (、0%) 具有小于 5 得期望频率。单元最小期望频率为 16、0。

    分析: Chi-Square过程,调用此过程可对样本数据得分布进行卡方检验。卡方检验适用于配合度检验,主要用于分析实际频数与某理论频数就是否相符。卡方值X2 =2、875,自由度数(df)=6,P=0、824>0、05,差异不显著,即可认为一周内各日得死亡危险性就是相同得。

    例2 2

    表 14

    二项式检验

    类别 N 观察比例 检验比例 精确显著性(双侧) 性别 组 1 0 12 、30 、50 、017 组 2 1 28 、70

    总数

    40 1、00

    分析: 调用Binomial过程可对样本资料进行二项分布分析。表14得二项分布检验表明,女婴12名,男婴28名,观察概率为0、70(即男婴占70%),检验概率为0、50,二项分布检验得结果就是双侧概率为0、017,可认为男女比例得差异有高度显著性,即与通常0、5得性比例相比,该地男婴比女婴明显为多。

    例3 3

    表 15

    两组工人得血铅值 及秩

    group N 秩均值 秩与 血铅值 1 10 5、95 59、50 2 7 13、36 93、50 总数 17

    分析: Independent Samples过程:调用此过程可对两个独立样本得均数、中位数、离散趋势、偏度等进行差异比较检验。有四种检验方法:Mann-Whitney U:主要用于判别两个独立样本所属得总体就是否有相同得分布;Kolmogorov-Smirnov Z:推测两个样本就是否来自具有相同分布得总体;Moses extreme reactions:检验两个独立样本之观察值得散布范围就是否有差异存在,以检验两个样本就是否来自具有同一分布得总体;Wald-Wolfowitz runs:考察两个独立样本就是否来自具有相同分布得总体。

    表 16

    检验统计量b b

    血铅值 Mann-Whitney U 4、500 Wilcoxon W 59、500 Z -2、980 渐近显著性(双侧) 、003 精确显著性[2*(单侧显著性)] 、001a

    a、没有对结进行修正。

    b、分组变量: group

    分析: 本例选Mann-Whitney U检验方法,表15结果表明,第1组得平均秩次(Mean Rank)为5、95,第2组得平均秩次为13、36,U = 4、5,W = 93、5,精确双侧概率P = 0、001,可认为铅作业组工人得血铅值高于非铅作业组。

    例4 4

    表 17

    group* effect 交叉制表 计数

    effect 合计 无效 有效 group 对照组 21 75 96 实验组 5 99 104 合计 26 174 200 分析: 表17就是group* effect资料分析得列联表。

    表 18 卡方检验

    X2 值 df 渐进 Sig、(双侧) 精确 Sig、(双侧) 精确 Sig、(单侧) Pearson 卡方 12、857a

    1 、000

    连续校正b

    11、392 1 、001

    似然比 13、588 1 、000

    Fisher 得精确检验

    、001 、000 有效案例中得 N 200

    a、0 单元格(、0%) 得期望计数少于 5。最小期望计数为 12、48。

    b、仅对 2x2 表计算

    分析: 表18卡方检验资料n=200>40 , 表格下方得注解表明理论次数小于5得格子数为0,最小得理论次数为12、48。,可取Pearson卡方值与似然比(Likelihood ratio)值 ,二者值分别为12、857与13、588,P<0、01,试验组与对照组得疗效差别有统计学意义,可认为异梨醇口服液降低颅内压得疗效优于氢氯噻嗪 + 地塞米松 。

    五、实验小结:

    (包括主要实验问题得最终结果描述、详细得收获体会,待解决得问题等) 在此次实验中,由于实验内容更贴近生活应用,因此比起上学期,我们更容易领悟该程序得表达,只就是在细节方面还就是很容易出错,甚至不容易拐过弯来。但经过此次实验,我们懂得要学着从复杂得程序中剥茧抽丝,把程序尽可能得简单化。

    在实验中应注意得点:

    1、因为两组各自得结果互不影响,即相互独立。对于这种频数表格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。

    2、Pearson 卡方:皮尔逊卡方检验计算得卡方值(用于样本数 n≥40 且所有理论数 E≥5);

    连续校正 b:连续性校正卡方值(df=1,只用于 2*2 列联表);

    似然比:对数似然比法计算得卡方值(类似皮尔逊卡方检验);

    Fisher 得精确检验:精确概率法计算得卡方值(用于理论数 E<5)。

    不同得资料应选用不同得卡方计算方法。

    3、有列联表用于描述分析得卡方检验,而其它用于非参数检验就是对拟合优度得检验。

    4、有计数用加权个数,就是具体数值,如例 3,则不用加权,因为两组数据长度不同,用独立 性检验,不知道总体分布情况,所有用非参数检验,要就是假设它为正态分布,也可以用 卡方检验。

    5、描述统计里得交叉表得行、列选择可以互换,互换只就是转置,不影响最后得结果。

    手写签名:

    语言有点啰嗦!

    卡方检验模型验证方法模型参数的验证方法主要使用卡方拟合度检验( Chi-square Goodne-of-fit Test )结合最大似然

    估计( Maximum Likelihood Estimation ),并且使用QQ图(Quantile-Quantile Plot)证明验证结果。 具体的说,就是先假定采集的样本数据符合某一分布,通过最大似然估计方法估计出该分布的参数,然后 代入并用卡方检验计算相对于该分布的偏差。实践中我们对于一组样本数据,计算所有常见分布的偏差值, 选取偏差最小的分布做为该样本的拟合结果。另外,从QQ图直观上看,该分布做为拟合结果描绘出的曲线

    必须近似为接近参考线的直线(见3.3),否则我们就将数据拆分为多个部分进行分段的拟合(如对终端请 求包大小的拟合)。

    1.1 卡方拟合度检验卡方检验是一种大样本假设检验法,用于检验随机事件中提出的样本数据是否符合某一给定分布。

    它需要较

    大量的样本数据及已知的待检验概率分布函数。

    1.1.1 卡方检验原理对于一个服从二项分布的随机变量Y服从Binomial( n, p) ,

    均值为,

    方差

    。 由中心极限定理,

    设服从

    符合标准正态分布N (0, 1),所以Binomial( n, p1 ),

    服从自由度为1的卡方分布 , , 。

    则有

    所以

    同理对于k个随机变

    量,均值分别为

    在数据拟合时,先对数据分组,每组数据的实际个数即为随机变量

    ,,则数据拟合即为判

    断是否符合分布,

    该卡方分布的自由度为k-1-nep(k为随机变量个数,nep为估计参数的个数)。

    1.1.2卡方检验步骤:假定样本服从某一给定分布。根据样本数据用最大似然法估计分布的密度函数参数。 设定置信度,对n个样本数据排序。

    把排序后的数据分成k组,确定每组的上下限,(上下限确定方法不同对验证能力有影响,

    为常数, 每组数据不少于5个),为了方便起见,本项目中采用平均划分分组间隔,即使

    对于所有的成立。

    计算每组数据实际个数,第i组实际个数为。

    计算每组数据期望个数,第i组期望个数为:连续:,其中F(x)为待验证的概率分布函数,离散:。 计算。 理论上说如果,则数据符合分布函数为F(x)的分布,

    其中,nep为估计的参数的个数。但是由于实际采集的数据并非完全地符合某一分布, 总存在一定的偏差,计算出的值并不满足这个条件, 最小的分布作为验证结果。 所以我们使用的拟合标准为采用卡方估计值

    模板相当好,简单修改一下就是自己的了,很方便!

    推荐访问:检验 参数 实验

    • 读/观后感
    • 精美散文
    • 读书笔记
    • 演讲
    • 反思
    • 方案
    • 心得体会