2.分类数据:卡方检验用于处理分类数据(名义数据或序列数据)。
3.样本容量:每个单元格的期望频数应足够大。
卡方检验类型
1.四格表资料的卡方检验用于进行两个率或两个构成比的比较
应用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率
2.行×列表资料的卡方检验用于多个率或多个构成比的比较
应用条件:要求每个格子中的理论频数T均大于5或1 3、列联表资料的卡方检验 同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。 应用条件:列联表卡方检验应用中的注意事项同R×C表的卡方检验相同 (1)2×2列联表的卡方检验:2×2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=( | b − c | − 1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。 (2)R×C 列联表的卡方检验:R×C 列联表的卡方检验用于R×C列联表的相关分析,卡方值的计算和检验过程与行×列表资料的卡方检验相同。 各类型的卡方检验方法原理 核心思想:假设两处理因素率相等,算出理论频数,与实际频数比较,看偏离程度大小。 卡方可以理解为相互独立的多个正态离差平方和,卡方值的分布范围为0~正无穷,卡方检验的应用对象是类型资料,计数资料以及属性资料。 其核心思想是:实际观测值与期望值(理论值)之间偏离程度,实际观测值与期望值之间的偏离程度就决定卡方值的大小,卡方值越小,偏差就越小,实际值越趋于符合期望值。 其理论基础是:在一定自由度大小下,卡方值X²与概率P成反比,即X²越小,P越大,X²越大,P越小。因此,我们可用卡方分布对计数资料或属性资料进行假设检验。 假设检验: H0:两者之间无明显关系/相互独立 H1:两者之间显著相关/有依赖关系 当X²>临界值时,拒绝H0,接受H1。即两者显著相关/有依赖关系。反之,当X²≤临界值时,接受H0,拒绝H1。两者无明显关系/相互独立。 卡方的计算X²=(观测值-期望值)2/期望值 (其中,期望值Expected=行合计*列合计除以总计) 卡方的自由度Df=(a-1)*(b-1) a和b分别为检验条件的分类数。 1.四格表(2x2)卡方检验: 一般四格表/检验可以检验两个样本的总体分布是否相同,或者两个样本是否来自同一总体。连续校正卡方只在四格表中才计算。 如何选择统计结果,教科书给出了如下判断标准: (1)当n≥40且所有T≥5时(T代表每个样本的理论频数),用Pearson卡方,若所得P=0. 05时,用Fisher精确检验。 (2)当n≥40但有1≤T≤5时,用连续校正卡方。 (3)当n<40或T<1时,用Fisher精确检验。 研究表明,在Pearson卡方、似然比卡方和Fisher的精确检验三种方法中,似然比卡方最为准确,即使在小样本中也是如此。而Fisher的确切概率法的分布假设在很多时候并不成立,因此建议大家多参考似然比卡方的结果。 对于Fisher 确切概率法有关说法:(1)凡是四格表资料均可采用 Fisher 确切概率法进行假设检验。(2)Fisher 确切概率法基于超几何分布,计算的基本步骤是在四格表的周边合计不变的条件下,计算表内四个基本数据的各种组合之概率,再计算满足一定条件的各四格表累计概率;若行双侧检验,则计算满足等于及大于样本|p1-p2|条件的所有格子的累计概率;若进行单侧检验,只计算等于及大于样本(p1-P2)的累计概率。(3)依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1 个四格表) 2.配对四格表卡方检验: 又称为McNemar检验,将行变量与纵变量不一致的总例数(b+c)视为固定值,在此条件下来进行推断无需考虑两变量一致的总例数a和d的大小,这类方法在统计学上称为条件推断方法。常用于配对设计的计数资料,即比较两种检验方法、培养方法或诊断方法,其资料特点为对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的计数结果。 Kappa( K)检验:又称一致性检验,研究两种方法检验的一致性,希望所有的频数都出现在主对角线上,这样一致性最好。一般认为Kappa>0.75时表示两者一致性较好,0.4 McNemar(M)检验:配对卡方检验,研究两者在哪些地方不一致,即两者的诊断结果有怎样的偏向,计算时只利用不在主对角线的数据。若比较两种因素间有无差别,应采用配对卡方检验。 有时可能出现Kappa值与McNemar检验结果相矛盾的情况,如Kappa≥0. 75 ,说明两者一致性较好,但是McNemar检验P <0. 05 ,说明两者的检验结果有差别。出现这样矛盾的结果是由于两者对于信息的利用不一致造成的,Kappa检验会利用列联表示的所用信息,而 McNemar检验只会利用非对角线单元格上的信息,即它只关心两者不一致的评价信息,因此当两者出现矛盾时,主要参考Kappa值。 甲乙两种方法的配对检验中,若其中甲法为金标准(Golden Standard),研究乙法与甲法的一致性情况,并研究是否可以用乙法替代甲法。这里就会岀现假阳性和假阴性的概念。 SPSS卡方分析模块 1.拟合优度检验在分析下拉菜单中非参数检验中的单样本非参数检验中实现。 2.关联性分析和四格表卡方检验均在分析下拉菜单中描述统计中的交叉表中实现。 交叉表(cross table):是多个频数表的重组,表格中每个格子为列表变量特定值的组合。 交叉列表可以检验属于多个变量的观察对象的频数。通过观察频数,我们可以辨别交叉列表 中变量间的关系。2 x2表(四格表)是最为简单的交叉列表,只有两个变量,每个变量只有两 个特定值。 总结 其实不管是以哪个为行,那个为列,得到的卡方检验的χ2和P值都是一样的(已实战过),而那个百分比选择哪个,就看你选择想说明什么问题,就选择相应的百分比合并成刚好是100%的那个,而不管是以哪个为行,那个为列,百分比结果都在那,只是行对列的百分比或者列对行的百分比先后的问题罢了。 参考:《临床医学研究中的统计分析和图形表达实例详解》 欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购: 1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。 2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。 3.购买视频课程赠送课程相关主题内容1对1答疑1年。返回搜狐,查看更多