医学方法

概要t检验

概要t 检验

  • ##### 分析方法视频解读:

如果希望进行t 检验,通常可使用SPSSzero通用方法里面的t 检验功能进行,但如果只有汇总好的统计数据(包括平均值,标准差和样本量),此时可使用概要t 检验进行分析。

  • ###### 特别提示
  • 概要t 检验针对汇总数据(包括平均值,标准差和样本量)进行分析;
  • 概要t 检验细分为两种,分别是单样本t 检验和独立样本t 检验。
  • 单样本t 检验:一组数据与某数字的差异性;独立样本t 检验:两组数据的平均值差异性。

概要t 检验案例

  • #### 1、背景

收集某地区100名,20岁男子身高数据,平均身高为168cm,标准差为14cm。资料显示该地区10年前平均身高为165cm,分析当前身高是否明显比10年前更高?

本案例原假设是:168cm>165cm,只对比一个数字的差异性;此为单样本t 检验。

收集某A地区100名,20岁男子身高数据,平均身高为168cm,标准差为14cm。收集B地区200名,20岁男子身高数据,平均身高为170cm,标准差为13cm。分析A地区和B地区身高是否有明显差异?

本案例原假设是:168cm=170cm(差值对比为0),只对两组数据的均值差异;此为独立样本t 检验。

  • #### 2、理论

无论是单样本t 检验,还是独立样本t 检验,均是对比数据的差异性,区别在于单样本t 检验和一个已知数字进行对比;独立样本t 检验进行两组数据的均值差异对比。进行t 检验时,需要输入三项数据,分别是平均值,标准差和样本量。

除此之外,t 检验还需要知道以下三个术语,分别是差值对比、置信水平和假设检验。

  • 对比均值(差值对比):独立t

检验时,对比数字是指两组数据均值差,与某个数字进行对比,通常情况下是0(即两组数据平均值差值,与数字0进行对比PK)。

  • 置信水平:指在多大程度上对假设有把握,通常为95%,可选为99%和90%。
  • 假设检验:原假设是等于,小于,还是大于,通常情况下等于(即直接对比是否相等,即是否有差异)。

针对独立样本t 检验,从原理上,其需要先判断方差齐,方差齐和不齐时计算标准误的公式并不一样。此检验过程已经被SPSSzero进行自动判断,并且自动给出对应的计算结果。

从理论上看,t 检验更适用于小样本(样本量< 30),大样本时适用于z 检验。但当样本量加大时,T分布与正态分布基本没有区别,因此大样本时也直接使用t 检验即可。如果希望使用z 检验,请直接使用SPSSzero‘均值z 检验’方法即可。

  • #### 3、操作

本次涉及两个例子,分别操作如下:

上图显示收集数据与165cm进行对比,因此对比均值为165;默认置信水平为95%,即对此次分析结论有95%的把握;以及研究假设为均值168cm是否明显大于165cm,因而假设检验选择为大于。

上图显示两组身高进行对比,研究的是两组身高平均值相等(即差值与数字0进行对比),因此差值对比处输入数字0;【如果是研究A地区身高,明显低出B地区身高2cm,那么差值对比值则输入2】;默认置信水平为95%,即对此次分析结论有95%的把握;以及研究假设为均值168cm是否明显等于170cm,因而假设检验选择为等于。

  • #### 4、SPSSzero 输出结果

针对单样本t 检验,SPSSzero共输出两个表格,分别是区间估计和假设检验【置信区间仅列出区间估计意义较小,假设检验针对原假设进行验证】,分别如下:

单样本t 检验置信区间
样本量 平均值 标准差 标准误 95% CI(LL) 95% CI(UL)
100 168.000 14.000 1.400 165.222 170.778

本次收集样本为100个20岁男子身高,平均值为168cm,标准差为14cm,分析显示身高的95% CI为:165.222cm~170.778cm。即有95%的把握身高应该介于165.222cm到170.778cm之间。

单样本t 检验假设检验
样本量 平均值 检验均值 假设 t p
100 168.000 165.000 168.000>165.000 2.143 0.983

本次研究假设为100名20岁男子身高168cm,是否明显高于165cm,因此原假设为168cm>165cm,检验显示在0.05水平上接受原假设(t =2.143,p =0.983>0.05),即意味着当前168cm的身高明显比10年前165cm身高有明显的提升,这一说法无法被论证错误,即说明当前168cm身高明显比10年前165cm要高。

针对独立样本t 检验,SPSSzero共输出两个表格,分别是区间估计和假设检验【置信区间仅列出区间估计意义较小,假设检验针对原假设进行验证】,分别如下:

独立样本t 检验差值置信区间
第一组(n=100) 第二组(n=200) 均值差值 差值标准误 95% CI(LL) 95% CI(UL)
平均值 标准差 平均值 标准差
168.000 14.000 170.000 13.000 -2.000 1.634 -5.215 1.215

本次收集A地区和B地区20岁男子身高数据,A地区为168cm,B地区为170cm,A地区与B地区的身高差值为-2cm,而且差值95% CI为:-5.215cm~1.215cm。即有95%的把握两个地区身高差值,应该介于-5.215cm到1.215cm之间。

独立样本t 检验差值假设检验
均值差值 差值检验值 假设 t p 检验结论
-2.000 0.000 -2.000=0.000 -1.224 0.222 假设成立

本次研究假设为A地区168cm的男子身高,是否与B地区170cm男子身高,有没有明显的差异性。上表格显示,从数字上看,A地区身高会低于B地区身高2cm,检验2cm是否与数字0相等。检验显示在0.05水平上接受原假设(t =-1.224,p =0.222 >0.05),即意味着2cm的身高差值,与没有身高差异,二者之间无统计学意义;也即说明此2cm的身高差异并不明显,也即验证说明A地区和B地区男子身高并没有非常明显的差异性。

  • #### 5、文字分析
  • #### 6、剖析

涉及以下几个关键点,分别如下:

  • t 检验涉及以下三个术语,分别是差值对比、置信水平和假设检验。
  • 对比均值(差值对比):独立t

检验时,对比数字是指两组数据均值差,与某个数字进行对比,通常情况下是0(即两组数据平均值差值,与数字0进行对比PK)。

  • 置信水平:指在多大程度上对假设有把握,通常为95%,可选为99%和90%。
  • 假设检验:原假设是等于,小于,还是大于,通常情况下等于(即直接对比是否相等,即是否有差异)。
  • 针对独立样本t

检验,从原理上,其需要先判断方差齐,方差齐和不齐时计算标准误的公式并不一样。此检验过程已经被SPSSzero进行自动判断,并且自动给出对应的计算结果。

  • 从理论上看,t 检验更适用于小样本(样本量< 30),大样本时适用于z

检验。但当样本量加大时,T分布与正态分布基本没有区别,因此大样本时也直接使用t 检验即可。如果希望使用z 检验,请直接使用SPSSzero‘均值z 检验’方法即可。

  • 置信区间表格列出区间估计信息意义较小,通常情况下针对假设检验表格进行分析即可。

疑难解惑

  • ##### 常模数据分析?
  • 分析常模时,通常只会有汇总的平均值,标准差和样本量数据等。此时可手工输入对应的汇总值进行对比。当然如果样本量很大时,也可以使用概要Z检验进行分析。