医学方法

概要t检验

概要t 检验

##### 分析方法视频解读：

如果希望进行t 检验，通常可使用SPSSzero通用方法里面的t 检验功能进行，但如果只有汇总好的统计数据（包括平均值，标准差和样本量），此时可使用概要t 检验进行分析。

###### 特别提示
概要t 检验针对汇总数据（包括平均值，标准差和样本量）进行分析；
概要t 检验细分为两种，分别是单样本t 检验和独立样本t 检验。
单样本t 检验：一组数据与某数字的差异性；独立样本t 检验：两组数据的平均值差异性。

概要t 检验案例

#### 1、背景

收集某地区100名，20岁男子身高数据，平均身高为168cm，标准差为14cm。资料显示该地区10年前平均身高为165cm，分析当前身高是否明显比10年前更高？

本案例原假设是：168cm>165cm，只对比一个数字的差异性；此为单样本t 检验。

收集某A地区100名，20岁男子身高数据，平均身高为168cm，标准差为14cm。收集B地区200名，20岁男子身高数据，平均身高为170cm，标准差为13cm。分析A地区和B地区身高是否有明显差异？

本案例原假设是：168cm=170cm（差值对比为0），只对两组数据的均值差异；此为独立样本t 检验。

#### 2、理论

无论是单样本t 检验，还是独立样本t 检验，均是对比数据的差异性，区别在于单样本t 检验和一个已知数字进行对比；独立样本t 检验进行两组数据的均值差异对比。进行t 检验时，需要输入三项数据，分别是平均值，标准差和样本量。

除此之外，t 检验还需要知道以下三个术语，分别是差值对比、置信水平和假设检验。

对比均值(差值对比)：独立t

检验时，对比数字是指两组数据均值差，与某个数字进行对比，通常情况下是0（即两组数据平均值差值，与数字0进行对比PK）。

置信水平：指在多大程度上对假设有把握，通常为95%，可选为99%和90%。
假设检验：原假设是等于，小于，还是大于，通常情况下等于（即直接对比是否相等，即是否有差异）。

针对独立样本t 检验，从原理上，其需要先判断方差齐，方差齐和不齐时计算标准误的公式并不一样。此检验过程已经被SPSSzero进行自动判断，并且自动给出对应的计算结果。

从理论上看，t 检验更适用于小样本（样本量< 30），大样本时适用于z 检验。但当样本量加大时，T分布与正态分布基本没有区别，因此大样本时也直接使用t 检验即可。如果希望使用z 检验，请直接使用SPSSzero‘均值z 检验’方法即可。

#### 3、操作

本次涉及两个例子，分别操作如下：

上图显示收集数据与165cm进行对比，因此对比均值为165；默认置信水平为95%，即对此次分析结论有95%的把握；以及研究假设为均值168cm是否明显大于165cm，因而假设检验选择为大于。

上图显示两组身高进行对比，研究的是两组身高平均值相等（即差值与数字0进行对比），因此差值对比处输入数字0；【如果是研究A地区身高，明显低出B地区身高2cm，那么差值对比值则输入2】；默认置信水平为95%，即对此次分析结论有95%的把握；以及研究假设为均值168cm是否明显等于170cm，因而假设检验选择为等于。

#### 4、SPSSzero 输出结果

针对单样本t 检验，SPSSzero共输出两个表格，分别是区间估计和假设检验【置信区间仅列出区间估计意义较小，假设检验针对原假设进行验证】，分别如下：

单样本t 检验置信区间
项	样本量	平均值	标准差	标准误	95% CI(LL)	95% CI(UL)
值	100	168.000	14.000	1.400	165.222	170.778

本次收集样本为100个20岁男子身高，平均值为168cm，标准差为14cm，分析显示身高的95% CI为：165.222cm~170.778cm。即有95%的把握身高应该介于165.222cm到170.778cm之间。

单样本t 检验假设检验
项	样本量	平均值	检验均值	假设	t	p
值	100	168.000	165.000	168.000>165.000	2.143	0.983

本次研究假设为100名20岁男子身高168cm，是否明显高于165cm，因此原假设为168cm>165cm，检验显示在0.05水平上接受原假设（t =2.143，p =0.983>0.05），即意味着当前168cm的身高明显比10年前165cm身高有明显的提升，这一说法无法被论证错误，即说明当前168cm身高明显比10年前165cm要高。

针对独立样本t 检验，SPSSzero共输出两个表格，分别是区间估计和假设检验【置信区间仅列出区间估计意义较小，假设检验针对原假设进行验证】，分别如下：

独立样本t 检验差值置信区间
项	第一组(n=100)		第二组(n=200)		均值差值	差值标准误	95% CI(LL)	95% CI(UL)
平均值	标准差	平均值	标准差
值	168.000	14.000	170.000	13.000	-2.000	1.634	-5.215	1.215

本次收集A地区和B地区20岁男子身高数据，A地区为168cm，B地区为170cm，A地区与B地区的身高差值为-2cm，而且差值95% CI为：-5.215cm~1.215cm。即有95%的把握两个地区身高差值，应该介于-5.215cm到1.215cm之间。

独立样本t 检验差值假设检验
项	均值差值	差值检验值	假设	t	p	检验结论
值	-2.000	0.000	-2.000=0.000	-1.224	0.222	假设成立

本次研究假设为A地区168cm的男子身高，是否与B地区170cm男子身高，有没有明显的差异性。上表格显示，从数字上看，A地区身高会低于B地区身高2cm，检验2cm是否与数字0相等。检验显示在0.05水平上接受原假设（t =-1.224，p =0.222 >0.05），即意味着2cm的身高差值，与没有身高差异，二者之间无统计学意义；也即说明此2cm的身高差异并不明显，也即验证说明A地区和B地区男子身高并没有非常明显的差异性。

#### 5、文字分析
#### 6、剖析

涉及以下几个关键点，分别如下：

t 检验涉及以下三个术语，分别是差值对比、置信水平和假设检验。
对比均值(差值对比)：独立t

检验时，对比数字是指两组数据均值差，与某个数字进行对比，通常情况下是0（即两组数据平均值差值，与数字0进行对比PK）。

置信水平：指在多大程度上对假设有把握，通常为95%，可选为99%和90%。
假设检验：原假设是等于，小于，还是大于，通常情况下等于（即直接对比是否相等，即是否有差异）。
针对独立样本t

检验，从原理上，其需要先判断方差齐，方差齐和不齐时计算标准误的公式并不一样。此检验过程已经被SPSSzero进行自动判断，并且自动给出对应的计算结果。

从理论上看，t 检验更适用于小样本（样本量< 30），大样本时适用于z

检验。但当样本量加大时，T分布与正态分布基本没有区别，因此大样本时也直接使用t 检验即可。如果希望使用z 检验，请直接使用SPSSzero‘均值z 检验’方法即可。

置信区间表格列出区间估计信息意义较小，通常情况下针对假设检验表格进行分析即可。

疑难解惑

##### 常模数据分析？
分析常模时，通常只会有汇总的平均值，标准差和样本量数据等。此时可手工输入对应的汇总值进行对比。当然如果样本量很大时，也可以使用概要Z检验进行分析。