实验设计和假设检验(精简)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
配对样本资料的 t 检验
配对样本 是指两个样本观察值由于存在某种联系而 有一一对应关系的情况。 配对t检验 是计量资料的差值样本均数与差值总体均 数0的比较
配对设计的目的
配对设计是研究者为了控制可能存在的主
要的非处理因素对观察指标带来的干扰而
采用的一种实验设计方法。
Байду номын сангаас
案例 某单位研究被霉菌污染的饲料 对大白鼠体重的增加有无影响 将N只大白鼠用随机分配于正常饲料组和 被霉菌污染的饲料组,饲食一个月后, 称量两组大白鼠的体重/体重增加值
配对设计的检验假设与统计量
若两种处理的效应无差别,差值d 的总体均数d应 该为0,故可将该检验理解为样本均数d与总体均
数d =0的比较
差值均数的大小及其抽样误差反应因素的效应
例 某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛 细支气管炎。用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量 如表6-1。试问用药前后IgG有无变化?
0.20 0.40 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 … 0.859 0.858 0.858 … 0.852
【案例4】
将16只Wistar雄性大鼠按完全随机设计等分为4组, 即适碘组(NI)、5倍碘组(5NI)、10倍碘组 (10NI)、50倍碘组(50NI),四组大白鼠均用 正常饲料喂养,但每组大鼠饮水中的碘含量不同, 3个月后测其血清甲状腺激素FT3水平(见表3-5)。 试比较四组FT3水平间有无差异。
么原因。
统计学中基本资料类型
计量资料:对每个观察单位用定量的方法测定 某项指标量的大小。其值是定量的。 计数资料:将观察单位的观察结果按某种属性 或类别分组,分别统计各组的观察单位数所得 的资料。其观察值是定性的。
统计学中三个基本的概念
参数:反映总体特征的统计指标。 统计量:反映样本特征的统计指标。
较四组FT3水平间有无差异。
【案例6】
2005年末,为评价消除碘缺乏病健康教育的效果 在某地甲、乙两所小学各随机抽取30名学生回答 消除碘缺乏病健康教育问卷,调查结果甲校学生 答题满分率为23.3%,乙校学生答题满分率为 50.0%。问甲、乙两所小学碘缺乏病健康教育答题 满分率是否有差别?
【案例7】
β-地中海贫血是一种可以产生严重贫血的常染色 体隐性遗传性疾病,其发病具有较明显的民族特征 和地域差异,某课题组对贵州省少数民族的患病 情况进行抽样调查,所获资料见表3-11,问贵州 省侗族、苗族、瑶族β-地中海贫血的携带者检出 率是否有差别?
假设检验在统计方法中的地位 指标描述
统计描述 图表描述 统计方法 参数估计 统计推断 假设检验
总体是否为同一总体。
t 检验——计量资料的分析方
法
英国统计学家W.S.Gosset (1908)导出了 样本均数的确切分布,即 t分布。
t分布的发现使小样本的统计推断成为可
能,因而它被认为是统计学发展史上的 里程碑之一。
以t分布为基础的检验称为t检验。
t 检验
一、一组样本资料的t检验
二、配对设计资料的t检验
血红蛋白含量,算得其均数为130.83g/L,标准
差为25.74g/L。问从事铅作业工人的血红蛋白是
否不同于正常成年男性平均值140g/L?
μ0 =140 (g/L)
已知总体
? =
μ
未知总体
n=36
建立假设 (在假设的前提下有规律可循)
无效假设(null hypothesis),记为H0
H0:=140,从事铅作业男性工人与正常男性的平均 血红蛋白含量相等;
按 =36-1=35查附表2 t界值表
附表2 t 界值表
自由度 单侧 双侧 1 2 3 4 5 6 7 8 9 10 11 … 21 22 23 … 35 0.25 0.50 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 … 0.686 0.686 0.685 … 0.682 0.20 0.40 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 … 0.859 0.858 0.858 … 0.852 0.10 0.20 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 … 1.323 1.321 1.319 … 1.306 0.05 0.10 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 … 1.721 1.717 1.714 … 1.690 概 率,P 0.025 0.01 0.05 0.02 12.706 31.821 4.303 6.965 3.182 4.541 2.776 3.747 2.571 3.365 2.447 2.365 2.306 2.262 2.228 2.201 … 2.080 2.074 2.069 … 2.030 3.143 2.998 2.896 2.821 2.764 2.718 … 2.518 2.508 2.500 … 2.438 0.005 0.01 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 … 2.831 2.819 2.807 … 2.724
当P≤ 时,拒绝H0,接受H1 ,有统计学意义
当P> 时,不拒绝H0 ,无统计学意义
本例P<0.05,按 =0.05的水准,拒绝H0,接受H1,差 别有统计学意义。认为该从事铅作业男性工人的Hb含 量低于正常男性的Hb含量。
假设检验的意义
得到关于总体的结论 本例假设检验的意义在于分辨未知总体和已知
附表2 t 界值表
自由度
-t
0
t
1 2 3 4 5 6 7 8 9 10 11 … 21 22 23 … 35
单侧 双侧
0.25 0.50 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 … 0.686 0.686 0.685 … 0.682
【案例5】
将16只Wistar雄性大鼠按体重相近分为4个区组,
每个区组的大鼠再随机分配到4个处理组,即适碘 组(NI)、5倍碘组(5NI)、10倍碘组(10NI)、
50倍碘组(50NI),大白鼠均用正常饲料喂养,
但每个处理组大鼠饮水中的碘含量不同,3个月后
测其血清甲状腺激素FT3水平(见表3-7)。试比
【案例2】
某市疾病控制中心检验科对某病20份病人尿样, 分别采用新修订的尿碘测定方法——过硫酸铵 消化尿样(新法)与原来的尿碘测定方法—— 氯酸消化尿样(原法),然后用砷铈催化分光 光度法测定含碘量,结果见表3-1。问两种尿 碘测定方法的结果是否有差别?
【案例3】
将Wistar雄性大鼠按完全随机设计分为两组,采用 灌胃的方法给予T-2毒素0.6、0.0μg/㎏,称其T-2毒 素组和对照组分别饲养,以观察每只大鼠在实验 第28天到90天之间所增加的体重(g),见表3-2。 问T-2毒素对大鼠体重的增加量是否有影响?
将大白鼠按同种系、同性别、同体重配 为n对,并将每对中的两只大白鼠用随机 的方法分配于正常饲料组和被霉菌污染 的饲料组,饲食一个月后,称量两组大 白鼠体重/体重增加值
配对设计的形式
自身配对
同一对象接受两种处理,如同一标本用两种方法进行 检验,同一患者接受两种处理方法;
异体配对
将条件相近的实验对象配对,并分别给予两种处理。
统计推断的过程
总体
样 本
样本统计量 例如:样本均 值、比例、方 差
假设检验的基本思想
“反证法”的思想
先根据研究目的建立假设,从H0假设出发,
先假设它是正确的,再分析样本提供的信息 是否与H0有较大矛盾,即是否支持H0,若样 本信息不支持H0,便拒绝之并接受H1,否则
不拒绝H0 。
例1
某医生测量了36名从事铅作业男性工人的
年男性平均值相等
H1 : ≠ 140 ,即从事铅作业的男性工人的血红蛋白与正常成
年男性平均值不等
α=0.05 (双侧)
按自由度ν=35,用绝对值查t界值表,t0.05/2, 35<2.138< t0.02/2,35 ,所以 0.02<P<0.05 ,按 α=0.05 水准,拒绝 H0 ,接受 H1 ,即可以 认为从事铅作业的男性工人的血红蛋白低于正常成年男性。
即概率不超过检验水准就是小概率。
选定检验方法计算检验统计量
(计算样本与总体的偏离)
统计量t表示,在标准误的尺度下,样本均数与 总体均数0的偏离。这种偏离称为标准t离差。
计算概率P(与统计量t值对应的概率)
在H0成立的前提下,获得现有这么大的标准t离差
以及更大离差的可能性。 P=P(|t|≥2.138) ?
-t
0
t
0.0025 0.001 0.005 0.002 127.321 318.309 14.089 22.327 7.453 10.215 5.598 7.173 4.773 5.893 4.317 4.029 3.833 3.690 3.581 3.497 … 3.135 3.119 3.104 … 2.996 5.208 4.785 4.501 4.297 4.144 4.025 … 3.527 3.505 3.485 … 3.340
⑴建立检验假设和确定检验水准
即用药前后患儿血清中免疫球蛋白IgG含量无变化 即用药前后患儿血清中免疫球蛋白IgG含量有变化
(双侧)
⑵计算统计量 代入公式得
⑶确定P值 推断结论
查t界值表 P< 0.001,按α=0.05水准,拒绝 ,接受 有统计意义
。可认为用药前后患儿血清中免疫球蛋白 IgG含量有变化,用药后患儿 血清中免疫球蛋白IgG含量升高。
实验设计 与假设检验
郭志伟 内蒙古地方病防治研究中心信息科 二0一二年七月
学 习 内 容
基础概念 七个案例 假设检验原理及步骤 运用 统计实践体会
现代统计学奠基人Ronald A . Fisher 1938年印度统计学大会:
做完实验后才找统计学家,就好像要
他做尸体解剖。他会说,这实验死于什
正态分布:频数分布以均数为中心,左右对称, 靠近均数处频数较多,离均数越远,频数越少,
形成中间多两侧逐渐减少的基本对称的分布。
【案例1】
为消除碘缺乏病,我国1997年起在全国范围 内开展了消除碘缺乏病健康教育,2005年末, 为评价其效果在某地一所小学随机抽取20名 学生回答消除碘缺乏病健康教育问卷,调查 结果学生平均得分为45.1(分),标准差为 7.9(分)。问该小学碘缺乏病健康教育效果 得分是否低于《全国碘缺乏病防治监测方案》 中规定的60.0分及格标准。
0.0005 0.001 636.619 31.599 12.924 8.610 6.869 5.959 5.408 5.041 4.781 4.587 4.437 … 3.819 3.792 3.768 … 3.591
结论(根据小概率原理作出推断)
在H0成立的前提下出现现有差别或更大差别的可能性 P(| t | ≥2.138)小于0.05,是小概率事件,即现有样本信 息不支持H0。 决策的标准为:
三、两组独立样本资料的t检验
两组独立样本资料的方差齐性
样本均数与总体均数的比较
目的:推断该样本是否来自某已知总体0 ;
即样本均数代表的总体均数与0是否相等。
总体均数0一般为理论值、标准值或经大量观察
所得并为人们接受的公认值、习惯值。
H0: =140,即从事铅作业的男性工人的血红蛋白与正常成
备择假设(alternative hypothesis),记为H1
H1:≠140,从事铅作业男性工人与正常男性的平均血 红蛋白含量不等。
确定检验水准 (确定最大允许误差)
设定检验水准的目的就是确定拒绝假设H0时的最
大允许误差。医学研究中一般取 =0.05 。
检验水准实际上确定了小概率事件的判断标准。