实验设计与样本含量的估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
2、调查研究设计
对特定群体进行调查被调查者的因素 是客观存在的,研究者只能被动的观察和 记录。
实验和调查虽然在设计上有所区别, 实际研究中常结合应用,某些现场可为实 验提供线索,而实验结果还需要通过调查 加以证实。
二、实验设计的目的:
• 控制和降低系统误差对实验结果的 影响,缩小实验随机误差以利于进行统 计推断,更确切地回答研究者事先提出 的假设。
2.两样本均数比较: 单侧 n1 = n2 = 2( (t2α + t2β )s/δ )2 双侧 n1 = n2 = 2( (tα + t2β )s/δ )2 3.配对(自身)均数比较: 单侧 n = ( (t2α + t2β )sd/δ )2 双侧 n = ( (tα + t2β )sd/δ )2
代入公式:
n1= n2 = 2( (tα + t2β )s/δ )2 = 2((1.96+1.282)2.5/1.2)2 = 91.2 ≈ 92
这样设计每组最少92只动物。
例 7、
用某药治疗矽肺病人后,尿矽的排出量平均 比治疗 前增加 1.5 mg/100ml ,其 标准差 为 2.5 mg/100ml,假定确实能使尿矽排出量增加,定 显著水平为α=0.05 ,β= 0.10,问需要观察多少 病人才能得出服药前后尿矽的排出量有差别的 结论?
4、盲法原则
实验设计时常把盲法也作为一条附 加原则,以更好地控制误差。 单盲:受试者不知道分组情况,有利 于研究者了解情况,但可能会产生由研 究带来的偏倚。
双盲:研究者和受试者均未知分组情 况和接受处理的具体内容,可以控制来 自研究者和受试者两方面主观上的干扰。
(2)、样本大小的估计方法
在假设性检验中,统计意义不显著的结 果,可能由二方面造成的: 一、可能二组间是没有差别的; 二、可能是二组间是有差别,但 样本太小,不能用统计方法 不详 来证明这种结果。
例3、 高血压的患病率为8%,研究者欲了解 某地高血压的患病率。并希望误差不超过2% ,问需要调查多少人? 分析:取α =0.05(双侧检验) uα = u0.05 = 1.96, δ = 0.02, P = 0.08 代入 n = ( uα /δ )2 P(1-P) = (1.96/0.02)20.08(1-0.08) = 706.8 ≈ 707 至少需要调查707人
三、实验设计的任务:
1、合理安排实验有所和实验对象
2、选择表达实验效应的指标 3、分析和考查实验效应
四、实验研究的误差
系统 误差
• 实验研究的误差
随机 误差
误差
• 1、随机误差(random error) • 2、系统误差 (systematic error) 又称为偏 倚(bias) • 包括选择偏倚、测量偏倚和混杂偏倚。
确定子样的大小,可分为下面二个 问题来解决:
(1) 二样本间个体数比例: 当1/n1+1/n2是固定数值时,只要 1/n1 = 1/n2时标准误是最小的。 例如: n1= n2 = 10时, 1/n1+1/n2 = 0.2 n1 =15, n2 = 5时, 1/n1+1/n2 = 0.2667 n1 =19, n2 = 1时, 1/n1+1/n2 = 1.0526
2、常用的实验设计方案
1、单因素: 设计方案是一个观察因素的不同强 度水平作用效应间差异的研究。 配对设计、完全随机设计、序贯设计。
2、多因素: 设计方案是指观察两个以上因素不同 强度水平下作用效应差异的研究。 交叉设计、(配伍组设计)、拉丁 方设计、析因设计、裂区设计、正交设 计. 此外还有三个变量及多个变量间关 联分析的研究设计,属多元分析。
例2 、 现欲用抽样调查了解某地小学生蛔虫感染率。 要求误差不超过3%,如取α =0.05,问需要调查 多少人? 分析:本例α =0.05,uα = u0.05 =1.96, δ =0.03, P = 0.5(当π ≈0.5时) 代入 n = ( uα /δ )2 P(1-P) = (1.96/0.03)2 0.5(1-0.05) = 1067.1 ≈ 1068 至少需要调查1068人
分析:
椐以往经验,近似条件下个别学校的检查 结果。儿童龋齿率为60% - 70%(应取接近
50%左右, 本例取60%), 规定允许误差为
3%, α=0.05,即总体率的95%可信区间不大
于p ± 3%, uα = u0.05 =1.96.
计算公式:n = (uα / δ)2 p(1-P) n = (1.96/ 3)2 0.6(1-0.6) = 1024(人) 至少需要调查1024人
例 5、
已知血吸虫病人血红蛋白平均含量 为9g/100ml, 标准差为2.5 g/100ml,现研究 呋喃丙胺治疗后能使血红蛋白量增加,规 定治疗前后血红蛋白量升高2 g以上者为有 效,升高1 g以下者为无效,求在显著水平 是0.05,设计成功率p=90%,问应治疗多 少人?
分析:
因为本例只计算有效,所以用单侧检验, δ= 2-1 = 1 g/100ml、S=2.5 g/100ml、 2α=0.10、2β= 0.20 ,查表t2α = 1.645 , t2β= 1.282 代入公式:n = ( (t2α + t2β)s/δ)2 =((1.645+1.282)2.5/1)2 = 53.5 故可认为需要治疗54人,即以56例进行 研究,如该药确实有效,则有 90% ( 1-β ) 的把握可得出有差别的结论。
选择指标的依据:
1、指标的选择必须与研究目的密切关联
2、选择定量指标比定性指标能提供更多 的信息 3、尽量选择客观性强、精确性好、特异 度、和灵敏高的指标作为分析指标。
六、实验设计的原则
实验误差的控制:
实验设计的主要作用是减少误差, 提高实验的精确度,使研究者能从实验结 果中获得无偏的处理统计量及实验误差的 估计值,从而进行正确地分析和比较。
2、随机化(randomization)原则: 随机化是实验研究中据设计要求,受 试对象的分组、施加于受试对象的处理 以及实验顺序等都必须满足概率意义上 的要求。贯彻随机分配原则是提高对比 组之间均衡可比的重要手段,是控制选 择性偏倚唯一有效的方法。也是资料分 析、统计推断的理论基础。
随机对照试验的设计模式
(2) 样本的个体数:
原则上是二样本间均数差别愈大,需要 的个体数愈少,均数差别愈小,需要个 体数愈多,另一方面综合估计标准差愈 小,则需要个体数愈少,标准差愈大, 需要个体数愈多,因而在确定样本量之 先,一定要知道标准差的约略值(二样 本均数的约略差别)。
正确估计观察例数的标准, 应该是保证 研究课题具有一定代表性与可靠性的 条件下所必须具有的最少例数,要符 合这一标准,必须具备以下条件:
研究的对象 (N) 不合格的 研究对象 合格的研究对象 拒绝加入试 验的合格对 象
自愿加入试验的 合 格 研究 对 象 (Ne) 随机分组
试验组
对照组
阴性结果
阳性结果
阴性结果
阳性结果
3、重复(replication)原则:
可靠的实验结果,应能在相同条件下 重现出来;可靠的实验结论也不能凭一次 实验或3~5 例结果获得,一定有足够量的 观察单位数。重复原则包含重现性和观察 单位数量两方面含义。所以也是一个样本 含量(sample size)大小问题。 足够的观察单位数是保证重现的基础, 而重复的同质可比条件等,也是保证实验 能够重现的重要条件。
例4、某单位拟用抽样调查了解该地区正常成 人白血胞数的平均水平。希望误差不超过100 个/mm3。据文献报导, 正常成人白血胞数的标 准差约为1000个/mm3。如取α =0.05,问需要调 查多少人? 分析:本例α =0.05,uα = u0.05 =1.96, S = 1000个/mm3,δ =100个/mm3 代入 n = ( uα s/δ )2 = (1.961000/100)2 = 384.2 ≈ 385 (人) 至少需要调查385人。
3. 第一类错误的概率,越小,需 要的例数越多,一般取=0.05,可根 据具体情况进行调整。 4.第二类错误的概率, 1- 又称统计 效能,1- 越大,需要的例数越多,一 般取1-=0.8 或0.9,否则易出现假阴性 结果。 5.明确单侧或双侧
二、 假设检验时的样本含量的估计:
1.样本均数与总体均数比较: 单侧 n = ( (t2α + t2β )s/δ )2 双侧 n = ( (tα + t2β )s/δ )2
1. 具有研究指标的总体均数、总体的 估计值——样本均数、标准差及样本 率,这些值来源于以往的实验,通过查 阅文献资料提供,或从研究者所作的预 备实验结果中获取。
2. 容许误差与检验的差值δ,其值 越小,所需样本量也越大。 δ 的选择有时需主观规定。例如 在药物筛选中,用药组和对照组(不 用药或用某种标准药)的差别可以主 观规定。因为小于规定效果,是不符 合试验目的的;所以在设计中,样本 的大小能证明这种规定效果,就满足 试验要求了。 = 1-2 或 = 1-2
õ Ç Ê °T
统计学方法运用前提
1. 看资料类型 2. 看分布特征
Frequency
80 70 60 50 40 30 20 10 0 35.75 36.25 36.75 37.25 37.75 38.25 36.00 36.50 37.00 37.50 38.00 Std. Dev = .38 Mean = 36.62 N = 203.00
实验设计与样本含量的估计
(1)实验研究设计
• 任何一项医学研究,在确定研究目 的之后,首要问题:考虑怎样安排试验 或者说需要一份良好的研究计划(称为研 究设计),它是使研究结果满足科学性的 重要保证。
数据采集
设 计
数据分析
报 告
一、研究设计类型:
• 1、实验研究设计 • 根据研究目的认为的对受试对象 (包括人或动物)设置干预措施, 控制非干预措施的影响,总结干扰 因素的效果。常用研究分为三类, 即动物实验、临床实验与社区干预 实验。
例 6、
药物试验用对动物体重增加来表达 效果。某药物与对照组经一段时间的使 用,差别是1.2mg,估计标准差是2.4 mg,求在显著水平是0.05,设计成功率 p=90%,求样本所需最低动物数。
分析:
本 例 双 侧 检 验 , δ =1.2 mg 、 S=2.4 mg , α =0.05 、 2β = 0.10 , 查 表 tα = 1.96 , t2β = 1.282
科研设计方法与抉择
在研究临床科研设计方案的时候,首先 要掌握设计的三大原则(或四大原则)。 • • • • 随机化原则 对照原则 重复原则 盲法原则
1、对照(control) 原则
空白对照、安慰剂对照、实验对照、标准 对照等。 设立对照组应满足均衡性要求,做到: 1、组间除干预措施外,其他影响结果的非 处理 因素等尽可能相同。 2、对所研究疾病的易感度及发病机会相等 3、检测和观察方法及诊断标准必须一致
五、实验研究的要素
一、处理因素
1、抓住主要的处理因素 2、找出非处理因素并加以控制
3、处理因素应标准化
二、受试对象
百度文库
1、动物实验对象
2、临床(现场)试验对象 受试对象的同质性 疾病诊断的标准 明确的纳入和排除标准 良好的依从性
三、实验效应
1、处理因素作用于受试对象的反应;
2、研究结果的最终体现; 3、实验研究的核心内容。 它将通过实验指标来表达,因此选择 评价效应的指标是关系研究成败的重要关 键。
分析:
本例单侧检验,δ=1.5mg、S=2.5 mg , α=0.05、 2β= 0.10 ,查表t2α = 1.645 , t2β= 1.282 n= ((t2α + t2β)s/δ)2 =((1.645+1.282)2.5/1.5)2 = 23.8 ≈ 24 这样设计的病人数最少为24人。
(3)、统计方法的正确应用
例如:两个随机样本均数的显著性检验
x1 x2 x1 x2 t 1 1 n S S n1 n2 2 2S t n 2 ( x1 x2 )
2 2
2S t ( x1 x2 ) n
2 2 2
例 1、
某区有103所小学,51200名学生,某防 治机构欲开展龋齿防治工作,拟定计划 和经费预算,需事先对儿童龋齿率有较 准确的估计,决定用单纯随机抽样方法 做抽样调查,求代表总体95% 的样本含 量并拟定防治药品计划。
2、调查研究设计
对特定群体进行调查被调查者的因素 是客观存在的,研究者只能被动的观察和 记录。
实验和调查虽然在设计上有所区别, 实际研究中常结合应用,某些现场可为实 验提供线索,而实验结果还需要通过调查 加以证实。
二、实验设计的目的:
• 控制和降低系统误差对实验结果的 影响,缩小实验随机误差以利于进行统 计推断,更确切地回答研究者事先提出 的假设。
2.两样本均数比较: 单侧 n1 = n2 = 2( (t2α + t2β )s/δ )2 双侧 n1 = n2 = 2( (tα + t2β )s/δ )2 3.配对(自身)均数比较: 单侧 n = ( (t2α + t2β )sd/δ )2 双侧 n = ( (tα + t2β )sd/δ )2
代入公式:
n1= n2 = 2( (tα + t2β )s/δ )2 = 2((1.96+1.282)2.5/1.2)2 = 91.2 ≈ 92
这样设计每组最少92只动物。
例 7、
用某药治疗矽肺病人后,尿矽的排出量平均 比治疗 前增加 1.5 mg/100ml ,其 标准差 为 2.5 mg/100ml,假定确实能使尿矽排出量增加,定 显著水平为α=0.05 ,β= 0.10,问需要观察多少 病人才能得出服药前后尿矽的排出量有差别的 结论?
4、盲法原则
实验设计时常把盲法也作为一条附 加原则,以更好地控制误差。 单盲:受试者不知道分组情况,有利 于研究者了解情况,但可能会产生由研 究带来的偏倚。
双盲:研究者和受试者均未知分组情 况和接受处理的具体内容,可以控制来 自研究者和受试者两方面主观上的干扰。
(2)、样本大小的估计方法
在假设性检验中,统计意义不显著的结 果,可能由二方面造成的: 一、可能二组间是没有差别的; 二、可能是二组间是有差别,但 样本太小,不能用统计方法 不详 来证明这种结果。
例3、 高血压的患病率为8%,研究者欲了解 某地高血压的患病率。并希望误差不超过2% ,问需要调查多少人? 分析:取α =0.05(双侧检验) uα = u0.05 = 1.96, δ = 0.02, P = 0.08 代入 n = ( uα /δ )2 P(1-P) = (1.96/0.02)20.08(1-0.08) = 706.8 ≈ 707 至少需要调查707人
三、实验设计的任务:
1、合理安排实验有所和实验对象
2、选择表达实验效应的指标 3、分析和考查实验效应
四、实验研究的误差
系统 误差
• 实验研究的误差
随机 误差
误差
• 1、随机误差(random error) • 2、系统误差 (systematic error) 又称为偏 倚(bias) • 包括选择偏倚、测量偏倚和混杂偏倚。
确定子样的大小,可分为下面二个 问题来解决:
(1) 二样本间个体数比例: 当1/n1+1/n2是固定数值时,只要 1/n1 = 1/n2时标准误是最小的。 例如: n1= n2 = 10时, 1/n1+1/n2 = 0.2 n1 =15, n2 = 5时, 1/n1+1/n2 = 0.2667 n1 =19, n2 = 1时, 1/n1+1/n2 = 1.0526
2、常用的实验设计方案
1、单因素: 设计方案是一个观察因素的不同强 度水平作用效应间差异的研究。 配对设计、完全随机设计、序贯设计。
2、多因素: 设计方案是指观察两个以上因素不同 强度水平下作用效应差异的研究。 交叉设计、(配伍组设计)、拉丁 方设计、析因设计、裂区设计、正交设 计. 此外还有三个变量及多个变量间关 联分析的研究设计,属多元分析。
例2 、 现欲用抽样调查了解某地小学生蛔虫感染率。 要求误差不超过3%,如取α =0.05,问需要调查 多少人? 分析:本例α =0.05,uα = u0.05 =1.96, δ =0.03, P = 0.5(当π ≈0.5时) 代入 n = ( uα /δ )2 P(1-P) = (1.96/0.03)2 0.5(1-0.05) = 1067.1 ≈ 1068 至少需要调查1068人
分析:
椐以往经验,近似条件下个别学校的检查 结果。儿童龋齿率为60% - 70%(应取接近
50%左右, 本例取60%), 规定允许误差为
3%, α=0.05,即总体率的95%可信区间不大
于p ± 3%, uα = u0.05 =1.96.
计算公式:n = (uα / δ)2 p(1-P) n = (1.96/ 3)2 0.6(1-0.6) = 1024(人) 至少需要调查1024人
例 5、
已知血吸虫病人血红蛋白平均含量 为9g/100ml, 标准差为2.5 g/100ml,现研究 呋喃丙胺治疗后能使血红蛋白量增加,规 定治疗前后血红蛋白量升高2 g以上者为有 效,升高1 g以下者为无效,求在显著水平 是0.05,设计成功率p=90%,问应治疗多 少人?
分析:
因为本例只计算有效,所以用单侧检验, δ= 2-1 = 1 g/100ml、S=2.5 g/100ml、 2α=0.10、2β= 0.20 ,查表t2α = 1.645 , t2β= 1.282 代入公式:n = ( (t2α + t2β)s/δ)2 =((1.645+1.282)2.5/1)2 = 53.5 故可认为需要治疗54人,即以56例进行 研究,如该药确实有效,则有 90% ( 1-β ) 的把握可得出有差别的结论。
选择指标的依据:
1、指标的选择必须与研究目的密切关联
2、选择定量指标比定性指标能提供更多 的信息 3、尽量选择客观性强、精确性好、特异 度、和灵敏高的指标作为分析指标。
六、实验设计的原则
实验误差的控制:
实验设计的主要作用是减少误差, 提高实验的精确度,使研究者能从实验结 果中获得无偏的处理统计量及实验误差的 估计值,从而进行正确地分析和比较。
2、随机化(randomization)原则: 随机化是实验研究中据设计要求,受 试对象的分组、施加于受试对象的处理 以及实验顺序等都必须满足概率意义上 的要求。贯彻随机分配原则是提高对比 组之间均衡可比的重要手段,是控制选 择性偏倚唯一有效的方法。也是资料分 析、统计推断的理论基础。
随机对照试验的设计模式
(2) 样本的个体数:
原则上是二样本间均数差别愈大,需要 的个体数愈少,均数差别愈小,需要个 体数愈多,另一方面综合估计标准差愈 小,则需要个体数愈少,标准差愈大, 需要个体数愈多,因而在确定样本量之 先,一定要知道标准差的约略值(二样 本均数的约略差别)。
正确估计观察例数的标准, 应该是保证 研究课题具有一定代表性与可靠性的 条件下所必须具有的最少例数,要符 合这一标准,必须具备以下条件:
研究的对象 (N) 不合格的 研究对象 合格的研究对象 拒绝加入试 验的合格对 象
自愿加入试验的 合 格 研究 对 象 (Ne) 随机分组
试验组
对照组
阴性结果
阳性结果
阴性结果
阳性结果
3、重复(replication)原则:
可靠的实验结果,应能在相同条件下 重现出来;可靠的实验结论也不能凭一次 实验或3~5 例结果获得,一定有足够量的 观察单位数。重复原则包含重现性和观察 单位数量两方面含义。所以也是一个样本 含量(sample size)大小问题。 足够的观察单位数是保证重现的基础, 而重复的同质可比条件等,也是保证实验 能够重现的重要条件。
例4、某单位拟用抽样调查了解该地区正常成 人白血胞数的平均水平。希望误差不超过100 个/mm3。据文献报导, 正常成人白血胞数的标 准差约为1000个/mm3。如取α =0.05,问需要调 查多少人? 分析:本例α =0.05,uα = u0.05 =1.96, S = 1000个/mm3,δ =100个/mm3 代入 n = ( uα s/δ )2 = (1.961000/100)2 = 384.2 ≈ 385 (人) 至少需要调查385人。
3. 第一类错误的概率,越小,需 要的例数越多,一般取=0.05,可根 据具体情况进行调整。 4.第二类错误的概率, 1- 又称统计 效能,1- 越大,需要的例数越多,一 般取1-=0.8 或0.9,否则易出现假阴性 结果。 5.明确单侧或双侧
二、 假设检验时的样本含量的估计:
1.样本均数与总体均数比较: 单侧 n = ( (t2α + t2β )s/δ )2 双侧 n = ( (tα + t2β )s/δ )2
1. 具有研究指标的总体均数、总体的 估计值——样本均数、标准差及样本 率,这些值来源于以往的实验,通过查 阅文献资料提供,或从研究者所作的预 备实验结果中获取。
2. 容许误差与检验的差值δ,其值 越小,所需样本量也越大。 δ 的选择有时需主观规定。例如 在药物筛选中,用药组和对照组(不 用药或用某种标准药)的差别可以主 观规定。因为小于规定效果,是不符 合试验目的的;所以在设计中,样本 的大小能证明这种规定效果,就满足 试验要求了。 = 1-2 或 = 1-2
õ Ç Ê °T
统计学方法运用前提
1. 看资料类型 2. 看分布特征
Frequency
80 70 60 50 40 30 20 10 0 35.75 36.25 36.75 37.25 37.75 38.25 36.00 36.50 37.00 37.50 38.00 Std. Dev = .38 Mean = 36.62 N = 203.00
实验设计与样本含量的估计
(1)实验研究设计
• 任何一项医学研究,在确定研究目 的之后,首要问题:考虑怎样安排试验 或者说需要一份良好的研究计划(称为研 究设计),它是使研究结果满足科学性的 重要保证。
数据采集
设 计
数据分析
报 告
一、研究设计类型:
• 1、实验研究设计 • 根据研究目的认为的对受试对象 (包括人或动物)设置干预措施, 控制非干预措施的影响,总结干扰 因素的效果。常用研究分为三类, 即动物实验、临床实验与社区干预 实验。
例 6、
药物试验用对动物体重增加来表达 效果。某药物与对照组经一段时间的使 用,差别是1.2mg,估计标准差是2.4 mg,求在显著水平是0.05,设计成功率 p=90%,求样本所需最低动物数。
分析:
本 例 双 侧 检 验 , δ =1.2 mg 、 S=2.4 mg , α =0.05 、 2β = 0.10 , 查 表 tα = 1.96 , t2β = 1.282
科研设计方法与抉择
在研究临床科研设计方案的时候,首先 要掌握设计的三大原则(或四大原则)。 • • • • 随机化原则 对照原则 重复原则 盲法原则
1、对照(control) 原则
空白对照、安慰剂对照、实验对照、标准 对照等。 设立对照组应满足均衡性要求,做到: 1、组间除干预措施外,其他影响结果的非 处理 因素等尽可能相同。 2、对所研究疾病的易感度及发病机会相等 3、检测和观察方法及诊断标准必须一致
五、实验研究的要素
一、处理因素
1、抓住主要的处理因素 2、找出非处理因素并加以控制
3、处理因素应标准化
二、受试对象
百度文库
1、动物实验对象
2、临床(现场)试验对象 受试对象的同质性 疾病诊断的标准 明确的纳入和排除标准 良好的依从性
三、实验效应
1、处理因素作用于受试对象的反应;
2、研究结果的最终体现; 3、实验研究的核心内容。 它将通过实验指标来表达,因此选择 评价效应的指标是关系研究成败的重要关 键。
分析:
本例单侧检验,δ=1.5mg、S=2.5 mg , α=0.05、 2β= 0.10 ,查表t2α = 1.645 , t2β= 1.282 n= ((t2α + t2β)s/δ)2 =((1.645+1.282)2.5/1.5)2 = 23.8 ≈ 24 这样设计的病人数最少为24人。
(3)、统计方法的正确应用
例如:两个随机样本均数的显著性检验
x1 x2 x1 x2 t 1 1 n S S n1 n2 2 2S t n 2 ( x1 x2 )
2 2
2S t ( x1 x2 ) n
2 2 2
例 1、
某区有103所小学,51200名学生,某防 治机构欲开展龋齿防治工作,拟定计划 和经费预算,需事先对儿童龋齿率有较 准确的估计,决定用单纯随机抽样方法 做抽样调查,求代表总体95% 的样本含 量并拟定防治药品计划。