实验设计与样本含量的估计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例6、
药物试验用对动物体重增加来表达 效果&某药物与对照组经一段时间的使 用;差别是1.2mg;估计标准差是2.4 mg;求 在显著水平是0.05;设计成功率p=90%; 求样本所需最低动物数&
分析:
本 例 双 侧 检 验 ;δ=1.2 mg 、 S=2.4 mg ;α=0.05 、 2β= 0.10; 查 表 tα = 1.96 ; t2β= 1.282
例如:两个随机样本均数的显著性检验
t x1 x2 x1 x2
S 11 S n
n1 n2
2
n 2S2t2 (x1 x2)2
2S2t2 (x1 x2)2n
例1、
某区有103所小学;51200名学生;某防 治机构欲开展龋齿防治工作;拟定计划 和经费预算;需事先对儿童龋齿率有较 准确的估计;决定用单纯随机抽样方法 做抽样调查;求代表总体95% 的样本含 量并拟定防治药品计划&
研究的对象(N)
合格的研究对象
自愿加入试验的 合格研究对象 (Ne)
随机分组
不合格的 研究对象
拒绝加入试 验的合格对 象
试验组
对照组
阴性结果
阳性结果
阴性结果
阳性结果
3、重复replication原则:
可靠的实验结果;应能在相同条件下 重现出来;可靠的实验结论也不能凭一次 实验或3~5 例结果获得;一定有足够量的 观察单位数&重复原则包含重现性和观察 单位数量两方面含义&所以也是一个样本 含量sample size大小问题&
分析: 椐以往经验;近似条件下个别学校的检查
结果&儿童龋齿率为60% - 70%应取接近 50%左右; 本例取60%; 规定允许误差为 3%; α=0.05;即总体率的95%可信区间不大 于p ± 3%; uα = u0.05 =1.96.
计算公式:n = uα / δ2 p1-P n = 1.96/ 32 0.61-0.6 = 1024人
五、实验研究的要素
一、处理因素
1、抓住主要的处理因素 2、找出非处理因素并加以控制 3、处理因素应标准化
二、受试对象
1、动物实验对象 2、临床现场试验对象
受试对象的同质性 疾病诊断的标准 明确的纳入和排除标准 良好的依从性
三、实验效应
1、处理因素作用于受试对象的反应;
2、研究结果的最终体现;
3、实验研究的核心内容&
1.样本均数与总体均数比较:
单侧 双侧
n = t2α + t2βs/δ2 n = tα + t2βs/δ2
2.两样本均数比较:
单侧 双侧
n1 = n2 = 2 t2α + t2βs/δ2 n1 = n2 = 2 tα + t2βs/δ2
3.配对自身均数比较:
单侧 双侧
n = t2α + t2βsd/δ2 n = tα + t2βsd/δ2
= 1-2 或 = 1-2
3. 第一类错误的概率;越小;需要 的例数越多;一般取=0.05;可根据具 体情况进行调整&
4.第二类错误的概率; 1- 又称统计效 能;1- 越大;需要的例数越多;一般取1=0.8 或0.9;否则易出现假阴性结果&
5.明确单侧或双侧
二、 假设检验时的样本含量的估计:
2、随机化randomization原则:
随机化是实验研究中据设计要求;受 试对象的分组、施加于受试对象的处理 以及实验顺序等都必须满足概率意义上 的要求&贯彻随机分配原则是提高对比组 之间均衡可比的重要手段;是控制选择性 偏倚唯一有效的方法&也是资料分析、统 计推断的理论基础&
随机对照试验的设计模式
至少需要调查1024人
例2、
现欲用抽样调查了解某地小学生蛔虫感染率 &要求误差不超过3%;如取α=0.05;问需要调查多 少人?
分析:本例α=0.05;uα = u0.05 =1.96; δ=0.03; P = 0.5当π≈0.5时
代入 n = uα /δ2 P1-P = 1.96/0.032 0.51-0.05 = 1067.1 ≈ 1068
分析:
本 例 单 侧 检 验 ;δ=1.5mg 、 S=2.5 mg ;α=0.05、 2β= 0.10 ;查表t2α = 1.645 ; t2β= 1.282
n= t2α + t2βs/δ2 =1.645+1.2822.5/1.52 = 23.8 ≈ 24 这样设计的病人数最少为24人&
3、统计方法的正确应用
三、实验设计的任务:
1、合理安排实验有所和实验对象 2、选择表达实验效应的指标 3、分析和考查实验效应
四、实验研究的误差
• 实验研究的误差
随机 误差
系统 误差
误差
• 1、随机误差random error
• 2、系统误差 systematic error 又称为偏 倚bias
• 包括选择偏倚、测量偏倚和混杂偏倚 &
代入 n = uα s/δ2 = 1.961000/1002 = 384.2
≈ 385 人 至少需要调查385人&
例5、
已知血吸虫病人血红蛋白平均含量 为9g/100ml; 标准差为2.5 g/100ml;现研究 呋喃丙胺治疗后能使血红蛋白量增加;规 定治疗前后血红蛋白量升高2 g以上者为有 效;升高1 g以下者为无效;求在显著水平 是0.05;设计成功率p=90%;问应治疗多 少人?
实验设计与样本含量的估计
1实验研究设计
• 任何一项医学研究;在确定研究目的 之后;首要问题:考虑怎样安排试验或者 说需要一份良好的研究计划称为研究设 计;它是使研究结果满足科学性的重要保 证&
设
数据采集
数据分析
报 告
计
一、研究设计类型:
• 1、实验研究设计 • 根据研究目的认为的对受试对象
包括人或动物设置干预措施;控制非 干预措施的影响;总结干扰因素的效 果&常用研究分为三类;即动物实验、 临床实验与社区干预实验&
科研设计方法与抉择
在研究临床科研设计方案的时候;首先要 掌握设计的三大原则或四大原则&
• 随机化原则 • 对照原则 • 重复原则 • 盲法原则
1、对照control 原则
空白对照、安慰剂对照、实验对照、标准 对照等&
设立对照组应满足均衡性要求;做到: 1、组间除干预措施外;其他影响结果的非 处理 因素等尽可能相同& 2、对所研究疾病的易感度及发病机会相等 3、检测和观察方法及诊断标准必须一致
术前T
处理原则:
计量资料与计数资料的相对性
计量——计数
正态分布与偏态分布的关系 偏态——正态
注意:t检验与方差分析的区别
• 比较的内容
t检验
方差分析加q检验
• 资料的利用率
低:每次仅用两组 高:每次要用全部数据
• 对原试验设计的影响 残:割裂了整体设计 全:于原试验设计呼应
• 犯假阳性错误的概率 大:1-1-0.05n
2 样本的个体数:
原则上是二样本间均数差别愈大;需要的 个体数愈少;均数差别愈小;需要个体数 愈多;另一方面综合估计标准差愈小;则 需要个体数愈少;标准差愈大;需要个体 数愈多;因而在确定样本量之先;一定要 知道标准差的约略值二样本均数的约略 差别&
正确估计观察例数的标准; 应该是保证 研究课题具有一定代表性与可靠性的 条件下所必须具有的最少例数;要符 合这一标准;必须具备以下条件:
2、常用的实验设计方案
1、单因素:
设计方案是一个观察因素的不同强 度水平作用效应间差异的研究&
配对设计、完全随机设计、序贯设计&
2、多因素:
设计方案是指观察两个以上因素不同 强度水平下作用效应差异的研究&
交叉设计、配伍组设计、拉丁方设 计、析因设计、裂区设计、正交设计.
此外还有三个变量及多个变量间关 联分析的研究设计;属多元分析&
2、样本大小的估计方法
在假设性检验中;统计意义不显著的结
果;可能由二方面造成的:
一、可能二组间是没有差别的;
二、可能是二组间是有差别;但
样本太小;不能用统计方法
不详
来证明这种结果&
确定子样的大小;可分为下面二个问
1 二样本间个体数比例: 当1/n1+1/n2是固定数值时;只要 1/n1 = 1/n2时标准误是最小的& 例如: n1= n2 = 10时; 1/n1+1/n2 = 0.2 n1 =15; n2 = 5时; 1/n1+1/n2 = 0.2667 n1 =19; n2 = 1时; 1/n1+1/n2 = 1.0526
1. 具有研究指标的总体均数、总体的 估计值——样本均数、标准差及样本 率;这些值来源于以往的实验;通过查 阅文献资料提供;或从研究者所作的预 备实验结果中获取&
2. 容许误差与检验的差值δ;其值越 小;所需样本量也越大&
δ的选择有时需主观规定&例如 在药物筛选中;用药组和对照组不用 药或用某种标准药的差别可以主观规 定&因为小于规定效果;是不符合试验 目的的;所以在设计中;样本的大小 能证明这种规定效果;就满足试验要 求了&
至少需要调查1068人
例3、 高血压的患病率为8%;研究者欲了解 某地高血压的患病率&并希望误差不超过2% ;问需要调查多少人?
分析:取α=0.05双侧检验 uα = u0.05 = 1.96; δ= 0.02; P = 0.08
代入 n = uα /δ2 P1-P = 1.96/0.0220.081-0.08 = 706.8 ≈ 707
它将通过实验指标来表达;因此选择评 价效应的指标是关系研究成败的重要关键 &
选择指标的依据:
1、指标的选择必须与研究目的密切关联 2、选择定量指标比定性指标能提供更多 的信息 3、尽量选择客观性强、精确性好、特异 度、和灵敏高的指标作为分析指标&
六、实验设计的原则
实验误差的控制:
实验设计的主要作用是减少误差; 提高实验的精确度;使研究者能从实验结 果中获得无偏的处理统计量及实验误差的 估计值;从而进行正确地分析和比较&
•
2、调查研究设计
对特定群体进行调查被调查者的因素 是客观存在的;研究者只能被动的观察和记 录&
实验和调查虽然在设计上有所区别;实 际研究中常结合应用;某些现场可为实验提 供线索;而实验结果还需要通过调查加以证 实&
二、实验设计的目的:
• 控制和降低系统误差对实验结果的 影响;缩小实验随机误差以利于进行统计 推断;更确切地回答研究者事先提出的假 设&
小:α= 0.05
• 结论的可靠性 • • •
低:统计量的自由度小 高:统计量的自由度大
至少需要调查707人
例4、某单位拟用抽样调查了解该地区正常成 人白血胞数的平均水平&希望误差不超过100 个/mm3&据文献报导; 正常成人白血胞数的标准 差约为1000个/mm3&如取α=0.05;问需要调查多 少人?
分析:本例α=0.05;uα = u0.05 =1.96; S = 1000个/mm3;δ=100个/mm3
足够的观察单位数是保证重现的基础; 而重复的同质可比条件等;也是保证实验 能够重现的重要条件&
4、盲法原则
实验设计时常把盲法也作为一条附 加原则;以更好地控制误差&
单盲:受试者不知道分组情况;有利于 研究者了解情况;但可能会产生由研究带 来的偏倚&
双盲:研究者和受试者均未知分组情 况和接受处理的具体内容;可以控制来自 研究者和受试者两方面主观上的干扰&
分析:
因为本例只计算有效;所以用单侧检验;δ= 2-1 = 1 g/100ml、S=2.5 g/100ml、
2α=0.10、2β= 0.20 ;查表t2α = 1.645 ; t2β= 1.282
代入公式:n = t2α + t2βs/δ2 =1.645+1.2822.5/12 = 53.5
故可认为需要治疗54人;即以56例进行 研究;如ຫໍສະໝຸດ Baidu药确实有效;则有90%1-β的把握可 得出有差别的结论&
统计学方法运用前提
1. 看资料类型 2. 看分布特征
Frequency
术前T
80
70
60
50
40
30
20 Std. Dev = .38
10
Mean = 36.62
0
N = 203.00
35.75 36.25 36.75 37.25 37.75 38.25
36.00 36.50 37.00 37.50 38.00
代入公式:
n1= n2 = 2 tα + t2βs/δ2 = 21.96+1.2822.5/1.22 = 91.2 ≈ 92
这样设计每组最少92只动物&
例7、
用某药治疗矽肺病人后;尿矽的排出量平均比 治 疗 前 增 加 1.5 mg/100ml; 其 标 准 差 为 2.5 mg/100ml;假定确实能使尿矽排出量增加;定显 著水平为α=0.05 ;β= 0.10;问需要观察多少病人 才能得出服药前后尿矽的排出量有差别的结论?