随机抽样及随机分组
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 简单随机抽样亦称单纯随机抽样要求每个观察对 象有同等概率被选入样本。 • 从有N个观察单位中抽取m个观察单位方法: • 先将N个观察单位编号,并且每个赋一个随机数。 再将 N 个随机数排序,前 m 个随机数对应的观察 单位编号即为所抽取。 • 优缺点 简单随机抽样是最基本的抽样方法,优 点是均数 ( 或率 ) 及其标准误的计算简便 , 缺点是 当总体例数较多时 , 实施抽样比较困难。适用于 小型调查。
• 抽样调查
普查(overall survey)
• 亦称全面调查(complete survey),将组成 总体的所有观察单位全部加以调查 • 普查一般都是用于了解总体某一特定“时点” 的情况,如年中人口数、时点患病率等。 • 如我国人口普查等。
• 优点:
• ①理论上只有普查才能取得总体参数,因 为普查没有抽样误差; • ②普查能全面地了解总体的分布特征。 • 缺点: • ①普查工作量大,较费时费力; • ②调查质量难以保证,系统误差大。
• • • • • • • • •
完全随机设计编号分组结果(总例数=20,处理组数=5) ━━━━━━━━━━━━━━━━━━━━━━ 处理01 处理02 处理03 处理04 处理05 ────────────────────── 7 5 2 1 4 12 9 3 6 10 16 11 13 8 14 17 20 15 19 18 ━━━━━━━━━━━━━━━━━━━━━━
随机化分组方案
• 随机化分组是首先将受试对象按某一特征 编号,在每个编号下用随机化工具产生相 应的随机数字,然后,再按照事先规定的 分组原则进行合理的分组。
• 统计软件利用计算机中的伪随机函数给每 个编号产生一个随机数,然后将随机数排 序,进行分组。
1 ) 完全随机分组设计
• 从同一总体中随机抽取一定数目的受试对 象,将受试对象随机地分配到每一个组中 , 各组分别接受不同的处理。这样的设计分 组称为完全随机分组设计。
㈣分层抽样
• 先按影响观察值变异较大的某种特征,将总体分为 若干层(strata),再从每层内随机抽取一定数量的 观察单位组成样本(样本含量为n)又称分类抽样。 • 优缺点 ①抽样误差比较小;②先要将总体分层, 层内个体差异越小越好,层间个体差异越大越好, 便于对不同的层采用不同的抽样方法。
CHISS的实现
配伍组设计的优缺点
• 优点:组间可比性增强,检验效率高;可 以同时分析处理因素和个体差异对实验效 应的影响;减少实验所需样本含量。 • 缺点:区组内对象数与处理组数必须相等 ,匹配与分组较繁,当实验结果有观察值 缺失时,信息损失较大,统计处理较麻烦 ,不能分析交互作用。
2)配伍组设计
• 如果实验因素有G(3个以上)水平组,事 先将受试对象按某种重要的非实验因素进 行分组,即配伍组或区组(block)。每个 区组内有G个实验对象,采用完全随机地分 配,每个实验对象接受一种不同的处理称 为配伍组分组,亦称随机区组设计。
• 配伍组是由若干特征相似的试验材料组 成,如同一窝的动物,批号相同的试剂, 体重相近的受试者等。 • 例 要比较5种方法作用是否相同,现取 7窝老鼠,每窝有5只老鼠,试进行配伍 组分组。
CHISS的实现
• 例如,现在某校有500名研究生,要随机抽 取10%,即50同学参加比赛,问:该如何抽取?
CHISS实现
• 1 编号建数据库 将500学生的学号录入数据库 中,建立数据库,并每人给一个编号从1,2,…500 . • 2 产生随机数 点击 • 设计→实验设计→随机化方法→产生随机数 • 选择条件:正态分布,数据行数为500,正态分布 平均数为0,标准差为1 • 3 排序 按随机数从小到大排序,前50名即为所 求 • 数据→行编辑→数据排序 选变量:RND正态 • →数据
调查研究资料的特点
• 无法随机化分组 • 组间不均衡 • 存在混杂因素
• 例如, 肥胖对冠心病的影响研究中,研究者不可 能象药物研究那样, 随机地安排一部份人去肥 胖,安排另一部人不肥胖。两组人群中存在着很 多因素不均衡的因素混杂, 从而需要特殊的统 计学设计和分析。
调查方法
• 根据调查的范围和调查对象的选择方式可 分为: • 普查
练习题
• 现某年级2个班,1班6名同学,2班9名同学, 现要从1班随机抽取2名同学, 2班随机抽 取3名同学参加比赛,如何抽取?
各种抽样方法抽样误差的关系
• 各种抽样方法的存在抽样误差,一般是:
• 整群抽样 单纯随机抽样 系统抽样 分层 抽样。
随机化ຫໍສະໝຸດ Baidu组
• 随机化分组是试验设计的重要内容, 常用的方法有三种: • 掷硬币、抽签、骰子; • 用查随机数字表; • 用计算机随机化程序。
• 典型案例:央视收视率调查
㈢整群抽样
• 先将总体划分为K个群,每个群包括若干 个观察单位,再随机抽取t个“群” (kt ),并将被抽取t个群的全部观察单 位组成样本。
• 例如:要检查某学校学习情况时,随机抽取 几个班,对几个班的全部同学进行考查。
• 优缺点 优点是在大规模调查中,整群抽样 易于组织,可节省人力物力,容易控制调 查质量;缺点是一般来说各群间差异较大, 所以抽样误差较大。
随机抽样及随机分组
童新元 中国人民解放军总医院
设计类型
• 干预试验 (动物实验,临床试验) • 观察研究
调查研究设计
• 研究者无须或无法施加干预措施,而是对现 场发生的实际情况进行观察 , 称为调查研究 (Investigation Study), 亦 称 观 察 研 究 (observation study)。例如: • 研究肥胖对冠心病的影响情况; • 研究当今中国儿童生长发育情况; • 研究分析经济危机形成的原因; • 。。。。等。
练习题
• 现在某班有20个同学,要从中随机抽取5名参 加比赛,如何平公的进行抽取?
㈡系统抽样
• 系统抽样又称等距抽样或机械抽样。方法是按照 一定顺序,机械地每隔若干个观察单位抽取一个观 察单位组成样本。 • 例如:要从 1000 户中抽取 100 户作样本 , 可先在门 牌号1~ 10号之间随机抽取一户(假定为第5号住户 ),其后每间隔10号抽取一户,即抽取5、15、25、35、 …、995,共100户组成样本。
抽样研究的两个重要问题
• 抽样的样本大小
• 怎样抽样
随机抽样方法
• 简单随机抽样(simple random sampling)
• 系统抽样(systematic sampling)
• 分层抽样(stratified sampling) • 整群抽样(cluster sampling)
㈠简单随机抽样 P10
• 例 现有 20 个动物试验,分别采用 5 种 不同的营养饲料方法进行喂养,考察 其营养效果,采用完全随机分为5组。
CHISS软件实现
• 解步骤:1 进入 试验设计模块 • 点击 试验设计---设计方案---完全随机分 组 • 试验样本总例数: 30, • 处理组数:2 • 1组例数:15 • 2组例数:15---确定 • 2 进入结果模块 查看结果 • 点击 结果
• 例如,某校有3个不同专业的研究班,每班10个同学,现 要从每班各随机抽取3名同学参加比赛,如何抽取? • CHISS实现步骤: • 1 编号建数据库 将30学生的学号及班级录入数据库 中,建立数据库. • 2 产生随机数 点击 • 设计→实验设计→随机化方法→分层抽样 • 选择分层变量:班级 每个班人数都赋值为3 • →数据 查看抽样结果: 1标记为被抽取对象
抽样调查(sampling survey)
• 抽样调查是从总体中随机抽取一定数量的 观察对象组成样本,用样本信息推断总体 特征。 • 抽样调查是统计学上第一次技术革命. • 抽样调查技术通过部分认识整体 , 同时 , 节 省大量时间大量的人力,物力和成本。
优缺点
• 优点:①费用较少,速度较快,覆盖面较大, 正确性较高;②许多医学问题只能作抽样调查, 如药物疗效观察等。 • 缺点:调查设计、实施及资料分析复杂,若样本 达到总体75%时则直接采用普查。 • 例如 , 在美国大选中,对 1000 名至 3000 名选民 进行调查,来预测近1亿选民的投票情况,抽样 误差不超过3%。
完全随机设计的优缺点
• 优点 :设计简单,易于实现;随机分配能有效 地避免某些非实验因素的影响,充分显示实验 因素效应;随机分配增强比较组间的可比性; 设立对照能有效控制非实验因素对实验因素的 影响,从而有效控制偏倚和误差。
• 缺点:对混杂因素只靠随机化进行控制,因而 灵敏度较低;只能作单因素比较,不能分析多 个因素,尤其因素间的交互作用。需要例数较 多。
• 抽样间隔=总数/样本含量
• 3.优缺点 优点是易于理解,简便易行,容易得 到一个按比例分配的样本;缺点是一般情 况下 , 虽然系统抽样的抽样误差小于简单随 机抽样 , 但是在某些特殊情况下可能有偏性。
• 例如:上述例子中我们抽取的住户均为单 号,其住房可能都是一个朝向,若作采光等卫 生学调查,将产生明显的偏性。
• 抽样调查
普查(overall survey)
• 亦称全面调查(complete survey),将组成 总体的所有观察单位全部加以调查 • 普查一般都是用于了解总体某一特定“时点” 的情况,如年中人口数、时点患病率等。 • 如我国人口普查等。
• 优点:
• ①理论上只有普查才能取得总体参数,因 为普查没有抽样误差; • ②普查能全面地了解总体的分布特征。 • 缺点: • ①普查工作量大,较费时费力; • ②调查质量难以保证,系统误差大。
• • • • • • • • •
完全随机设计编号分组结果(总例数=20,处理组数=5) ━━━━━━━━━━━━━━━━━━━━━━ 处理01 处理02 处理03 处理04 处理05 ────────────────────── 7 5 2 1 4 12 9 3 6 10 16 11 13 8 14 17 20 15 19 18 ━━━━━━━━━━━━━━━━━━━━━━
随机化分组方案
• 随机化分组是首先将受试对象按某一特征 编号,在每个编号下用随机化工具产生相 应的随机数字,然后,再按照事先规定的 分组原则进行合理的分组。
• 统计软件利用计算机中的伪随机函数给每 个编号产生一个随机数,然后将随机数排 序,进行分组。
1 ) 完全随机分组设计
• 从同一总体中随机抽取一定数目的受试对 象,将受试对象随机地分配到每一个组中 , 各组分别接受不同的处理。这样的设计分 组称为完全随机分组设计。
㈣分层抽样
• 先按影响观察值变异较大的某种特征,将总体分为 若干层(strata),再从每层内随机抽取一定数量的 观察单位组成样本(样本含量为n)又称分类抽样。 • 优缺点 ①抽样误差比较小;②先要将总体分层, 层内个体差异越小越好,层间个体差异越大越好, 便于对不同的层采用不同的抽样方法。
CHISS的实现
配伍组设计的优缺点
• 优点:组间可比性增强,检验效率高;可 以同时分析处理因素和个体差异对实验效 应的影响;减少实验所需样本含量。 • 缺点:区组内对象数与处理组数必须相等 ,匹配与分组较繁,当实验结果有观察值 缺失时,信息损失较大,统计处理较麻烦 ,不能分析交互作用。
2)配伍组设计
• 如果实验因素有G(3个以上)水平组,事 先将受试对象按某种重要的非实验因素进 行分组,即配伍组或区组(block)。每个 区组内有G个实验对象,采用完全随机地分 配,每个实验对象接受一种不同的处理称 为配伍组分组,亦称随机区组设计。
• 配伍组是由若干特征相似的试验材料组 成,如同一窝的动物,批号相同的试剂, 体重相近的受试者等。 • 例 要比较5种方法作用是否相同,现取 7窝老鼠,每窝有5只老鼠,试进行配伍 组分组。
CHISS的实现
• 例如,现在某校有500名研究生,要随机抽 取10%,即50同学参加比赛,问:该如何抽取?
CHISS实现
• 1 编号建数据库 将500学生的学号录入数据库 中,建立数据库,并每人给一个编号从1,2,…500 . • 2 产生随机数 点击 • 设计→实验设计→随机化方法→产生随机数 • 选择条件:正态分布,数据行数为500,正态分布 平均数为0,标准差为1 • 3 排序 按随机数从小到大排序,前50名即为所 求 • 数据→行编辑→数据排序 选变量:RND正态 • →数据
调查研究资料的特点
• 无法随机化分组 • 组间不均衡 • 存在混杂因素
• 例如, 肥胖对冠心病的影响研究中,研究者不可 能象药物研究那样, 随机地安排一部份人去肥 胖,安排另一部人不肥胖。两组人群中存在着很 多因素不均衡的因素混杂, 从而需要特殊的统 计学设计和分析。
调查方法
• 根据调查的范围和调查对象的选择方式可 分为: • 普查
练习题
• 现某年级2个班,1班6名同学,2班9名同学, 现要从1班随机抽取2名同学, 2班随机抽 取3名同学参加比赛,如何抽取?
各种抽样方法抽样误差的关系
• 各种抽样方法的存在抽样误差,一般是:
• 整群抽样 单纯随机抽样 系统抽样 分层 抽样。
随机化ຫໍສະໝຸດ Baidu组
• 随机化分组是试验设计的重要内容, 常用的方法有三种: • 掷硬币、抽签、骰子; • 用查随机数字表; • 用计算机随机化程序。
• 典型案例:央视收视率调查
㈢整群抽样
• 先将总体划分为K个群,每个群包括若干 个观察单位,再随机抽取t个“群” (kt ),并将被抽取t个群的全部观察单 位组成样本。
• 例如:要检查某学校学习情况时,随机抽取 几个班,对几个班的全部同学进行考查。
• 优缺点 优点是在大规模调查中,整群抽样 易于组织,可节省人力物力,容易控制调 查质量;缺点是一般来说各群间差异较大, 所以抽样误差较大。
随机抽样及随机分组
童新元 中国人民解放军总医院
设计类型
• 干预试验 (动物实验,临床试验) • 观察研究
调查研究设计
• 研究者无须或无法施加干预措施,而是对现 场发生的实际情况进行观察 , 称为调查研究 (Investigation Study), 亦 称 观 察 研 究 (observation study)。例如: • 研究肥胖对冠心病的影响情况; • 研究当今中国儿童生长发育情况; • 研究分析经济危机形成的原因; • 。。。。等。
练习题
• 现在某班有20个同学,要从中随机抽取5名参 加比赛,如何平公的进行抽取?
㈡系统抽样
• 系统抽样又称等距抽样或机械抽样。方法是按照 一定顺序,机械地每隔若干个观察单位抽取一个观 察单位组成样本。 • 例如:要从 1000 户中抽取 100 户作样本 , 可先在门 牌号1~ 10号之间随机抽取一户(假定为第5号住户 ),其后每间隔10号抽取一户,即抽取5、15、25、35、 …、995,共100户组成样本。
抽样研究的两个重要问题
• 抽样的样本大小
• 怎样抽样
随机抽样方法
• 简单随机抽样(simple random sampling)
• 系统抽样(systematic sampling)
• 分层抽样(stratified sampling) • 整群抽样(cluster sampling)
㈠简单随机抽样 P10
• 例 现有 20 个动物试验,分别采用 5 种 不同的营养饲料方法进行喂养,考察 其营养效果,采用完全随机分为5组。
CHISS软件实现
• 解步骤:1 进入 试验设计模块 • 点击 试验设计---设计方案---完全随机分 组 • 试验样本总例数: 30, • 处理组数:2 • 1组例数:15 • 2组例数:15---确定 • 2 进入结果模块 查看结果 • 点击 结果
• 例如,某校有3个不同专业的研究班,每班10个同学,现 要从每班各随机抽取3名同学参加比赛,如何抽取? • CHISS实现步骤: • 1 编号建数据库 将30学生的学号及班级录入数据库 中,建立数据库. • 2 产生随机数 点击 • 设计→实验设计→随机化方法→分层抽样 • 选择分层变量:班级 每个班人数都赋值为3 • →数据 查看抽样结果: 1标记为被抽取对象
抽样调查(sampling survey)
• 抽样调查是从总体中随机抽取一定数量的 观察对象组成样本,用样本信息推断总体 特征。 • 抽样调查是统计学上第一次技术革命. • 抽样调查技术通过部分认识整体 , 同时 , 节 省大量时间大量的人力,物力和成本。
优缺点
• 优点:①费用较少,速度较快,覆盖面较大, 正确性较高;②许多医学问题只能作抽样调查, 如药物疗效观察等。 • 缺点:调查设计、实施及资料分析复杂,若样本 达到总体75%时则直接采用普查。 • 例如 , 在美国大选中,对 1000 名至 3000 名选民 进行调查,来预测近1亿选民的投票情况,抽样 误差不超过3%。
完全随机设计的优缺点
• 优点 :设计简单,易于实现;随机分配能有效 地避免某些非实验因素的影响,充分显示实验 因素效应;随机分配增强比较组间的可比性; 设立对照能有效控制非实验因素对实验因素的 影响,从而有效控制偏倚和误差。
• 缺点:对混杂因素只靠随机化进行控制,因而 灵敏度较低;只能作单因素比较,不能分析多 个因素,尤其因素间的交互作用。需要例数较 多。
• 抽样间隔=总数/样本含量
• 3.优缺点 优点是易于理解,简便易行,容易得 到一个按比例分配的样本;缺点是一般情 况下 , 虽然系统抽样的抽样误差小于简单随 机抽样 , 但是在某些特殊情况下可能有偏性。
• 例如:上述例子中我们抽取的住户均为单 号,其住房可能都是一个朝向,若作采光等卫 生学调查,将产生明显的偏性。