9抽样理论及总体参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4、整群抽样 整群抽样是指从总体中一个群体一个群体地抽取研究 对象的抽样方法。 优点:容易组织; 缺点:代表性不强,抽样误差大。 抽样方法的综合运用。
二、抽样分布
(一)抽样分布的基本概念
1、抽样分布及标准误 抽样分布是指样本统计量的概率分布。它是统计推断 的理论基础。(平均数的抽样分布、标准差的抽样分布、 相关系数的抽样分布等)
5
(二)样本平均数的抽样分布
1、平均数抽样分布的形态 正态总体:抽样分布服从正态分布; 非正态总体下的大样本:抽样分布接近正态分布。 2、平均数抽样分布的平均数 3、平均数抽样分布的标准差(即平均数的标准误)
平均数标准误的求解: A、总体正态分布,总体标准差已知
6
依据正态分布理论,我们可以推知样本平均数在多大 概率上落在 的范围之内。
(二)区间估计
区间估计是指以一定的概率去说明总体参数落在某 一区间的可能性。 描述样本平均数与总体平均数之间的差异用标准误 为单位,即 。
9
要求按某一可靠度去估计总体平均数的取值区间时, 可靠度称为置信水平,区间的界限称为置信界限,置信界 限内的区间称为置信区间。 研究中,常以95%和99%的可靠度估计总体参数的置 信区间。具体计算如下: 1、总体平均数的区间估计 A、总体正态分布,总体标准差已知时总体平均数的 区间估计 此时,样本平均数与总体平均数之间的差异,即样本 平均数在所有抽样中的位置可以表示为
11
B、总体正态分布,总体标准差未知时总体平均数的 区间估计 (1)总体标准差未知的大样本,可用 代替总体标 准差 , 总体平均数的置信度为95%的置信区间为
置信度为99%的置信区间为
如果设置信度为 为一小概率(常取值为0.05 和0.01,统计推断时称为显著性水平)。当总体标准差已 知,或总体标准差未知但为大样本时,其置信区间的一般 公式为
12
(2)总体标准差未知的小样本,用 代替总体标 准差 ,由于此时样本平均数的抽样分布为t分布,所以某 一置信度下总体平均数的区间估计要依据t分布来进行, 此时,总体平均数的置信度为 的置信区间为
例:某小学三年级学生阅读能力服从正态分布,现 从中随机抽取12名学生,其阅读能力的得分为28、32、 36、22、34、30、33、25、31、33、29、26,试估计该 校三年级阅读能力总体平均数95%和99%的置信区间。 练习:从某区小学五年级学生的数学推理测试成绩 中随机抽取26个,求得其平均数为86分,标准差为7分。 已知全区五年级学生的成绩服从正态分布,请在0.05显著 水平上估计该区五年级学生数学推理测试成绩的置信区 间。
当置信度为95%时, 即
10
当置信度为99%时,
即其置信区间为
例:某小学10岁全体女童的身高呈正态分布,其标 准差为6.25厘米,现从该校随机抽取27名10岁女童,测得 平均身高为134.2厘米,试估计该校10岁全体女童平均身 高的95%和99%的置信区间。 练习:从某正态总体中随机抽取一个样本容量为25 的样本,其平均数为42,已知总体的标准差为6,试估计 总体平均数的置信度为95%和99来自百度文库的置信区间。
B、总体正态分布,总体标准差未知 ①对于大样本 可以直接用样本标准差代替总体标准差,即
②对于小样本 所有可能样本的平均数以总体平均数为中心,服 从df=n-1的t分布,此时样本平均数的标准误
其中,
7
C、总体非正态分布,但样本容量n≥30 对于总体非正态分布,原则上不能使用参数推断的方 法进行推论,但对于大样本,尽管总体非正态分布,但样 本平均数抽样分布的形态与正态分布差异较小,所以,在 大样本情况下,无论总体是否正态分布,也无论总体标准 差是否已知,我们都可以认为平均数的抽样分布为近似服 从正态,求平均数的标准误都可用公式
19
例:随机抽取某校小学二年级学生40名,用韦氏智力 测验量表测量其智力水平,结果智商成绩在110分以上的 有25名,试以95%的可靠性估计全校二年级学生智力测验 分数总体在110分以上者占总体比例的置信区间。 练习:从某县三年级学生中随机抽取200人,测得他 们社会科学习成绩为A等的有85人。试估计该校三年级学 生社会科学习成绩获A等的人数占全县三年级总人数比率 的95%和99%的置信区间。
13
2、总体比率的区间估计(一般用于较大样本的情况) 如果从总体中抽取容量为n的样本,以p表示具有某种 属性的个体占总体的比率,其标准误为
当总体比率p未知时,样本比率和分别是总体比率p和 q的估计值,标准误为
当 ( 中的较小者)时,样本比率 近似服从正态分布,此时总体比率的置信度为的置信区间 为
14
17
(2)令 ,查t值表,查得 的值, 代入公式计算出 ; (3)重复上述做法,直到连续两次算得的 相 等,这时的 就是所要确定的样本容量n。 例:某地区进行六年级学生英语成绩抽样调查,已 随机抽取了一部分学生的英语成绩,得到的总体标准差 的估计值 =11.4分。现要了解六年级学生英语成绩 的平均水平,在99%的可靠性下,最大允许误差为3分, 问样本容量应为多少? 练习:某市要对今年全市小学四年级学生的外语平 均分数进行估计,规定 ,最大允许误差为2分。 已知去年本校小学四年级学生外语成绩的标准差是12分, 那么应当抽取多大样本进行调查才能符合估计的要求?
2
2、机械抽样 机械抽样也称等距抽样,按一个与研究问题的性质没有 直接关系的标志把总体内每一个个体进行编号排序,然后按 固定的距离抽取一部分个体构成样本的抽样方法。间隔距离 的大小视所需样本容量与总体中个体数目的比率而定。 优点:比简单随机抽样代表性强; 缺点:当总体中不同特性的分布不均匀或呈一定周期性 时,机械抽样可能产生系统性偏差。 3、分层抽样 分层抽样也称分类抽样。先按与研究内容有关的因素将 总体各单位(或个体)分为不同的等级或类型,即层,然后 按比例或不按比例从每一层中再用简单随机抽样或机械抽样 的方法抽取一定数量的个体构成样本。 优点:抽样误差小,代表性强。 分层原则:层内个体差异越小越好;层间差异越大越好。 3
4
描述所有可能个样本统计量参差不齐程度的量数称为 标准误,即抽样误差。也就是某种统计量在抽样分布上的 标准差。标准误用符号SE表示。标准误越小,说明样本统 计量与总体参数间的差异越小,样本对总体的代表性越强, 用样本统计量推断总体参数的可靠性越强。 2、自由度 自由度是指可以自由取值的数据的个数,即不受任何 约束可以自由变动的变量的个数,一般用符号df表示。 在总体层面上,每个变量在统计层面上没有任何约束, 故总体的自由度是N;在样本层面上,对于n个数值构成的 样本,它的自由度为:n-1。 原因: 自由度失去的多少取决于计算统计量时实际受约束条 件的多少,要据实际条件来决定。
三、总体参数的估计
(一)点估计
点估计就是用某一样本统计量的值来估计相应的总体 参数值。
8
好的估计量的基本要求: 无偏性——即没有系统偏差,指若用统一估计量估 计多次,其平均值应恰好等于预估计的总体参数值,即 偏差之和为0。 有效性——当总体参数的无偏估计值不止一个时, 其中统计量的一切可能值方差最小者有效性最高。 一致性——指当样本容量无限增大时,估计值应越 来越接近它所估计的总体参数值。
16
练习:已知某小学六年级数学成绩的标准差为10分。 现从该校随机抽取一部分学生,要求有95%的把握用这 部分学生的数学成绩估计全校六年级学生平均成绩的差 异不超过2分,那么最低抽取多少学生才能满足这一要求? B、总体正态分布,总体标准差未知
问题: 不是一个常数,随自由度df=n-1的变化而变化, 而样本容量未知,则df无法确定,则 无法查出。 办法:逐步试差 步骤: (1)设 ,查表得 的值,代入公式 求出 ;
抽样理论及总体 参数估计
1
一、随机抽样的基本概念与方法
(一)随机抽样的基本概念
随机抽样是指依据随机性原则和方法,从总体中随机 抽取对总体有充分代表性的样本。 随机性原则:A、总体中每个个体相互独立; B、每个个体被抽到的机会均等。 总体和样本 参数和统计量: ; S r。
(二)随机抽样方法
1、简单随机抽样 简单随机抽样是完全按照偶然机会抽取一部分个体构 成样本。 A、抽签;B、随机数码表。
四、样本容量的确定
(一)确定样本大小的基本原则
在尽量节省人力、经费和时间的条件下,确保用样本 推断总体达到预定的可靠度及准确性。
15
(二)由样本平均数估计总体平均数时样本容量 的确定
A、总体标准差已知
n为一定精确度要求下应抽取的样本容量; 为允许的最大误差; 为总体标准差; 为某可靠性下的双尾临界值。 例:拟估计上海市高校四级英语考试的总体平均分 数,根据历次考试成绩的标准差为13分,这次的估计最 大允许误差2分,可信度为95%,问应当抽多少人?
18
(三)用样本比率估计总体比率时样本容量的确 定
问题:在抽样之前,样本比率是未知的,一般情况下, 只能根据经验或已有类似研究结果对 进行初步估计。
例:已知某市一所初中历届中考升学率为52%,今年 的学生水平与往年相当,要估计今年的升学率,要求误差 不超过2%,可靠度为95%,至少要抽取多少人进行调查? 练习:某县要估计全县小学生患近视的情况,规 定 ,最大允许误差为3%。以往调查该县小学生患 近视的比率为15%。问抽取多少小学生进行调查才合适?
相关文档
最新文档