第3章简单随机抽样
第3章选择抽样调查方法
第3章选择抽样调查方法在进行调查研究时,我们通常无法直接面对整个研究对象的总体,而需要通过对样本进行观察和分析来推断总体的特征和规律。
因此,正确选择适当的抽样调查方法是保证调查结果可靠和有效的一个重要步骤。
抽样调查方法可以分为概率抽样和非概率抽样两大类。
概率抽样方法是以一定的概率原则进行样本选择的方法,可以减少抽样误差,提高样本的代表性和推广能力。
非概率抽样方法则是基于研究者的主观判断进行样本选择的方法,其优势在于灵活性和经济性。
1.概率抽样方法概率抽样方法是利用随机数表或随机数发生器确定样本的选择机会,以保证样本的选取是随机的、无偏的。
常见的概率抽样方法有简单随机抽样、系统抽样、整群抽样和多阶段抽样等。
(1)简单随机抽样是最常用的抽样方法之一,其基本思想是将总体划分为若干个有相同特征的子群,然后从每个子群中随机选择若干个样本,再将这些样本合并成总体样本。
这种方法具有操作简单、抽样误差可控等优点。
(2)系统抽样是将总体按照一定的规则排列后,根据随机数表或随机数发生器选择出一个随机起点,然后按照一定的间隔逐个选择样本。
这种方法适用于总体比较稳定的研究对象,具有操作简单、抽样比例可控等优点。
(3)整群抽样是将总体按照其中一种特征划分为若干个互不重叠的子群,然后从每个子群中全面选择样本。
这种方法适用于总体具有一定规模的亚群体的研究,具有简化抽样过程、减小抽样误差等优点。
(4)多阶段抽样是将总体按照一定的层次划分并逐层选择样本,其中每一层可以使用不同的抽样方法。
这种方法适用于总体分布复杂、无法直接获取的情况,具有适应性强、适用范围广等优点。
2.非概率抽样方法非概率抽样方法是基于主观判断或特定目的选择样本的方法,其优势在于灵活性、经济性和操作简单,但容易引入选择偏差和非抽样误差。
常见的非概率抽样方法有方便抽样、判断抽样、专家抽样和配额抽样等。
(1)方便抽样是研究者根据个人方便性自主选择的样本,不具备随机性和代表性,容易引入选择偏差。
第三章-简单随机抽样
N!
考虑顺序可能的样本为 N n !
每个样本被抽中的概率为 ( N n)! N!
s2 1358.41, v( y) (1 f )s2 / n 37.6444, se( y) 6.1355
对该校大学生某月电信消费人均支出额的估计为 53.64元,在置信度95%下,临界值1.96,可以说以 95%的把握说明该校大学生该月的人均支出在 [53.64+(-)1.96*6.1355],即41.61~65.67元。
n 1
2n
正态近似产生的误差 主要与nP有关,特别 当nP比较小时,产生 的误差甚大,在95% 置信度下,P<0.5时正 态分布需要的最小nP 值与n值如下表。
P
nP
0.5
0.4
0.3
0.2
0.1
0.05
0
n
15
30
20
50
24
80
40 200
60 600
70 1400
80 无穷
试以95%的置信度估计上例大学生月电信消费超 过80元的人数及其比例。
N n S2 N n
nN
为调查某校大学生的电信消费水平,在全 校N=15230名学生用简单随机抽样抽取 n=36名学生,调查上月电信支出数据。试 以95%的置信度估计该校大学生该月电信 消费的平均支出额。
样本序号 消费元/月 样本序号 消费
样本序号 消费
1
45
13
抽样技术第三章_分层随机抽样
4
4
4
ˆ v Y ˆ 23208 s Y
ˆ 209650 2 23208 ˆ ts Y Y
2015/11/6
23
三、对总体比例的估计
总体比例P的估计为:pst Wh ph
h 1
L
估计量的性质
对于一般的分层抽样,如果 ph是 P h 的无偏估计 (h 1,2,, L ),则 pst 是 P的无偏估计。 p 的方差为:
W 2V Y V Y h h st
h1
L
只要对各层估计无偏,则总体估计也无偏。
各层可以采用不同的抽样方法,只要相应的估计量是无 偏的,则对总体的推算也是无偏的。
11
2015/11/6
证明性质1
由于对每一层有
ˆ Y EY h h
L L ˆ ˆ ˆ E Y E W Y W E Y st h h h h 因此, h1 h1
L
L
N Y hh
h 1
L
分层随机样本,总体均值 Y 的简单估计
1 y st Wh y h N h 1
N
h 1
L
h
yh
10
2015/11/6
估计量的性质
是 Yh 的无 性质1&2:对于一般的分层抽样,如果 Y h 偏估计( h 1,2, , L ),则 Y 是Y 的无偏估计。 st Yst 的方差为:
7
三、符号
所有总体参数的估计量都采用下标“st”以示区别:
记 号 代表的含义
h
下标
i
(人教a版)必修三同步课件:2.1.1简单随机抽样
样本
样本容量 2.从3个同学当中选择1位同学去参加某项活动,每个同学被
选中的可能性为___.
1 3
[预习导引]
1.简单随机抽样的定义
不放回 (n≤N),如果每次抽 设一个总体含有N个个体,从中逐个_______地抽取n个个体作为样本
取时总体内的各个个体被抽到的机会都_____,就把这种抽样方法叫做简单随机抽样.
高中数学· 必修3· 人教A版
第二章
统计
2.1 随机抽样 2.1.1 简单随机抽样
[学习目标]
1.理解并掌握简单随机抽样的概念、特点和步骤. 2.掌握简单随机抽样的两种方法.
[知识链接]
1.在初中我们已学过一些统计知识.我们把所要考察对象的全体叫做_____,其中每一个考
总体 个体 _____,样本 察对象叫做_____ .从总体中抽出的若干个个体组成的集合叫做总体的一个
跟踪演练3
(2013· 江西高考)总体由编号为01,02,…,19,20的20个个体组成.利用下面
的随机数表选取5个个体,选取方法从随机数表第1行的第5列和第6列数字开始由左到右一 次选取两个数字,则选出来的第5个个体的编号为 ( )
7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481
第四步,从盒子中依次取出6个号签,并记录上面的编号. 第五步,与所得号码对应的志愿者就是医疗小组成员. 规律方法 1.一个抽样试验能否用抽签法,关键看两点:一
是制签是否方便;二是个体之间差异不明显.一般地,当样
本容量和总体容量较小时,可用抽签法. 2.应用抽签法时应注意以下几点: (1)编号时,如果已有编号可不必重新编号; (2)号签要求大小、形状完全相同; (3)号签要均匀搅拌; (4)要逐一不放回的抽取.
第三章 抽样设计
一、方便抽样
又称任意抽样。一般由调研人员从工作的 方便出发,在调研对象的范围内随意抽取 一定数量的样本进行调查。
最常用的两种方法是“街头拦截法” 最常用的两种方法是“街头拦截法”和 “空间抽样法” 空间抽样法” 特点: 节约费用和时间,但样本的信息不 适用于总体参数的推断。
注意:
方便抽样一般用于非正式的探索性调查, 只有在调查总体各单位之间的差异不大时, 抽取的样本才有较高的代表性。
抽取样本的数量
允许误差 % 1 2 3 4 5 6 7 可信程度(把握程度)% 95 99 9600 16589 2400 4147 1067 1849 600 1037 384 663 267 461 196 339
一、简单随机抽样
适用范围:调查总体中各个体之间差异程 度较小的情况下,或者调研对象不明,难 以分组、分类的情况。 常用方法: 1、抽签法 2、随机数表法
二、系统抽样
又称等距抽样,就是先将调查总体的各个 体按照一定的标志排列起来,然后按照固 定的顺序和一定间隔来抽取样本个体。
排队的标志有两种: 1、按调查项目有关的标志排队 2、按调查项目无关的标志排队
(独立控制配额)按年龄分组: 独立控制配额)按年龄分组:
按年龄分组 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁 56岁 合计 人数 40 60 70 30 200
按性别分组
性别 人数 100 100 200
男
女
合计
相互控制配额抽样
合计 40 60 70 30 收入 性别 年龄 18-29岁 18-29岁 30-40岁 30-40岁 41-55岁 41-55岁 56岁以上 56岁以上 合计 高 男 3 6 6 3 18 女 4 5 6 3 18 中 男 7 11 13 6 37 女 8 11 13 5 37 低 男 9 13 16 7 45 女 9 14 16 6 45
第3章抽样设计
三、抽样框 抽样框是指用以代表总体,并从中抽选样本的一个框架,
其具体表现形式主要有包括总体全部单位的名册、地图等。抽 样框在抽样调查中处于重要地位,是抽样调查必不可少的部分, 其对于推断总体具有相当大的影响。
四、抽样比 抽样比是指在抽选样本时,所抽取的样本单位数与总体单位
随机抽样调查的特点和作用
一、随机抽样调查的特点
抽样就是根据随机原则从总体中抽取一部分单位作为样本,并 根据样本数量特征对总体特征做出有一定可靠性的估计与推断。
在统计中将从总体中抽取的部分单位称为样本,把描述样本数 量特征的指标称为统计量,描述总体数量特征的指标称为参数。
随机抽样调查是建立在随机取样基础上,保证了每一单位都有 被抽中的可能性,从而增强了被抽中单位对总体的代表性。
特征的指标称为统计量,描述总体数量特征的指标称为参数。
抽样按抽取方法可分为重复抽样和不重复抽样。但是当总体单位 数很大,或样本量与总体单位数相比很小时,二者区别不大。
二、抽样调查的分类
包括随机抽样调查(概率抽样调查)和非机抽样调查(非 概率抽样调查)。
(一)随机抽样
这是从总体中按照随机原则抽取一定数目的单位作为样本进行 调查,并以一定概率保证对总体的特征值进行推断和估计。
面的数据; (二)在进行全面调查比较困难的时候,取得全面的数
据; (三)为了节约调查人力、费用和时间,采用抽样调查
代替全面调查。
抽样调查的几个基本概念
一、总体 总体是指所要研究对象的全体。它是根据一定研究目的而
规定的所要调查对象的全体所作成的集合,组成总体的各研究对 象称为总体单位。
二、样本 样本是总体的一部分,它是由从总体中按一定程序抽选出
第三章 抽样分布
y0
y0
F分布的密度函数曲线
f ( y)
(二)非重置抽样
非重置抽样是指被抽中单位不再放回总体中,下 一个样本单位只能从余下的总体单位中抽取。
同一总体单位不可能被重复抽中.
每次抽取是在不同数目的总体单位中进行的
n次抽取可看作是n次互不独立的随机试验。
本章重点
重点:掌握随机样本和样本值的区别、 统计量的含义
当n次观察结束后,就可以得到一组实数 x1,x2, ,xn ,它们依次是随机变量 X1,X 2, ,X n 的观测值,称 为样本值。
第二节 抽样分布
一、统计量 设X 1,X 2, ,X n是来自总体X的一个样本,g(X 1,X 2, ,X n )
是X 1,X 2, ,X n的函数,若函数g(X 1,X 2, ,X n )不含有任何 未知参数,则称g(X 1,X 2, ,X n )是一个统计量。
第三章 抽样分布
学生姓名 小张 小刘 小李 小王 小赵
月支出(元) 1120 1980 1500 1320 1870
小黄
小谭 小杜 小蔡 小唐 小高 小许
1390
1700 1380 1600 1740 1760 1850
80名
小卢
小吴 小郑
1780
1670 1720
求全班学生的平均月支出
测算每一名学生的月支出 ?
y0 y0
卡方分布密度函数的图形
f ( y)
第三章随机抽样和抽样散布
第三章随机抽样和抽样散布在前两章的讨论中,咱们明白了随机现象常常通过随机变量及其概率散布和数字特点来描述,但是,在实际问题中,要准确明白概率散布和数字特点,有时是很困难的。
例如,咱们要以药丸的崩解时刻或药片的溶解速度为指标来考察某一批药品的质量。
假设把这批药品全数进行一下实验,其散布函数及其有关的数字特点都可求出。
可是,由于测定这些指标的实验,一样是破坏性的,报废了全数药品即便求出了有关指标也无心义。
还有一些查验指标,如蜜丸的重量、体积等,对它们的查验虽不是破坏性的,但要成批逐个查验,不管从人力仍是物力上都会受到条件限制。
事实上,人们老是通过对部份产品的实验结果作分析,推断出全数产品的情形。
这确实是数理统计研究的一个要紧问题。
本章先讨论样本和统计量等大体概念,然后讨论常见的几种抽样散布,为进一步讨论统计推断方式打下必要的理论基础。
§3-1 随机抽样整体与样本整体与样本是数理统计中两个要紧概念。
整体是指研究对象的全部,组成整体的每一个单元称为个体。
整体能够包括有限个个体,也能够包括无穷多个个体。
某个整体是有限的,但在个体相当多的情形下,往往把它作为无穷整体来对待。
在数理统计中,咱们不笼统地研究所关切的对象,只考察它的某一种数值指标,例如,考察某批中成药丸的质量时,能够考察崩解时刻、溶解速度、丸重等项指标。
那个地址,若是咱们只需注意药丸的重量,固然,每一丸都有一个确信的重量如:6g,,,,…。
咱们就把所有这些丸重数值当做丸重的整体;每一个丸重值确实是一个个体。
如此,丸重X事实上是一个随机变量,它的取值的全部是一个整体,每一个可能取值确实是它的个体。
由于随机变量是用其概率散布F(x)(或密度函数f x)来刻画,因此假设X具有散布函数F(X),那么称这一整体为具有散布函数F(X)的整()体。
为了研究整体,需在整体中抽取假设干个个体,这就得出样本的概念。
概念1在一个整体X中抽取n个个体X1,X2,…,X n,这n个个体称为整体X的一个容量为n的样本。
3第三章 准备阶段(2):抽样
如何看待?
另一组数据:
北京市55-60岁癌症发病率是391.17/10万; 60-65年龄组是541.87/10万;65-70是766.54/10 万,而美国总体为500/10万,老年组高于北京。 其它因素: 遗传、环境、饮食、吸烟饮酒、接触有毒有 害物质、感染、缺乏锻炼、心理
第一节 抽样的意义与作用
由部分认识总体 同质和异质 自然科学中分子和元素——同质性 社会科学中个人之间——异质性
思考之一:美国的两次大选
1984年的美国总 统大选 民意调查机构准 确预测
1亿选民,调查对 象仅2000人!
1936年美国总统大选
PK
Franklin Rooselvelt
Alfred Landon
某高校在校总学生约2万人(除去留学生,成教等), 考虑要作年级和教育差异对比,可将学生分为本科 (15000人)、硕士(4000人)、博士(1000人)三 个大群体,拟抽取1000人进行调查。经求取比例, 最低比例5%可以满足样本需求。 各层均按照5%进行抽样,即
本科15000×5%=750人 硕士4000×5%=200人 博士1000×5%=50人 这样保证样本的类别结构与总体类别结构一致(优点与缺点)
一、抽样的概念——何谓抽样? 所谓抽样,指的是从组成某个总体的所 有元素的集合中,按一定的方式选择或抽取 一部分元素(总体的一个子集)的过程。
总体与样本
总体
样 本
样本统计量 例如:样本 均值、比例 、方差
二、与抽样相关的一些概念
总体:所有元素的集合(N) 样本:从总体中按一定方式抽取出的一部分元素的 集合(n) 抽样单位:一次直接的抽样所使用的基本单位(个 体、群体、家庭、社区) 抽样框:抽样范围,总体中所有元素的名单 参数值:总体值 统计值:样本值(以样本统计值来推论总体参数值)
简单随机抽样课件
2.1.1简单随机抽样
三维目标
1.能从现实生活或其他学科中提出具有一定价值的统 计问题,提高学生分析问题的能力. 2.理解随机抽样的必要性和重要性,提高学生学习数 学的兴趣. 3.学会用抽签法和随机数法抽取样本,培养学生的应 用能力.
重点难点
教学重点:理解随机抽样的必要性和重要性,用抽签 法和随机数法抽取样本. 教学难点:抽签法和随机数法的实施步骤.
高中数学必修3——
第二章
2.1 随机抽样 2.2 用样本估计总体 2.3 变量间的相互关系
本章内容
本章介绍了从总体中抽取样本的常用方法, 并通过实例,研究了如何利用样本对总体的 分布规律、整体水平、稳定程度及相关关系 等特性进行估计和预测
总 体
抽样
分析 样 本 分 布
估计
简 单 随 机 抽 样
系 统 抽 样
分 层 抽 样
样 本 特 征 数
总 体 分 布
总 体 特 征 数
本章教材分析
现代社会是信息化的社会,数字信息随处可见,因此专门研究如何收集、 整理、分析数据的科学——统计学就备受重视.统计学是研究如何收集、整理、 分析数据的科学,它可以为人们制定决策提供依据.在客观世界中,需要认识 的现象无穷无尽.要认识某现象的第一步就是通过观察或试验取得观测资料, 然后通过分析这些资料来认识此现象.如何取得有代表性的观测资料并能够正 确地加以分析,是正确地认识未知现象的基础,也是统计所研究的基本问 题.本章主要介绍最基本的获取样本数据的方法,以及几种从样本数据中提取 信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内 容. 从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个 阶段都要学习收集、整理、描述和分析数据等处理数据的基本方法,教学目标 随着学段的升高逐渐提高.在义务教育阶段的统计与概率知识的基础上,《课 程标准》要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线 性回归的基本方法,了解用样本估计总体及其特征的思想,体会统计思维与确 定性思维的差异;通过实习作业,较为系统地经历数据收集与处理的全过程, 进一步体会统计思维与确定性思维的差异.
chap3简单随机抽样
V (y)
1 n
(1 f ) S
2
的直观意义
V ( y 取决 )
首先,对于大总体(N很大,f≈0), 于样本量,与抽样比无关。
V 其次, ( y )与总体变异程度成正比。
再证明:
1
E (s ) S
2
2
1 n 2 n 2 E (s 2 ) E ( y i y ) 2 E yi ny n 1 i 1 n 1 i 1
及其数值见表3.1 (P33) 总体均值: Y N 总体方差: S 2
1
Y
i 1
N
i
N
21 12 15 24 6 18 6
i
16
(Y N 1
i 1
1
Y ) 2 42
秘密:样本均值的均值=总体均值 样本方差的均值=总体方差 这是偶然的吗? E ( y ) Y E (s 2 ) S 2
1 Nn
不放回简单随机抽样(无重复抽样,每个样本抽中的概率: 1 C n N
实施方法
抽取方法1:一次抽n个签
抽取方法2:逐个抽取n个签 抽取方法3:实际运用中,常用抽取随机数
随机数产生方法:
随机数骰子:均匀材质的20面体, 每两个面标了数字 0,1,2……9。m个不同颜色的骰子一次可产生m位随机数, 或一个甩子掷m次产生。若m个数字均为0时,代表 10 m 。 随机数表:由0~9的随机数字组成的表,排列顺序也是随 机的。 【例1(P35)】 计算机产生 :伪随机数。对于抽取数额较大的样本时,一 般均采用计算机操作,可以很快获得所需样本。
P y Y u
简单随机抽样(三种抽样方法).ppt
笑一笑,十年少
一天,爸爸叫儿子去买一盒火柴,临出 门前,爸爸嘱咐儿子要买能划燃的火柴,儿 子拿着钱出门了,过了好一会儿,儿子才回 到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 儿子递过一盒划过的火柴,兴奋地说: “我每根都试过啦。”
问:这则笑话中,儿子采用的是什么调查方式? 这其中的全体是什么?这种调查方式好不好?
一个著名的案例1936年美国总统选举前,一份颇有名气的杂志 的工作人员做了一次民意测验,调查兰顿(时任堪萨斯州州长) 和罗斯福(时任总统)中谁将当选下一任总统。为了解公众意向, 调查者通过电话和车辆登记薄上的名单给一大批人发了调查表 (注意1936年电话和汽车只有少数富人拥有)。通过分析收回的 调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将获胜。
实际选举结果正好相反,罗斯福在选举中获胜!
你认为预测结果出错的原因是什么?
那么,怎样从总体中抽取样本呢?如何表示样本数 据?如何从样本数据中提取基本信息(样本分布、样本 数字特征等),来推断总体的情况呢?这些正是本章要 解决的问题。
抽样方法 2.1.1简单随机抽样
要了解全国高中生的视力情况,在全国抽取了 15所中学的全部高中生15000人进行视力测试。
谈谈你的看法:
统计的基本思想:
用样本估计总体,即通常不直接去研究总 体,而是通过从总体中抽取一个样本,根据 样本的情况去估计总体的相应情况。
妈妈:“儿子,帮妈妈买盒火柴去。” 妈妈:“这次注意点,上次你买的火柴好多划不着。” ……… 儿子高兴地跑回来。 孩子:“妈妈,这次的火柴全划得着,我每根都试过了。”
N
简单随机抽样法之一——抽签法
步骤: 1、把总体中的N个个体编号;
2、 把号码写在号签上,将号签放在一个容器中 搅拌均匀;
第三章_抽样与抽样分布2014分析
判断抽样 滚雪球抽样
湖北大学商学院 chen qianli
非概率抽样与概率抽样
• 统计推断是根据一部分单位构成的样本来
推断总体特征的统计方法,尽管样本的大 小很重要,但决定统计推断最关键的因素 是样本的代表性,即能否及在多大程度上 代表总体。 • 非概率抽样是指人为地选择一部分单位作 为样本的方法,尽管有时并不是那么明显。 如方便抽样和自愿样本。
湖北大学商学院 chen qianli
统计应用
“抓阄”征兵计划
然而结果是,有 73 个较小的号码被分配给了前半
年的日子,同时有110个较小的号码被分配给了后 半年的日子。换句话说,如果你生于后半年的某 一天,那么,你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人 在这种情况下,两个数字之间只应该有随机误差, 而73和110之间的差别超出了随机性所能解释的范 围。这种非随机性是由于乒乓球在被抽取之前没 有被充分搅拌造成的。在第二年,主管这件事的 部门在抓阄之前去咨询了统计学家 (这可能使生于 后半年的人感觉稍微舒服些)
2. 优点:操作简便,可提高估计的精度 3. 缺点:对估计量方差的估计比较困难
卫生统计学第八版李晓松第三章 数据的产生
第一节 数据的来源
(二)抽样调查数据与实验数据
2. 抽样调查数据
(1)抽样调查的基本思想就是对总体中的一部分,即样本进行了解进而得到总 体的信息。 (2)特点:观察者对被观察事物或现象在不进行任何干预的情况下所作的观察。
第五节 伦理问题
(一)知情同意与个人隐私
1. 知情同意 受试者在参与试验前需充分了解研究的性质和任何潜在风险。 2. 国际医学委员会建议使用下面的方法
(1)对在社区水平上进行的研究,需征得对此试验负责的卫生行政部门的知情同意。
(2)以医院为研究单位时,应当获得当地伦理审查委员会的同意。 (3)当研究单位是学校、工作场所或社区时,应征得有关负责人的同意;同时,尽 可能告知社区民众该试验的研究目的、预期收益和可能的不方便或危险,并告知不同 意的人如何免受干预措施的影响。
第二节 随机对照试验
(一)设计原则
3. 重复(repeat)
(1)每组只有一个试验对象,那么试验结果可能只依赖于具有这类潜在 特质的人被分到了哪个组,但是,如果试验对象足够多,这类人的效应就
能够被平均化,两组的区别就会减少。
(2)重复思想:运用足够多的样本来降低试验的随机误差。
第二节 随机对照试验
释数据收集或产生过程的核心思想。
第二节 随机对照试验
第二节 随机对照试验
(一)设计原则
1. 对照(control)
(1)案例:“胃冷冻法”治疗胃溃疡是否有效。
(2)安慰剂效应:由于心理效应所产生的虚假现象。
(3)对照思想:设置对照组以减少非处理因素对处理因素效应的影响。 (4)标准的对照试验:将试验对象随机分配到试验组和对照组,除了对试验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 N 1
N i 1
(Yi
Y
)2
N n S2 1 f S2
nN
n
12
引进N个随机变量:
证 法 二
1, ai 0,
若Yi入样, 若Yi不入样,
i
1,
2,
,
N
则 ai 都服从两点分布.
显然,
P(ai
1)
n N
;
P(ai
0)
N n ;
N
V(ai )
E(ai2 ) E(ai )2
n N
n N
中出现的次数为C
n1 N 1
。
y 1 n
y1 y2 L yn
1 n
C
n1 N 1
N
Yi
i 1
N
E
y
y
C
n N
C n1 N 1
Yi
i 1
nC
n N
1 N
N
Yi
i 1
Y
7
证 由于每个单元出现在总体所有可能样本
法 二
中的次数相同,因此 E y1 y2 L yn
一定是 Y1 Y2 L YN 的倍数,且这个倍
n
n1
P的区间估计:
P的置信度为1 的近似置信区间为:
pu
1 2
1 f pq , n1
修正为:
pu 1 2
1 f n1
pq
p (u
1 2
1 f pq 1 ),
n1
2n
p (u 1 2
1 f n1
pq
1 2n
)
*推导总体总量A=NP的估计量及其性质。
24
P的区间估计:
P的置信度为1 的近似置信区间修正为:
N i 1
(Yi
Y
)2
n1 N 1
i
j
(Yi
Y
)(Y j
Y
)
n1 N 1
N i 1
(Yi
Y
)2
n1 N 1
N i 1
(Yi
Y
)2
1 nN
1
n1 N 1
N i 1
(Yi
Y
)2
n1 N 1
N i 1
(Yi
Y
2 )
1 nN
N N
n 1
N i 1
(Yi
Y
)2
1 n
N N
n
数就是 n N ,
E y
1
n
E
n i 1
yi
1 n
n N
N
Yi
i 1
Y
n
N
Q E yi cYi
i 1
i 1
取Yi = Y0
则,nY0 cNY0
c n . N
8
证 法
引进N个随机变量:
三
1, ai 0,
若Yi入样, 若Yi不入样,
i
1,
2,
,
N
则 ai 都服从两点分布.
显然,
P(ai
nN
n
说明:总体方差
2
E(Yi Y )2
1 N
N
(Yi Y )2
i 1
但为了使大多数情形下公式表达更简练,定义总 体方差为:
S 2
1 N 1
N
(Yi
i 1
Y )2
N 2 N 1
10
证明性质2
证 法 一
V y E
y Y
2
1 n
2 1 n
2
E n i1 yi Y n2 E i1 ( yi Y )
n i 1
( yi
y )2
1 (
n1
n i 1
yi 2
ny 2 )
证明 :
s2
1 n1
n i 1
( yi
y )2
1 n1
n i 1
( yi
Y
)2
n( y
Y
)2
n
E ( yi i1
Y
)2
n N
N
(Yi
i 1
Y )2
n( N 1) S 2 N
E y Y 2 V y 1 f S2 N n S2
i j
(Yi Y )(Yj Y )中求和是对 N (N 1) 2项.
i j
11
V
y
1 n2
E
n i 1
( yi
Y
)2
1 n2
E
i j
(
yi
Y
)(
yj
Y
)
1 n2
n N
N
(Yi
i 1
Y )2
1 n2
n(n 1) N ( N 1)
(Yi
i j
Y )(Yj
Y)
1 nN
总体中具有所考虑特征的单元在总体中所占的比例
N
即总体比例:P
A
Yi
i 1
Y
NN
总体方差:S 2
1 N 1
N
(Yi
i 1
Y )2
N PQ N 1
其中,Q 1 P
22
2.样本 简单随机样本{y1……yn}
其中,yi
1,具有某种特征时 0,否则
样本比例
p
a n
1 n
n i 1
yi
y
n
(其中,a yi )
1 n2
E
n i 1
(
yi
Y
)2
1 n2
E
i
j
(
yi
Y
)(
yj
Y
)
n
E i1 ( yi
Y
)2
n N
N
(Yi
i 1
Y )2
n(n 1)
E i j
( yi
Y )( y j
Y )
N(N
1)
i j
(Yi
Y )(Yj
Y)
E
( yi Y )( y j Y )中求和是对 n(n 1) 2项,
2
n N
(1
n) N
n n1
E(aia j )
p(ai
1&aj
1)
N
(
N
ห้องสมุดไป่ตู้
) 1
Cov(i , j )
E(aia j ) E(ai )E(a j )
n N
(1
n N
)
n N
2
1 n (1 n ) N 1 N N
13
V(y)
1 n2
V
N i 1
iYi
1 n2
N i 1
i 1
样本方差
s2
1 n1
n
(yi
i 1
y)2
n pq n1
其中,q 1 p
二、估计量及其性质 性质1. 对于简单随机抽样,p为P的无偏估计,即E(p)=P.
性质2.
V( p) 1 f N PQ n N 1
23
性质3.
v( p) 1 f s2 1 f pq为V(p)的无偏估计
s2 / n
s( y)
y
t
1
(s y),y
2
t
1
(s y)
2
4
3.1 概述
一、简单随机抽样(或单纯随机抽样) 本书一般局限于不放回随机抽样
二、实施方法 三、地位、作用
是其他抽样方法基础 精度较高 但,样本比较分散(局限性)
5
3.2 总体均值与总量的简单估计
一、总体均值的估计 1.简单估计及其无偏性:
ˆ ~&N(0,1) V(ˆ )
则P(
ˆ V(ˆ )
u1 )=1 2
因此,d u V(ˆ) u S(ˆ)
1
1
2
2
Y的置信度为1 的近似置信区间为:
y
ut 11 22
1 f n
s,
y tu11 22
1 n
f
s
17
例1:在某地区10000户家庭中,按简单随机抽样抽取400户, 调查一个月的伙食费(单位:元)。经计算:
Y i
2
V
(ai
)
N i 1
N
YiYjCov(ai , a j )
ji
1 n2
n
N
(1
n N
)
N i 1
Yi2
N i 1
N
YiY j
ji
n (1 N
n N
)
1 N
1
1 n2
n (1 N
n N
)
1 N
1
(
N
1)
N i 1
Yi2
N i 1
N
YiYj
ji
1 (1 n
n N
Np
u1 2
N
pq , n1
Np
u
1
N
2
n1
pq
25
例3:从一份共有3042人的人名录中随机抽200人,发现38人 的地址已经变动。
(1)试估计这份人名录中需要修改的地址的人所占的比例及其 标准差,并以95%的置信度求P的置信区间 ;
(2)试估计这份人名录中需要修改的地址的人总数及其标准差, 并以95%的置信度求A的置信区间。
692 371 887 641 399 442 927 442 918 11
178 416 405 210 58 797 746 153 644 476 (1)计算样本均值与样本方差。 (2)若用 y 估计总体均值μ,按数理统计结果,