统计学第4章抽样调查
统计学第四章课后习题答案
第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。
从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。
3、简述四分位数的计算方法。
答:四分位数是一组数据排序后处于25%和75%位子上的值。
四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。
中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。
它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。
4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。
当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。
5、简述众数、中位数、平均数的特点和应用场合。
答:众数是数据中出现次数次数最多的变量值。
主要应用于分类数据。
中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。
平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。
6、简述异众比率、四分位差、方差、标准差的使用场合。
答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。
四分位差主要用于测度顺序数据的离散程度。
方差和标准差适用于测度数值型数据的离散程度。
7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。
其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。
还有就是在假设检验和估计中应用。
教育与心理统计学 第四章 抽样理论与参数估计考研笔记-精品
第四章抽样理论与参数估计第一节抽样理论的基本知识分层抽样,又叫分层随机抽样,这种抽样方法是按照总体已有的某些特征,承认总体中已有的差异,按差异将总体分为几个不同的部分,每一部分称为一个层,在每一个层中实行简单随机抽样。
它充分利用了总体的已知信息,因而是一种非常适用的抽样方法,其样本代表性及推论的精确性一般优于简单随机抽样。
分层的原则是层与层之间的变异越大越好,各层内的变异要小。
试述分层抽样的原则和方法?分层抽样是按照总体上已有的某些特征,将总体分成几个不同部分,在分别在每一部分中随机抽样。
分层的总的原则是:各层内的变异要小,而层与层之间的变异越大越好。
在具体操作中,没有一成不变的标准,研究人员可根据研究需要依照多个分层标准,视具体情况而定。
⑷两阶段随机抽样两阶段随机抽样首先将总体分成M个部分,每一部分叫做一个"集团"(或"群"),第一步从M个集团中随机抽取m个"集团”作为第一阶段样本,第二步是分别从所选取的m个"集团”中抽取个体(g构成第二阶段样本。
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些,但是,两阶段抽样简便易行,节省经草贼,因而它是大规模调查研究中常被使用的抽样方法。
例如,如果我们要了解全国城市初中二年级学生的身高,第一步我们可以从全国几百个城市中随机抽取几十个城市作为第一阶段的样本。
第二步,在第一阶段随机抽取出来的城市中再随机抽取初中二年级的学生。
(二)非旃抽样非概率抽样不是完全按随机原则选取样本,有方便抽样、判断抽样。
方便抽样是由调查人员自由、方便地选择被调查者的非随机选样。
判断抽样是通过某些条件过滤,然后选择某些被调查者参与调查的抽样法。
当采取非概率抽样的方法选取样本时,研究者要说明采用此种方取样的原因以及对研究结果可能造成的影响。
第二节抽样分布[统计量分布、基本随机变量函数的分布]总体:又称母全体、全域,指具有某种特征的一类事物的全体。
统计学第四章习题答案-贾俊平
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数.(3)计算销售量的标准差.(4)说明汽车销售量分布的特征。
解:Statistics10Missing0Mean9.60Median10.00Mode10Std。
Deviation4。
169Percentiles25 6.255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数.Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18。
75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0。
75×2=26。
5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1。
080;Kurtosis=0。
773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41—15)÷6=4。
3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待.为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客.得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟.第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8要求:(1)画出第二种排队方式等待时间的茎叶图。
统计学基础ppt课件
4-4
统计学 参数估计在统计方法中的地位
基础
统计方法
描述统计
推断统计
参数估计
假设检验
4-5
第 4 章 抽样与参数估计
4.1 抽样与抽样分布
4 - 14
统计学 基础
有关抽样的几个基本概念
4、抽样比 抽样比是指在抽选样本时,所抽取的样本
单位数n与总体单位数N之比。一般地讲, n≥30为大样本,n<30为小样本。研究社会 经济现象时,通常采用大样本进行抽样调查。
对于给定的研究对象,全及总体是唯一确定 的,而样本总体不是唯一的,它是随机的。
有关抽样的几个基本概念
2、抽样框
目标总体规定了理论上的抽样范围,但是进行抽样 的总体单位与目标总体有时是不一致的,因而, 在抽样之前,还必须明确实际进行抽样的总体范 围和抽样单位。
抽样框是指用以代表总体,并从中抽选样本的一个
框架。
目标总体与抽样框有时是一致的;多数情 况下,目标总体的范围要率大于抽样框。
4. 局限性
当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其它辅助信息以提高估计的效率
4 - 17
统计学 基础
抽样方法和样本可能数目
1、重复抽样
重复抽样也叫重置抽样,是指每次抽取一个元素 后又放回,重新参加下一次的抽选,直到抽取n个 元素为止。全及总体单位数始终保持不变,每个总 体单位都有被重复抽中的可能。 重复抽样通常要考虑单位排列顺序,如电话号 码中的“8651”和“1568”不同。
其样本可能数目为 m重 N n
(04)第4章+抽样与抽样分布
4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大
第四章 抽样调查
抽样分布原理
(一)基本符号 1.总体 A = {a1 , a2 ,, aN }, A = N . 1.总体 2.从总体中抽取n个对象构成样本,共有k个样 2.从总体中抽取n个对象构成样本,共有k 本,设样本的符号为:
A1 , A2 ,, Ak , k = C , Ai = n, i = 1, 2,, k
本章复习思考题
1,什么叫抽样?从总体中抽样样本需满足哪些 条件? 2,简单随机抽样?机械抽样?抽样调查法的性 质?随机抽样的原则? 3,抽样误差?影响抽样误差大小的因素?抽样 误差与调查误差,系统误差的区别? 4,抽样分布?平均误差?抽样分布原理? 5,教材第三章课后习题P84的第二题,P85的第 ,教材第三章课后习题P84的第二题,P85的第 四题,P86的第六题. 四题,P86的第六题.
(三)问卷设计的原则 (三)问卷设计的原则 题意清楚,明确,易懂;口语化;避免一题两问;避免 诱导;公正客观;逻辑一致性;完整性(问题和备选 答案);不要用否定形式提问;不要直接询问敏感性 问题. (四)问卷的结构 1,四结构说:标题(简明扼要,概括专项调查的主 题);指导语(包括调查的目的和意义;问题及备选 答案的必要解释,调查须知及其他事项说明等;如涉 及需为被调查者保密的内容,需申明予以保密);主 体内容(内容不宜过多,过繁,应根据需要而确定); 结束语(提出几个开放性的问题或让被试提出对本研 究的建设性的意见;表示对被试合作的感谢). 2,六结构说:在四结构说的基础上,加上被调查者的 基本信息;作业证明的记载.
无限总体时, 有限总体时,
σ σx = n
σ N n σx = × N 1 n
对于有限总体,样本容量与总体容量的 比n/N称为抽样比例. n/N称为抽样比例. 一般认为,n/N<0.05时,就可以省略修 一般认为,n/N<0.05时,就可以省略修 正系数.
统计学第4章习题答
第四章综合指标一.填空题:1.总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量。
2.总量指标按其反应的时间状况不同,可分为时期指标和时点指标。
3.总量指标按其采用计量单位不同,可分为实物指标. 价值指标和劳动量指标。
4.算术平均数的基本公式总体标志总量/总体单位数。
5.相对指标按其是否拥有计量单位可区分为无名数和名数。
6.某地区去年的财政总收入为250亿元。
从反映总体的时间上看,该指标是时期指标;从反映总体的内容上看,该指标是总体标志总量。
7.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明各变量值分布的离中趋势。
8. 标志变异指标是用以反映总体各单位标志值差异程度的指标。
9.强度相对指标数值大小,如果与现象的发展程度或密度成正比,则称之为正指标,反之则称为逆指标。
10.用标准差比较两个变量数列平均数的代表性的前提条件是这两个变量数列的平均数相等。
二.单项选择题:1.下列指标属于总量指标的是( D )。
A.人均粮食产量B.资金利税率C.产品合格率D.学生人数2.下列指标属于比例相对指标的是( B )。
A.工人出勤率B.农轻重的比例关系C.每百元产值利税额D.净产值占总产值的比重3.下列指标中属于时点指标的是( D )。
A.国内生产总值B.流通费用率C.人均利税额D.商店总数4.下列指标中属于时期指标的是(D )。
A.商场数量B.营业员人数C.商品价格D.商品销售量5.下列属于结构相对数的是(C )。
A.人口出生率B.产值利润率C.恩格尔系数D.人口性别比6.某地区2006年的人均粮食产量393.10公斤,人均棉花产量3.97公斤,人均国民生产总值为1558元,它们是( D )。
A.结构相对指标B.比较相对指标C、比例相对指标 D.强度相对指标7.某企业产品单位成本计划2007年比2006年降低10%,实际降低15%,则计划完成程度为( B )。
A.150%B.94.4%C.104.5%D.66.7%8.第五次全国人口普查结果,我国每10万人中具有大学程度的为3611人。
统计学第4章练习题及答案
第4章 练习题 一、单项选择题1.平均指标反映了( )①总体次数分布的集中趋势 ②总体分布的特征③总体单位的集中趋势 ④总体次数分布的离中趋势2.某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128元、148元、200元,计算结果均值为128=X 元,标准差为( )①σ=33 ②σ=34 ③σ=34.23 ④σ=35 3.众数是总体中下列哪项的标志值( ) ①位置居中 ②数值最大 ③出现次数较多 ④出现次数最多4.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为( )①600元 ②533.33元 ③466.67元 ④500元5.标志变异指标说明变量的( )①变动趋势 ②集中趋势 ③离中趋势 ④一般趋势 6.标准差指标数值越小,则反映变量值( )①越分散,平均数代表性越低 ②越集中,平均数代表性越高 ③越分散,平均数代表性越高 ④越集中,平均数代表性越低 7.在抽样推断中应用比较广泛的指标是( )①全距 ②平均差 ③标准差 ④标准差系数二、多项选择题1.根据标志值在总体中所处的特殊位置确定的平均指标有( ) ①算术平均数 ②调和平均数 ③几何平均数 ④众数 ⑤中位数2.影响加权算术平均数的因素有( )①总体标志总量 ②分配数列中各组标志值③各组标志值出现的次数 ④各组单位数占总体单位数比重 ⑤权数3.标志变异指标有( )①全距 ②平均差 ③标准差 ④标准差系数 ⑤相关系数 4.在组距数列的条件下,计算中位数的公式为( )①i f S fL M mm e ⋅-+=+∑12②i f S fU M m m e ⋅-=∑12--③i f S fL M mm e ⋅-+=∑12- ④i f S fU M mm e ⋅-=+∑12-⑤i f S fU M mm e ⋅-=∑12-+5.几何平均数的计算公式有( )①n n n X X X X ⋅⋅⋅121-Λ ②nX X X X nn ⋅⋅⋅121-Λ③122121-++++n X X X X nn -Λ ④∑f fIIX ⑤n IIX三、计算题1.某企业360名工人生产某种产品的资料如表1:试分别计算7、8月份平均每人日产量,并简要说明8月份平均每人日产量变化的原因。
统计学中的抽样与调查
统计学中的抽样与调查统计学是一门研究数据收集、整理、分析和解释的学科。
在统计学中,抽样和调查是非常重要的方法,用于获取和分析数据,从而得出对总体的推断和结论。
一、抽样的定义和目的抽样是从总体中选取一部分个体进行调查或研究的方法。
总体是要研究或调查的全部对象,例如,全国的人口或一种药物的副作用。
抽样的目的是通过对样本群体进行观察和测量,从而推断出总体的特征。
抽样可以帮助统计学家节约时间和资源,同时保证研究结论的准确性和可靠性。
二、抽样的方法1. 简单随机抽样:简单随机抽样是一种基本的抽样方法,每个个体都有相等的机会被选中。
使用随机数表或随机数发生器来选择样本,确保样本的代表性和无偏性。
2. 系统抽样:系统抽样是按照固定的间隔从总体中选取样本。
例如,从一个市场中每隔五个人选择一个进行调查,这样可以保证样本的分布均匀。
3. 分层抽样:分层抽样是将总体划分为几个不同的层次,然后从每个层次中进行抽样。
这样可以确保在样本中包含不同层次的特征,提高结果的代表性。
4. 整群抽样:整群抽样是将总体划分为若干个互不重叠的群体,然后从这些群体中随机选取几个进行调查。
这种方法常用于人口普查中,可以减少调查的复杂性。
三、调查的步骤和技巧1. 设计调查问卷:在进行调查之前,首先要设计调查问卷。
问卷应该简洁明了,问题要具体、明确,以确保得到准确和有用的信息。
2. 选择合适的调查方法:根据被调查者的特点和调查的目的,选择合适的调查方法,例如面对面访谈、电话调查、在线问卷等。
3. 实施调查:按照设计好的方案和计划进行调查,确保采集到充分、准确的数据。
调查人员应该专业、礼貌,并保证被调查者的隐私和权益。
4. 数据分析和解释:收集到数据后,使用统计方法对数据进行分析和解释。
常用的数据分析方法包括描述统计分析、推断统计分析等。
5. 结果报告和应用:根据数据分析的结果,撰写报告并对调查结果进行解释和应用。
报告应该简明扼要,结论准确可靠。
统计学-抽样调查的基本方法习题及答案
统计学-抽样调查的基本方法习题及答案一、选择题1. 抽样调查是指从人口中随机抽取个体作为调查对象,并通过对这些个体的调查研究来推断总体特征。
下面哪种抽样方法是最常用的?- A. 简单随机抽样- B. 系统抽样- C. 分层抽样- D. 整群抽样选择答案:A2. 如果我们希望对某个地区的顾客群体进行调查,首先将地区划分为多个不同的区域,然后从每个区域中随机选取一些顾客进行调查,这种抽样方法称为:- A. 简单随机抽样- B. 系统抽样- C. 分层抽样- D. 整群抽样选择答案:C3. 在统计调查中,"样本容量"是指:- A. 做出判断的人数- B. 地区划分数- C. 调查问卷的页数- D. 参与调查的个体数量选择答案:D二、填空题1. 抽样误差是指抽出的样本与总体之间的差异。
为了减小抽样误差,可以增加样本的<div style="">容量</div>。
2. "抽样分布"是指在相同的总体中,根据不同的抽样数据得出的统计量的<div style="">分布</div>。
3. "简单随机抽样"是一种可能的抽样方法,其中每个个体都有相同的<div style="">机会</div>被选中。
三、问答题1. 请简要说明简单随机抽样的基本步骤。
答案:简单随机抽样的基本步骤包括:- 确定总体和样本的定义;- 根据总体的特征确定抽样目标;- 设定样本容量;- 使用随机数生成器或其他随机选择方法,从总体中随机选取样本;- 进行调查或实验,收集样本数据;- 对样本数据进行统计分析,得出结论,并推断总体特征。
2. 请详细描述分层抽样的原理和适用场景。
答案:分层抽样是根据总体的特征将总体划分为多个层级,然后从每个层级中随机选取样本。
统计学习题(抽样分布、参数估计)
统计学习题(抽样分布、参数估计)练习题第1章绪论(略)第2章统计数据的描述2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。
其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。
调查结果如下:4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。
(2)绘制一张条形图,反映学历分布。
2.2为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A 8.269504 7.51773 9.2624117.9148948.411348B 7.447368 8.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。
2.3下面是一个班50个学生的经济学考试成绩:88569179699088718279 988534744810075956092 83646569996445766369 6874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。
(2)用茎叶图将原始数据表现出来。
2.4如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。
男149 161761821310 80 951081414 0 144145151515161681882121 0 21211052121211116817521 0 356462121212121312121 0 2121212121375375383838 8 45566065120 30120 7521女120 3334537437538700 90700 60141516212121211517170 0 0 0 0 0 0 0 5 521 0 1752121214043451217517 8 181818518519195196202021 0 21212121212121333335 0 3636363840474865055(1)按近视度数分别对男女学生进行分组。
《社会调查理论与方法》第四章 社会调查的抽样
党派 共和党 民主党
支持率 57% 43%
选举结果——两个星期之后,美国总统选举 的结果罗斯福以61%的得票率获得第二任任期。 相较于罗斯福的523张选举人票,兰登仅得到8张。
预测为什么失败呢?
3. 决定抽 样方案
4. 实际抽 取样本
5. 评估样 本质量
•确定样本的
数量
•选择抽样的 由于拒访或样 具体方法:总 本缺失,可根 体规模的大小; 据实际情况抽 调查对象的特 取预备样本
,在抽样的过程中,总体的每一个元素都有同等的 机会入选样本,而且每个元素的抽取都是相互独立 的。
特点:总体中的任何个体都同样有被抽取的平等机 会。
主要方法: • 总体较小时:抓阄,抽签法 • 总体较大时:摇号法,随机数字表
随机数法的具体步骤
例题:要从3000个人(或其他分析单位)的总体中用简单随 机抽样的方法选取100个人作为样本进行调查。
随机数表
简单随机抽样方法的适用性:
➢ 总体数量较小 ➢ 易获得所有样本单位的完整列表 ➢ 样本单位之间差异程度较小或难以分组 ➢ 总体在空间范围内较为集中 ➢ 采用电子技术辅助调查的方法时,如CATI
(二)系统抽样
按无关标志; 按有关标志
系统抽样( systematic sampling):又叫等距抽样
一天,爸爸叫儿子小华去买一盒火柴。临出门 前,爸爸嘱咐儿子要买能划燃的火柴。小华拿着钱 出门了,过了好一会儿,小华才回到家。
“火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 小华递过一盒划过的火柴,兴奋地说:“我每 根都试过啦。”
思考:得到火柴能否划燃的信息准确吗?
这样做有什么后果?
在日常生活当中所 熟知的抽样有哪些?
《统计学》抽样调查习题和答案
六.计算题部分1、对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%?答案:解:2%,41004,100====t p n 0196.0100)04.01(04.0)1(=-=-=n p p p μ039.00196.02=⨯==∆p p t μ p p p P p ∆+≤≤∆-039.004.0039.004.0+≤≤-P0.1%------7.9% ∴废品率不超过6%2、某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。
要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。
(2)以同样概率估计全乡农户年纯收入总额的区间范围。
答案: 解: 2001002000===n x σμ 39220096.1=⨯==∆x x t μ x x x X x ∆+≤≤∆- 3921200039212000+≤≤-X11608-----12392(元) 5000×11608------5000×12392(元)3、某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间。
答案:解:2,300,6000,100====t x n σ (小时)30100300===n x σμ (小时)60302=⨯==∆x x t μ x x x X x ∆+≤≤∆- 606000606000+≤≤-X 5940-----6060(小时)4、 从某年级学生中按简单随机抽样方式抽取50名学生,对邓小平理论课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(99.73%t=3、68.27%t=1)的概率保证程度推断全年级学生考试成绩的区间范围。
统计学习题 第四章 抽样估计
第四章抽样估计一、判断题1.抽样估计的目的是用以说明总体特征。
2.抽样分布就是样本分布。
3.既定总体在当抽样方法、抽样组织形式和样本容量确定时,样本均值的分布惟一确定。
4.样本容量就是样本个数。
5.在抽样中,样本容量是越大越好。
6.抽样的目的是判断样本估计值是否处于以总体指标为中心的某规定区域范围内。
7.当估计量有偏时,人们应该弃之不用。
8.对于一个确定的抽样分布,其方差是确定的,因而抽样标准误也是确定的。
9.抽样极限误差越大,用以包含总体参数的区间就越大,估计的把握程度也就越大,因此极限误差越大越好。
10.非抽样误差会随着样本容量的扩大而下降。
二、单项选择题1.想了解学生的眼睛视力状况,准备抽取若干学校、若干班级的学生进行测试,则()。
A.观测单位是学校B.观测单位是班级C.观测单位是学生D.观测单位可以是学校、也可班级或学生2.下列误差中属于非一致性的有()。
A.估计量偏差B.偶然性误差C.抽样标准误D.非抽样误差3.抽样估计中最常用的分布理论是()。
A.t分布理论B.二项分布理论C.正态分布理论D.超几何分布理论4.抽样标准误大小与下列哪个因素无关?()A.样本容量B.抽样方式、方法C.概率保证程度D.估计量5.下列关于抽样标准误的叙述哪个是错误的?()A.抽样标准误是抽样分布的标准差B.抽样标准误的理论值是惟一的,与所抽样本无关C.抽样标准误比抽样极限误差小D.抽样标准误只能衡量抽样中的偶然性误差的大小三、计算分析题1. 某小组5个工人的每周工资分别为520、540、560、580、600元,现从中用简单随机抽样形式(不重复抽样)随机抽取2个工人周工资构成样本。
要求:(1)计算总体平均工资的标准差;(2)列出全部可能的样本平均工资;(3)计算样本平均工资的平均数,并检验其是否等于总体平均工资;(4)计算样本平均工资的标准差;(5)用抽样平均误差的公式计算并验证是否等于(4)的结果。
2.从某大型企业中随机抽取100名职工,调查他们的工资。
抽样调查,习题答案
抽样调查,习题答案篇一:《抽样技术》第四版习题答案第2章2.1 解:?1? 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1。
100?2?这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是抽中的编号为36~63的每个单元的入样概率都是2,而尚未被1001。
100?3?这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是1,所以这种抽样是等概率的。
10002.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大间为??z?_E近似服从标准正态分布,Y的195%的置信区_z。
1而V1?f2S中总体的方差S2是未知的,用样本方差s2来代替,置信区间n为,?_2。
?由题意知道,y?9.5,s?206,而且样本量为n?300,N?50000,代入可以求得v(y)?_1?f21?50000s??206?0.6825。
将它们代入上面的式子可得该市居民n300 日用电量的95%置信区间为??7.8808,11.1192??。
下一步计算样本量。
绝对误差限d和相对误差限r的关系为d?rY。
根据置信区间的求解方法可知____PyYrY1P1_2_rY根据正态分布的分位数可以知道P。
?Z1??,所以Vz?2?_rY??11?也就是S2nnNz??2?_222_rY1?。
22Nz/2S把y?9.5,s?206,r?10%,N?50000代入上式可得,n?86以总体比例P的195%的置信区间n?1可以写为pzp?z?,将p?0.35,n?200,N?10000代入可得置信区间为??0.2844,0.4156??。
2.5 解:利用得到的样本,计算得到样本均值为?2890/20?144.5,从而估计小区的平均文化支出为144.5元。
统计学第四章的教材
几个直观的结论
1. 样本均值的均值(数学期望)等于总体均值(式中:M为样本 n 数目); xi 22 23 28 i 1 25 X M 16 2. 抽样误差是随样本不同而不同的随机变量。抽样误差均值 等于0; xX 0
3. 样本均值的方差等于总体方差的1/n。
3
(二)抽样估计的一般步骤 1、设计抽样方案 2、 随机抽取样本(从总体随机抽取部分单位构成样本) 3、搜集样本资料(对样本单位进行调查登记) 4、整理样本资料(审查、分组汇总、计算样本指标的
数值,即计算估计量的具体数值)
5、估计总体指标(即估计总体参数)
总体参数与样本估计量的关系——对于特定的目 的,总体是惟一的,所以参数也是惟一的;而由 于样本是随机的,所以样本估计量是随机变量。
(3)抽样方法。相同条件下,重复抽样的抽样平均误 差大比不重复抽样的抽样平均误差大。
(4)抽样组织方式。由于不同抽样组织方式有不同的 抽样误差,所以,在误差要求相同的情况下,不同抽 样组织方式所必需的抽样数目也不同。
21
不知道总体方差时如何计算
用样本方差代替计算 用过去(总体或样本)方差代替计算 用同类现象(当前 或过去、总体或样本) 方 代替计算 有若干个方差可选择时,选方差最大者 (注意:对比率,即选择最接近0.5的值所 得的方差最大)
进无偏估计量。
29
二、区间估计
(一)区间估计的原理 区间估计就是根据样本估计量以一定 可靠程度推断总体参数所在的区间范围。 特点:考虑了估计量的分布,所以它能 给出估计精度,也能说明估计结果的把握 程度(置信度)。
30
(一)总体均值的置信区间
(1)假定条件
总体服从正态分布,且总体方差(2)已知
统计学课后答案
第四章 抽样分布与参数估计3.某地区粮食播种面积5000亩,按不重复抽样方法随机抽取了100亩进行实测,调查结果,平均亩产450公斤,亩产量标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量和总产量的置信区间。
解:已知X =450公斤,n =100(大样本),n/N=1/50,11≈-Nn,不考虑抽样方式的影响,用重复抽样计算。
s =52公斤,1-α=95%,α=5%。
这时查标准正态分布表,可得临界值:96.1025.02/==z z α该地区粮食平均亩产量的置信区间是:1005296.14502⨯±=±nsz x α=[439.808,460.192] (公斤) 总产量的置信区间是:[439.808⨯5000,460.192⨯5000] (公斤) =[2199040,2300960](公斤)4.已知某种电子管使用寿命服从正态分布。
从一批电子管中随机抽取16只,检测结果,样本平均寿命为1490小时,标准差为24.77小时。
试以95%的置信度估计这批电子管的平均寿命的置信区间。
解:(1)已知X =1490小时,n =16,s =24.77小时,1-α=95%,α=5%。
这时查t 分布表,可得 2.13145)1(2/=-n t α该批电子管的平均寿命的置信区间是:1677.2413145.214902⨯±=±nst x α=[ 1476.801,1503.199](小时)因此,这批电子管的平均寿命的置信区间在1476.801小时与1503.199小时之间。
6.采用简单随机重复抽样的方法,从2 000件产品中抽查200件,其中合格品190件。
要求:(1)计算合格品率及其抽样平均误差。
(2)以95.45%的置信度,对合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其置信度是多少? 解:(1)合格品率:P=190/200⨯100%=95% 抽样平均误差:np p p )1()(-=σ=0.015(2)%3%95%100015.02%95)(22/02275.02/±=⨯⨯±=±==p Z P Z Z σαα]19601840[]2000%982000%92[(%]98%92[,,的置信区为:件合格品数量,:合格品率的置信区间为=⨯⨯)(3)%64.87)(8764.01,54.1%31.2%100015.0%31.2)(2/2/2/==-==⨯⨯==∆z F Z Z p Z ασααα查表得7.从某企业工人中随机抽选部分进行调查,所得工资分布数列如下:试求:(1)以95.45%的置信度估计该企业工人平均工资的置信区间,以及该企业工人中工资不少于800元的工人所占比重的置信区间;(2)如果要求估计平均工资的允许误差范围不超过30元,估计工资不少于800元的工人所占比重的允许误差范围不超过10%,置信度仍为95.45%,试问至少应抽多少工人? 解(1)通过EXCEL 计算可得: X =816元,n =50人,s =113.77元。
社会调查方法04抽样(二)
高收入层样本数目:200 ×1200000/4000000=60户 中收入层样本数目:200 ×2400000/4000000=120户 低收入层样本数目:200 ×400000/4000000=20户
分层抽样的适用性
1.当一个总体内部分层明显时,分层抽样 能够克服简单随机样和等距抽样的缺点。
2.分层抽样可以提高总体参数估计的精确 度。 3.有些研究不仅要了解总体的情况,而且 还要了解某些类别的情况。 4.便于行政管理。同一层可看作一个总体, 因此每层可由专人进行管理。
比较分层抽样和整群抽样分层抽样整群抽样样本每层均要选取子样本作为总样本的一部分只选择某几个子群作为整体的代表层的划分具有较高的代表群间异质性低层与层的关系层的划分具有较高的代表性即层之间异质性高群间异质性低层内性质层内则尽可能同质群内异质性高变量选择研究变量的选择与研究问题高度相关研究变量与研究问题相关思考和讨论??对北京市现住人口进行调查由于流动人口的不确定性很难得到现住人口的住户清单
(三)因总体单位排列不同导致的不同 抽样
1. 无序抽样——总体按与调查项目无关的指标 排列,如住户调查按照门牌号码抽 评价:容易忽视总体已有信息(与简单随机抽 样一样)
2. 有序抽样——总体按与调查项目有关的指标 排列,如住户调查按照平均收入抽 评价:样本单位容易偏大或偏小
(三)因总体单位排列不同导致的不同抽样
三. 分层抽样(Stratified Sampling)
1.分层抽样的内涵: 分层抽样是将总体N依照某一种或某几种特征分 为几个子总体(层),然后从每一层中采取简 单随机抽样或等距抽样方式抽取一个个子样本 n1,n2……将这些子样本合在一起即为总体样本n。 ★ 使用什么分层变量? 一般是选择与调查目标变量高度相关的变量。 ★ 要协调层的数量和每层样本量 ★ 分层抽样适用于总体数目较多,异质,一 个或多个变量可能影响调查结果的情况,且对 所研究的总体有详细的名单。分层后,每层同 质,层之间不同质,然后在每层按照比例抽。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•2、不重复抽样
• 不重复抽样是指每次从总体中抽取一个单位进行观察 后不再把这个单位重新放回总体,这个总体单位不再继续 参加下次抽选。这种抽选法也称为不回置抽样或不重置抽 样。
• 不重复抽样法由于每次抽中的单位不再放回总体中, 每抽选一次,总体中的单位就减少一个,使连续抽选的 各个单位不相互独立。但是总体中各单位被抽中的机会 仍然是均等的!
•
大数定律
• 大数定律是指在随机试验中,每次出现的结 果不同,但是大量重复试验出现的结果的平 均值却几乎总是接近于某个确定的值。其原 因是,在大量的观察试验中,个别的、偶然 的因素影响而产生的差异将会相互抵消,从 而使现象的必然规律性显示出来。
• 例如,观察个别或少数家庭的婴儿出生情况 ,发现有的生男,有的生女,没有一定的规 律性,但是通过大量的观察就会发现,男婴 和女婴占婴儿总数的比重均会趋于50%。
•随机样本: 与总体分布 特征相同
•非随机样本 :与总体分 布特征不同
•
•特点之三:存在估计误差,并可加以控制。
•抽样 推断 误差
•登记误 差
•代表性误 差
•用设计、培训、管理等 方法消除
•用抽样方法、样本容量 等手段控制
•
二、抽样调查的适用范围
• 抽样调查方法是市场经济国家在调查
方法上的必然选择,和普查相比,它具有准 确度高、成本低、速度快、应用面广等优点 。
•
• (四)抽样框 • 抽样框 的形式一般有两种:
一览表:表中列出所有总体单位。 地图:在地图上将调查单位分布在各个地区,
然后根据地区进行抽样。
•
• (五)样本可能数 目
• 样本可能数目又称样本个数,是指从一个有 N个单位的总体中抽取容量为n的样本时,有 可能出现的所有样本的个数。
•
•抽样调查的理论基础
•
• 抽样调查(抽样推断)的概念
•抽样推断:即根据样本统计量推断总体参数 的过程。也叫抽样估计。 抽样调查的特点之一:由部分推断总体
•全及总体指标:参 数(未知量)
•统计推断
•样本总体指标:统计 量(已知量)
•
• •特点之二:按随机原则抽取样本
•并非所有 的抽样估 计都按随 机原则抽 取样本。 也有非随 机抽样。
•
第二节 抽样误差
• 一、抽样误差的概念
•抽样误差是指在抽样调查中,由于随机抽样的 偶然性因素,使样本的结构不足以代表总体的 结构,而引起的样本指标与总体指标之间的绝 对离差。 •即指随机误差,这种误差是抽样调查固有的误 差,是无法避免的。
•
抽样误差的影响因素:
• 1. 总体标志变异程度。——正方向变化关系
统计学第4章抽样调查
2020年7月12日星期日
• 重点与难点:
• 重点: 抽样调查的意义 抽样平均误差的意义及计算 总体参数的点估计与区间估计的方法
• 难点: 抽样平均误差的计算 总体参数的区间估计
•
• 学习内容:
一、抽样调查的基本问题 二、抽样误差 三、参数估计 四、抽样调查的组织形式
•
第一节 抽样调查的基本问题
•
•一般适用于以下范围:
• 1.总体范围较广,不需要了解每一个别单位的情况 ;
• 2.对破坏性或消耗性产品的质量进行检验;
• 3.对普查或全面调查的统计资料进行检查和修正。
•
三、抽样调查的几个基本概念
• (一) 总体和样本
•总体:所要调查观察的全部事物。
•
总体单位数用N表示。
•总体可以分为有限总体和无限总体。
•样本:从总体中抽取出来那部分单位所组成的集合体。
• 样本是总体的一个缩影。
• 抽样总体的单位数,即样本容量,用n表示。
•
n ≥ 30 大样本
•
n < 30 小样本
•
(二) 参数和统计量
• 参数:描述总体特征的指标。 • 统计量:描述样本特征的指标。 • 抽样推断的目的就是要通过对样本的平均数、成数的
• 不重复抽样按是否考虑抽选样本单位的顺序,又可分 为有顺序不重复抽样和无顺序不重复抽样两种。有顺序 不重复抽样即通常所说的不重复排列。按这种抽样方法 只要有一个单位不同,就算不同的样本。
•
• (四)抽样框
• 抽样框 ——是指包含有全部总体单位及其主要指
标特征的一个框架或列表。
以确定总体的抽样范围和结构。设计出了抽 样框后,便可采用抽签的方式或按照随机数 表来抽选必要的单位数。若没有抽样框,则 不能计算样本单位的概率,从而也就无法进 行概率选样。
标准差(或方差)的测量来推断总体的相应特征值。
• 主要统计特征数及符
总体号参数
样本统计量
特
总体单位数N
征
总体平均数
数Hale Waihona Puke 总体成数P及总体标准差
符
总体方差
号
样本(单位数)容量n 样本平均数 样本成数p 样本标准差S 样本方差
•
(三) 抽样方法
• 重置抽样:即有放回抽样。 • 不重置抽样:即无放回抽样,每个总体只
• 一、抽样调查的意义 • 一般所讲的抽样调查,即指狭义的抽样
调查(随机抽样):按照随机原则从总体中抽 取一部分单位进行观察,并运用数理统计的 原理,以被抽取的那部分单位的数量特征为 代表,对总体作出数量上的推断分析。
•
抽样调查的特点 :
• 1.按随机原则抽选调查单位; • 2.用样本推断总体; • 3.在调查之前可以计算和控制抽样误差 。
• 2. 抽样单位数目的多少,即样本容量。
• ——反方向变化关系
能有一次被抽中的机会。
•
•样本单位的抽选方法
• 在组织抽样调查时,根据样本单位是否重复抽取 ,分别有重复抽样和不重复抽样两种方法。
•1、重复抽样 • 重复抽样是指每次从总体中抽取一个单位进行观察 后,再把这个单位重新放回总体,使之继续参加下次抽 选。这种抽选法也称为回置抽样或重置抽样。
• 重复抽样法由于前一次抽中的单位又被放回总体中 ,不会影响后面的抽选,所以总体中每个单位被抽中的 机会均等连续抽选各单位都是独立进行的的。
•
中心极限定理(P97)
• 大数定律揭示了大量随机变量的平均结果,但 没有涉及到随机变量的分布的问题。而中心极 限定理说明的是在一定条件下,大量独立随机 变量的平均数是以正态分布为极限的。
•论证了: •1、如果总体很大,而且服从正态分布,样本平均数 的分布也同样服从正态分布。 •2、如果总体很大,但不服从正态分布,只要样本容 量足够大,样本平均数的分布趋近于正态分布。 •3、样本平均数的的平均数,等于总体平均数。