概率抽样也称随机抽样
2013年暨南大学432统计学[专业硕士]考研真题及详解【圣才出品】
![2013年暨南大学432统计学[专业硕士]考研真题及详解【圣才出品】](https://img.taocdn.com/s3/m/f6f6937eba1aa8114431d993.png)
2013年暨南大学432统计学[专业硕士]考研真题及详解一、统计学原理(共75分)(一)简答题(每题10分,共30分)1.简述概率抽样与非概率抽样。
答:(1)概率抽样①定义:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
在概率抽样中,每个单位被抽中的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。
②常用的概率抽样方式:简单随机抽样、分层抽样、整群抽样、系统抽样和多阶段抽样。
③概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,可以对估计的精度提出要求,计算出满足特定精度要求的样本量。
④概率抽样的技术含量比较高,无论是抽选样本还是对调查数据进行分析,都要求有较高的统计学专业知识,调查的成本比非概率抽样高。
(2)非概率抽样①定义:非概率抽样是相对于概率抽样而言的,抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
②常用的非概率抽样的方式:方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。
③非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。
也适合市场调查中的概念测试,如产品包装测试、广告测试等。
④非概率抽样的特点是操作简便、时效快、成本低,对于抽样中的统计学专业技术要求不是很高。
2.简述假设检验的基本步骤。
答:假设检验的基本步骤为:(1)根据所研究问题的要求提出原假设H0和备择假设H1,确定显著性水平。
显著性水平为犯第一类错误的概率;(2)根据已知条件确定合适的检验统计量,并确定统计量的分布,根据样本信息计算检验统计量的观测值;(3)根据计算的统计量,查阅相应的统计表,确定p值,将p值与显著性水平α比较,若p≤α,则拒绝H0,接受H1;若p>α,则不拒绝H0。
卫生管理(正高)题库
![卫生管理(正高)题库](https://img.taocdn.com/s3/m/80ce4d154693daef5ff73d4f.png)
卫生管理(正高)1、[多选题]反映门诊服务利用的指标有A.就诊率B.来就诊率C.患者就诊百分数D.每人每年平均就诊次数E.来住院率[参考答案]A,B,C,D[答案解析][难易程度]一般2、[多选题]关于社区卫生服务和区域卫生规划的关系,下列叙述正确的是A.发展区域卫生规划是实施社区卫生服务的基础B.区域卫生规划和社区卫生服务均符合卫生资源合理配置的要求C.区域卫生规划是以居民的主要卫生问题为规划依据,社区卫生服务是以居民的卫生需求为根据D.发展社区卫生服务可以使区域卫生规划更符合成本效益E.社区卫生服务以社区为范围[参考答案]B,C,D,E[答案解析][难易程度]一般3、[多选题]关于卫生服务研究,下列叙述正确的是A.卫生服务研究是以卫生服务的供方、需方和第三方作为研究对象的B.卫生服务研究的方法主要是综合评价法C.卫生服务研究可分为卫生系统研究、卫生工作研究、防治效果研究及行为医学研究等D.卫生服务研究的目的是将有限的卫生资源更好地分配和利用E.向居民提供预防、保健、医疗、康复、健康促进等卫生服务[参考答案]A,C,D,E[答案解析][难易程度]一般4、[多选题]关于需要、需求、利用,下列叙述不正确的是A.卫生服务需要都能转化成卫生服务需求B.卫生服务利用不能直接用于评价卫生服务的效果C.卫生服务利用主要取决于卫生服务需求D.卫生服务需要主要反映了居民对健康的一种主观愿望E.卫生服务需要包括个人觉察到的需要和由医疗卫生专业人员判定的需要[参考答案]A,C,D[答案解析][难易程度]一般5、[多选题]初级卫生保健的基本原则A.社会公正B.社区参与C.成本效果和成本效益D.部门间协作行动E.预防为主[参考答案]A,B,C,D,E[答案解析][难易程度]一般6、[多选题]常用的卫生政策分析方法有A.利益相关集团分析B.政策图解法C.政策网络分析D.场力分析法E.SWOT分析[参考答案]A,B,C,D,E[答案解析][难易程度]一般7、[多选题]健康危险因素的分类A.环境危险因素:自然环境和社会环境危险因素B.心理、行为危险因素C.生物遗传危险因素D.医疗卫生服务中的危险因素E.经济因素[参考答案]A,B,C,D,E[答案解析][难易程度]一般8、[多选题]研究疾病分布的意义有A.获得与病因假设有关的资料B.判断疾病的传染性C.获得与流行因素有关的资料D.掌握疾病流行规律和特点E.可为分析流行病学研究提供基础信息[参考答案]A,C,D,E[答案解析][难易程度]一般9、[多选题]生命质量评价的应用包括A.人群健康状况的评定B.疾病负担的评估C.临床疗效的评价D.健康影响因素及防治重点的选择E.其他领域的应用:如保险业等[参考答案]A,B,C,D,E[答案解析][难易程度]一般10、[多选题]卫生费用评价指标有A.卫生费用占有国民生产总值百分比B.人均卫生费用C.卫生各部门的投资比例D.门诊和住院费用构成E.医疗、卫生防疫和妇幼卫生费用的比例[参考答案]A,B,C,D,E[答案解析][难易程度]一般11、[多选题]健康相关生命质量评价包括A.基础病理研究B.生理状态C.心理状态D.社会功能状态E.主观判断与满意度[参考答案]B,C,D,E[答案解析][难易程度]一般12、[多选题]文化影响健康的特征是A.积累性B.无形性C.本源性D.软约束E.稳定性[参考答案]B,C,D,E[答案解析][难易程度]一般13、[多选题]危害健康的行为有A.合理营养B.吸烟C.规律生活D.性行为E.精神过度紧张[参考答案]B,E[答案解析][难易程度]一般14、[多选题]社会经济发展对健康也产生了不利的一面,主要表现在A.环境污染和破坏严重B.不良行为和心理压力突出C.人口数量过多和增长过快,对人类的健康也会产生负面影响D.社会负性事件增多E.社会流动人口增加,不利于计划免疫、传染病控制和妇幼保健工作[参考答案]A,B,D,E[答案解析][难易程度]一般15、[多选题]人口数量与健康之间的关系A.一定的人口规模和数量是社会存在和发展的最基本要素B.人口数量过多和增长过快,对人类的健康也会产生负面影响C.加重社会负担,影响人群生活质量D.加重教育及卫生事业负担,影响人口质量E.加重环境污染和破坏[参考答案]A,B,C,D,E[答案解析][难易程度]一般16、[多选题]调查表的结构主要包括哪几个方面A.说明(指导语)B.资料的登记C.调查项目D.编码E.结尾与备查项目[参考答案]A,C,D,E[答案解析][难易程度]一般17、[多选题]调查表的设计包括哪些步骤A.明确研究目的B.建立问题库C.设计调查表初稿D.初稿修改(试用和修改)E.效度和信度检验[参考答案]A,B,C,D,E[答案解析][难易程度]一般18、[多选题]问题设计的常见错误A.双重装填B.含糊不清C.抽象的问题D.诱导性的问题E.敏感性的问题[参考答案]A,B,C,D,E[答案解析][难易程度]一般19、[多选题]问卷中问题的排列应遵循的原则A.先排列容易回答的,无反感的问题B.先排列封闭式问题,后开放式问题C.按照一定的逻辑顺序排列D.检验信度的问题需要分隔开来E.先排列开放式问题,后排列封闭式问题[参考答案]A,B,C,D[答案解析][难易程度]一般20、[多选题]课题评价的原则是A.需要性原则B.创造性原则C.科学性原则D.可行性原则E.分层抽样[参考答案]A,B,C,D[答案解析][难易程度]一般21、[多选题]下列属于概率抽样的是A.系统抽样B.机械抽样C.分层抽样D.整群抽样E.定额抽样[参考答案]A,C,D[答案解析]概率抽样也称随机抽样,方式有以下几种:一、简单随机抽样。
统计学重点
![统计学重点](https://img.taocdn.com/s3/m/87cbef0e6bd97f192279e9dd.png)
第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。
第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。
每个单位被抽中的概率是已知的,或是可以计算出来的。
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。
(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。
概率抽样的名词解释
![概率抽样的名词解释](https://img.taocdn.com/s3/m/b711d34cf02d2af90242a8956bec0975f565a463.png)
概率抽样的名词解释概率抽样是一种统计学方法,旨在通过随机抽样来代表总体,从而进行统计推断。
它是基于概率理论的框架下进行的一种抽样方法。
本文将对概率抽样的定义、原理、常见的抽样方法以及其在实际应用中的重要性进行深入阐述。
一、概率抽样的定义和原理概率抽样是指在进行样本抽取时,通过使用概率理论和统计学原理,按照一定的随机性进行抽样的方法。
其目的是保证抽出的样本对于总体的代表性,从而可以通过对样本的研究状况,推断出总体的特征。
概率抽样的基本原理是每个个体被抽中的概率是已知的,并且每个个体被抽中是相互独立的。
二、常见的抽样方法1. 简单随机抽样:该方法是一种基本的抽取方法,以随机的方式从总体中抽取相同大小的样本。
简单随机抽样可以保证样本具有较高的代表性,但是在复杂的总体中抽取时有一定的困难。
2. 系统抽样:该方法是将总体中的个体按照一定顺序排列,并根据所设定的抽样间隔,从排列中按照固定规则抽取样本。
系统抽样相对简单,并且适用于总体中个体的数量是已知的情况。
3. 分层抽样:该方法将总体按照某些特征划分为多个层次,然后在每个层次中进行简单随机抽样。
分层抽样能够更好地保证样本的代表性,尤其适用于总体的特征分布不均匀的情况。
4. 整群抽样:该方法将总体划分为多个相似的群体,然后仅随机抽取部分群体进行研究。
整群抽样适用于群体内个体的特征相似、群体间特征差异较大的情况。
三、概率抽样在实际应用中的重要性概率抽样在实际应用中具有重要的意义。
首先,通过概率抽样得到的样本可以准确地代表总体,从而使得对总体特征的推断具有可靠性。
其次,概率抽样能够提供精确的抽样误差估计,帮助研究人员评估样本的可靠性。
此外,概率抽样还可以为后续的数据分析提供基础,如建立回归模型、计算置信区间等。
然而,概率抽样也存在一些限制和挑战。
首先,进行概率抽样需要对总体有一定的了解和描述,而在实际应用中,总体的特征可能是复杂而多样的,这给抽样带来困难。
其次,概率抽样可能会因为抽样误差、非响应率等问题导致样本的偏倚。
中级经济师-经济基础知识-基础练习题-第二十五章抽样调查-二、几种基本概率抽样方法
![中级经济师-经济基础知识-基础练习题-第二十五章抽样调查-二、几种基本概率抽样方法](https://img.taocdn.com/s3/m/7371e23077c66137ee06eff9aef8941ea76e4b90.png)
中级经济师-经济基础知识-基础练习题-第二十五章抽样调查-二、几种基本概率抽样方法[单选题]1.某单位共有职工1500人,其中管理人员300人,其余为普通员工,现采取分层抽样法抽取容量为200的(江南博哥)样本调查员工薪酬,那么管理人员、普通员工抽取的人数分别为()A.50,150B.40,160C.100,100D.60,140正确答案:B参考解析:先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。
如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。
样本量占总体容量的比=200÷1500。
所以,抽取管理人员数量=(200÷1500)×300=40人,抽取普通员工数量=(200÷1500)×1200=160人[单选题]5.最基本的随机抽样方法是()。
A.分层抽样B.简单随机抽样C.系统抽样D.整群抽样正确答案:B参考解析:本题考查简单随机抽样。
简单随机抽样是最基本的随机抽样方法。
[单选题]6.某校高三年级学生共1000人参加考试,将1000份试卷编好号码后,从中随机抽取30份计算平均成绩,此种抽样方法为()。
A.简单随机抽样B.系统随机抽样C.分层随机抽样D.整群抽样正确答案:A参考解析:本题考查简单随机抽样。
简单随机抽样分为有放回简单随机抽样和不放回简单随机抽样。
本题所述是不放回简单随机抽样。
[单选题]7.对农作物单位面积产量进行调查,按平原、丘陵、山区分组来抽选样本单位,然后在不同的组内独立、随机地抽取样本,此种抽样方法为()。
A.整群抽样B.分层抽样C.多阶段抽样D.简单随机抽样正确答案:B参考解析:本题考查分层抽样。
分层抽样是先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机地抽取样本。
[单选题]8.在大规模的抽样调查中,很有必要采用的调查方法是()。
A.分层抽样B.系统抽样C.整群抽样D.多阶段抽样正确答案:D参考解析:本题考查多阶段抽样。
统计学题库(3))贵州财经大学
![统计学题库(3))贵州财经大学](https://img.taocdn.com/s3/m/5e1e69a5fc0a79563c1ec5da50e2524de518d0ad.png)
简答题1.什么是描述统计?什么是推断统计?①描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
②推断统计是研究如何利用样本数据来推断总体特征的统计方法。
2.举例说明离散型变量和连续型变量?①离散型变量是只能取可数值的变量,它只能去有限个值,而且其取值都是以整位数断开,可以一一列举,如企业数,产品数量。
②连续型变量是可以在一个或多个中间取任何值的变量,它的取值是连续不断的,不能一一列举,如年龄,温度,零件尺寸的误差。
3.什么叫概率抽样?它具有哪些特点?概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会呗选入样本。
特点:①抽样时是按一定的概率以随机原则抽取样的。
②每个单位被抽中的概率是已知的,或是可以计算出来的。
③当样本对总体目标进行估计时,要考虑到每个样本单位被抽中的概率。
4.概率抽样方式有哪几种?非概率抽样可归纳为哪几种?概率抽样:简单随机抽样,分层抽样,整群抽样,系统抽样,多阶段抽样。
非概率抽样:方便抽样,判断抽样。
自愿抽样,滚雪球抽样。
配额抽样。
5.数据的预处理包括哪些内容?①数据审核就是检查数据中是否有错误。
②数据筛选是根据需要找出符合特定条件的某类数据。
③数据排序是指按一定的顺序,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。
6.制作统计表应该注意哪些问题?①要合理安排统计表的结构。
②表头一般应包括表号总标题和表中数据等内容。
③表中的上下两天横线一般用粗线,中间其他线要用细线。
④在使用统计表时,必要时可在表达下方注释,特别注意注明数据来源。
7.简述众数中位数和平均数的特点和应用场合。
①众数:主要用于分类数据集中趋势的度量;是一组数据的峰值;优点:不受极值的影响。
缺点:具有不唯一性;只有数据量较大时才有效果②中位数:主要用于顺序数据集中趋势的度量;是一组数据中间位置的代表制优点:不受极值的影响;数据分布偏斜程度较大时是一个不错的选择。
《抽样技术复习题》
![《抽样技术复习题》](https://img.taocdn.com/s3/m/40358def5f0e7cd185253618.png)
《抽样技术》期末复习1、设计效应(Deff )答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y)=,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差.设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。
如果deff 〈 1,则所考虑的抽样设计比简单随机抽样的效率高;反之,如果deff > 1,则所考虑的抽样设计比比简单随机抽样的效率低。
deff 对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量n '比较容易得到,如果可以估计复杂抽样的deff ,那么复杂抽样所需的样本量为:n = n deff '⨯。
2、概率抽样答:概率抽样也称随机抽样。
概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。
具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。
(2)每个单元被抽中的概率是已知的,或是可以计算出来的.(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。
也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关.概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。
从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目.因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本.3、非抽样误差答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。
同抽样误差相比,非抽样误差有如下特点:(1)非抽样误差不是由于抽样的随机性带来的,所以在抽样调查中,它不可能随着样本量的增大而减小。
(2)在抽样调查中,由于非抽样误差的影响,往往造成估计量的有偏。
抽样方法
![抽样方法](https://img.taocdn.com/s3/m/061960116bd97f192279e91e.png)
模拟市场调查大赛
4、滚雪球抽样
(1)定义:先选择一组调查单位,对其实施调查 之后,再请他们提供另外一些属于研究总体的调 查对象,调查人员根据所提供的线索,进行此后 的调查。这个过程持续下去,就会形成滚雪球效 应。 (2)特点: ①适合于对稀少群体和特定群体研究; ②优点:容易找到那些属于特定群体的被调查者, 调查的成本也比较低。
“随机数表”
(5)例题:从班上50个同学中抽取10个同学参加 某项活动,采用“随机数表法”进行抽样。
广东商学院华商学院经济系
模拟市场调查大赛
2、分层抽样(stratified sampling)、
在上面的例题中,“从班上50个同学中抽取10个同学 参加某项活动”,若班男生30人,女生20人,按照性别 之比,在抽取的10个同学中,应该男生6人,女生4人, 如此才能保证男女生性别上的公平。但在实际操作中,采 用简单随机抽样进行抽样,得到的样本,男女生之比会出 现偏离3:2的情况,即会出现性别上不公平的现象,因此 我们需要对简单随机抽样进行改进,得到分层抽样。
模拟市场调查大赛
抽样方法
主讲 石立
广东商学院华商学院经济系
模拟市场调查大赛
调查数据往往是通过从总体中抽取样本进行 调查,抽取样本的方法直接影响着样本的可信度, 常用的抽样方法有两大类,各五种方法:
一、概率抽样:简单随机抽样;分层抽样; 整群抽样;系统抽样;多阶段抽样 二、非概率抽样:方便抽样;判断抽样;自 愿样本;滚雪球抽样;配额抽样
广东商学院华商学院经济系
模拟市场调查大赛
2、判断抽样
(1)定义:研究人员根据经验、判断和对研究对 象的了解,有目的选择一些单位作为样本。 (2)特点: ①判断抽样是主观的,样本选择的好坏取决于调研 者的判断、经验、专业程度和创造性; ②抽样成本比较低,容易操作 ③样本是人为确定的,没有依据随机的原则,调查 结果不能用于对推断总体
抽样方法
![抽样方法](https://img.taocdn.com/s3/m/34ba9c212af90242a895e5c4.png)
优点:非常方便、省时省力 缺点:不能推断总体、代表性差、偶然性强。
2、配额抽样
又称定额抽样,是指调查人员将调查总体样本按一定标志 分类或分层,确定各类(层)单位的样本数额,在配额内任意 抽选样本的抽样方式。 操作步骤: (1)选择“控制特征”作为细分群体的标准。 (2)将总体按“控制特征”细分,使其分成若干个子总体。 (3)确定各子总体样本的大小,通常是将总样本数按各子总体在 总体中所占的比例分配。 (4)各子总体样本量确定后,即可为每一访问员指派“配额”, 要求他们在某一个子总体中访问一定数额的样本。
使用理由: (1)缺少基本单位的 名单而难以直接从总体中 抽取所要调查的基本单位。 (2)总体基本单位在 空间上的分布很广泛。 (3)抽样调查本身目 的的需要。(人口普查后 的抽样复查)
注意: (1)它的随机性体现在群与群之间 不重叠。 (2)如果把每一个群看成一个单位, 那么整群抽样就是以群为单位的纯随机 抽样。 (3)误差取决于群间差异,而不受 群内பைடு நூலகம்位之间差异的影响,与分层抽样 相反。 (4)是多阶段抽样的前提和基础。
配额抽样与分层随机抽样相似,但不同的是,分层抽样中各 层的子样本是随机抽取的,而配额抽样中各层的子样本是非随机 抽取的。
配额抽样分为两种:独立控制配额抽样、相互控制配额抽样。
独立控制配额抽样 独立控制配额抽样是指调查人员只对 样本独立规定一种特征(或一种控制特性) 下的样本数额。 如在消费者需求调查中,我们按年龄 特征,分别规定不同年龄段的样本数目, 就属于独立控制配额抽样。人们通常把消 费者的年龄、性别、收入分别进行配额抽 样而不考虑三个控制特性的交叉关系。
1、简单随机抽样
——直接抽选法、抽签法、随机数表法
简单随机抽样是最基本的 概率抽样,又称纯随机抽样。 简单随机抽样是对总体中的所 有个体按完全符合随机原则的 方法(随机数表)抽取样本, 它保证了总体中的每一个个体 都有同等的被抽取的概率。 当研究的总体并不太大, 或者当总体的元素有完备的名 单时,简单随机抽样就非常适 用。 基本步骤: (1)找寻准确的抽样框:准确的 抽样框包含两个含义:完整 性与不重复性; (2)给抽样框中的所有个体编号; (3)确定样本数量:在总体数量 已确定的情况下,一般先估 计一个大约的样本数量,然 后再用比例确定准确的样本 数量; (4)运用随机数表抽取样本。
统计学复习
![统计学复习](https://img.taocdn.com/s3/m/456bc740767f5acfa1c7cd89.png)
第2章统计数据的搜集2.1 数据的来源对使用者,数据来源有两种方式:1 直接来源2 间接来源数据的直接来源(原始数据)通过调查方法获得的数据称为调查数据,而通过实验方法得到的数据称为实验数据. (1)调查方法常用于社会科学(通常取自有限总体)▽普查▽抽样调查(2)实验数据常用于自然科学, 目前也被逐渐运用到社会科学中.2.2 调查数据2.2.1 概率抽样与非概率抽样1 概率抽样(probability sampling)概率抽样也称随机抽样,主要有如下几个特点:(1)按一定的概率抽取样本,即抽取样本时使每个单位都有一定的机会被抽中.(2)每个单位被抽中的概率已知(或是可以计算出来的).(3)按样本对总体目标量的估计,估计量与每个样本单位被抽中的概率有关.1 概率抽样(probability sampling)抽取样本时是依据随机原则,主要方式有:(1)简单随机抽样(2)分层抽样(3)整群样本(4)系统抽样(5)多阶段抽样2 非概率抽样(non-probability sampling)抽取样本时并不是依据随机原则,而是根据研究目的和对数据的要求,采用某种方式从总体中选择部分单位进行调查.主要方式有:(1)方便抽样(2)判断抽样(3)自愿样本(4)滚雪球抽样(5)配额抽样3 概率抽样与非概率抽样的比较(1)概率抽样▽按随机原则抽选样本▽可以根据调查的结果推断总体(2)非概率抽样▽不按随机原则抽选样本▽不能根据调查的结果推断总体第二节统计数据的类型第 3 章数据的图表展示3.1 数据的预处理▽数据的审核—检查数据中的错误▽数据的筛选—找出符合条件的数据▽数据排序—升序和降序▽数据透视表—提取有用的信息图3-31数据的类型与图示方法第四章数据的概括性度量统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平均数;二是分布的离中趋势,反映各数据远离其中心值的程度,如标准差;三是分布的偏态和峰度,反映数据分布的形状。
周围神经损伤题库2-0-8
![周围神经损伤题库2-0-8](https://img.taocdn.com/s3/m/cf65c0719b89680202d82597.png)
周围神经损伤题库2-0-8问题:[单选]某机构十分关心小学生每周看电视的时间。
该机构随机抽样300名小学生家长对他们的孩子每周看电视的时间进行了估计。
结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。
该机构搜集数据的方式是()。
A.概率抽样B.非概率抽样C.实验调查D.观察调查概率抽样也称随机抽样,是指遵循随机原则进行的抽样。
概率抽样有两条基本准则:①样本单位是随机抽取的;②调查总体中的每个单位都有一个非零的入样概率。
该机构抽取的300名小学生家长是随机的,每个小学生的家长都有被抽到的概率,因此该机构搜集数据的方式是概率抽样。
问题:[单选,A2型题]男性,30岁。
桡骨茎突部狭窄性腱鞘炎松解术后,患者仍诉持续性疼痛,并不断加重,伴有切口远侧感觉迟钝,叩诊瘢痕较痛。
可能存在的问题是()A.桡神经感觉支神经瘤B.拇长伸肌的一个副支仍未松解C.顽固性腱鞘炎,需进一步固定解决D.反射性交感神经营养障碍,或上肢营养障碍综合征E.局部感染切口远侧感觉迟钝,说明有神经功能不全,原来的疼痛与现在感觉到的不同,叩诊瘢痕很痛为神经瘤的特点。
问题:[单选,A2型题]男性,35岁。
刀刺伤右臀部后,出现右下肢运动与感觉异常。
最可能是损伤了()A.坐骨神经B.胫神经C.腓总神经D.臀大肌E.臀部肌群(11选5 )问题:[单选,A2型题]男性,18岁。
车祸伤后3小时入院。
查体:右膝关节明显畸形、肿胀、压痛。
X线示:右膝关节后脱位。
该患者最可能伴随的神经损伤是()A.腓总神经B.胫神经C.坐骨神经D.腓深神经E.腓浅神经膝关节脱位易损伤胫神经。
问题:[单选,B型题]尺神经支配()A.肱二头肌B.拇内收肌C.拇长伸肌D.肱三头肌E.肱桡肌问题:[单选,B型题]桡神经深支支配()A.肱二头肌B.拇内收肌C.拇长伸肌D.肱三头肌E.肱桡肌问题:[单选,B型题]肌皮神经支配()A.肱二头肌B.拇内收肌C.拇长伸肌D.肱三头肌E.肱桡肌问题:[单选,B型题]尺神经损伤后()A.垂腕垂指畸形B.爪形手畸形C.猿手畸形D.纽扣样畸形E.鹅颈样畸形1.尺神经损伤者由于指屈肌及指伸肌无手内肌的对抗作用,出现环指和小指掌指关节过伸,指间关节屈曲而呈爪状。
概率抽样和非概率抽样
![概率抽样和非概率抽样](https://img.taocdn.com/s3/m/311eb594970590c69ec3d5bbfd0a79563c1ed40d.png)
什么是概率抽样?什么是非概率抽样?概率抽样和非概率抽样的区别是什么?概率抽样:又称随机抽样。
概率抽样以概率论和数理统计为依据,通过随机化的机械操作程序随机取得样本,所以能避免抽样过程中的人为因素的影响,保证样本的客观性。
虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质和特征。
现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本。
概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。
概率抽样主要分非概率抽样又称为不等概率抽样或非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法,也就是说在抽样时,总体单元的入样概率事先未知,入样与否与研究人员的经验和主观意志有很大关系。
因此,由于不是严格按随机抽样原则来抽取样本,所以非概率抽样在应用时更需研究人员具备深厚的背景知识与相关经验。
它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。
虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。
常用的非概率抽样有方便抽样、定额抽样、立意抽样、雪球抽样等。
1.方便抽样:又称偶遇抽样。
在这种抽样中,研究者选择那些最容易接近的人作为研究对象。
此法常用于干预试验或预调查时,也可用于调查收尾时补缺。
2.立意抽样:又称目的抽样和判断抽样。
根据研究目的的需要和研究者的主观判断,选择研究对象。
3.雪球抽样是指选择并调查几个具有研究目的所需要的特征的人,再依靠他们选择合乎研究需要的人,后者又可选择更多合乎研究需要的人,以此类推下去,样本就像滚雪球一样越来越大。
《社会调查与研究方法》名词解释
![《社会调查与研究方法》名词解释](https://img.taocdn.com/s3/m/6984040fbe1e650e52ea99d0.png)
名词解释1.社会调查研究:人们有计划、有目的地运用一定的手段和方法,对有关社会事实进行资料收集整理和分析研究,进而做出描述、解释和提出对策的社会实践活动和认识活动。
它是一个由系统的理论和方法组成的完整的知识体系,其主要内容包括社会调查研究的基本理论、基本方法、基本类型、基本程序和基本原则等。
2.定性研究:以现有的文献资料或调查材料为依据,对某一社会现象运用演绎、归纳、比较、分类、矛盾分析等方法,以判断事物性质为目的的的社会调查研究。
定性研究在调查方式上多通过大量个案调查获得资料,得出结论,所得出的结论多具有概括性或概貌性,只能向人们展示被调查事物的基本性质,若想了解具体事物的状况还需进行更为细化的调查。
此外定性研究由于缺乏精确数据的支持,势必造成可比性较差。
它一般用于对社会结构和社会关系的研究、历史问题的研究、探索性研究或者是对难以定量的问题的研究。
3. 定量研究:运用概率、统计原理对社会现象的数量特征、数量关系和事物发展过程中的数量变化等方面进行的研究。
在收集资料方面,定量研究强调如果不能进行普查,则应当运用抽样技术选择样本;在对样本进行调查研究时,定量研究必须有一定结构,能对调查过程、调查方法和调查技术实施严格控制,对调查结果能够进行量化。
定量研究具有科学性、客观性的特点,调查结果更为细化。
4.普查:普查是普遍调查或全面调查的简称,是指对研究对象的全体进行无一例外的逐个调查。
其目的是把握某一时期的一定范围内的社会现象的总体情况。
普查一般适用于宏观调查。
普查又分为一次性普查和常规性普查(经常性普查)。
它是最全面、最准确的调查类型,能够较精确地反映总体的基本情况、一般特征和性质。
但普查往往是对调查对象最一般、最基本的描述,调查内容较缺乏深度。
此外,普查规模大、人力、物力、资金消耗巨大。
5.抽样调查:非全面调查的一种,是从调查对象的总体中,按照一定的方式选出一部分个体进行调查,并通过所选样本的情况来推论总体状况。
统计基础知识与统计实务:统计调查考试试题
![统计基础知识与统计实务:统计调查考试试题](https://img.taocdn.com/s3/m/f7bfc3b218e8b8f67c1cfad6195f312b3169ebc2.png)
统计基础知识与统计实务:统计调查考试试题1、单选统计调查的基本要求是()。
A.连续性B.客观性C.准确性和及时性D.完整性和连续性正确答案:C参考解析:统计调查必须达到两个基本要求:①准确性,即真(江南博哥)实可靠,符合客观实际情况;②及时性,即按规定时限完成调查任务,保证统计资料不失时效。
统计调查的准确性和及时性是衡量统计工作质量的重要标志。
2、单选调查项目()。
A.是依附于调查单位的基本标志B.是依附于调查对象的基本指标C.与调查单位是一致的D.与填报单位是一致的正确答案:A参考解析:调查项目是指对调查单位所要调查的主要内容,也就是调查单位的各个标志的名称。
3、多选影响样本单位数的主要因素有()。
A.抽样推断的可靠程度B.总体标志的变异程度C.极限误差的大小D.抽样方法与组织方式的不同E.人力、物力和财力的可能条件正确答案:A, B, C, D, E4、多选概率抽样的特点包括()。
A.按照随机原则抽取样本B.根据样本资料推断总体数值C.是唯一可选择的调查方法D.费用相对较低E.时效性较差正确答案:A, B5、单选典型调查是从被调查对象中()。
A.按照随机原则选取若干单位进行调查B.按照调查目的有意识地选取若干处于较好状态的单位进行调查C.按照随机原则选取若干具有代表性的单位进行调查D.按照调查目的有意识地选取若干具有代表性的单位进行调查正确答案:D6、判断题我国的人口普查每10年进行一次,因此,它是一种经常性调查方式。
()7、判断题在进行区间估计时,可靠程度越大,则估计的精确程度越高。
()正确答案:错参考解析:在进行区间估计时,可靠程度越大,则置信区间越宽,估计的精确程度越低。
8、单选统计调查所搜集的资料包括原始资料和次级资料两种,原始资料与次级资料的关系是()。
A.次级资料是从原始资料过渡来的B.二者不相干C.原始资料就是次级资料D.次级资料质量上次于原始资料正确答案:A9、单选重点调查中重点单位是指()。
经济师《经济基础》考点复习:概率抽样
![经济师《经济基础》考点复习:概率抽样](https://img.taocdn.com/s3/m/e22a2fce2cc58bd63186bd4b.png)
经济师《工商管理》考点复习:概率抽样概率抽样也称随机抽样,是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。
中级经济师考试工商概率抽样具有三个特点:(1)概率抽样是以随机原则为基础的;(2)概率抽样必须通过一定的随机化程序来实现;(3)概率抽样的抽样误差是可计算和可控制的。
概率抽样的方法主要有五种:1.简单随机抽样简单随机抽样也称纯随机抽样,即对总体单位不进行任何分组排列,仅按随机原则直接从总体中抽取样本,使总体中的每一个单位均有同等的被抽取机会。
如果总体规模不太大,实施起来也不困难,如果总体规模相当大,简单随机抽样实施起来就很难,因为首先它要求一个包括所有总体单位的抽样框,这很难办到。
其次用简单随机抽样得到的样本单位较为分散,调查不易实施,因此在实际中直接采用简单随机抽样的并不多。
例如:采用简单随机抽样对全国的大学生进行调查,第一、很难拿到所有大学生的名单,第二、这些大学生太分散,不容易进行调查。
2.等距抽样等距抽样也称为系统抽样或机械抽样。
首先它将总体中各单位按一定顺序排列,根据样本容量的要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位。
根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。
按照具体实施等距抽样的做法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。
例:某连锁超市要从某地区的100个超市中抽取10个进行调查,采用等距抽样如下:第一步,按销售额由小到大的方式将总体中所有个体排序并编号:1、2、 (100)第二步,计算抽样间隔K,总体数(N)÷样本数(n)=100 ÷ 10=10,抽样距离为10;第三步,用简单随机抽样在抽样距离内(1~K)确定起始编号,假设抽中3;第四步,根据起始号和抽样间隔确定10个应抽取的个体,最终抽取的编号分别为3、3+1K、3+2k、…、3+9K,即3、13、23、33、…、93共10个超市组成样本。
概率抽样名词解释
![概率抽样名词解释](https://img.taocdn.com/s3/m/8dfa828cf424ccbff121dd36a32d7375a517c65c.png)
概率抽样名词解释解释概率抽样又称随机抽样,即在抽样时,母体中每一个抽样单位被选人样本的概率相同。
随机抽样具有健全的统计理论基础,可用概率理论加以解释,是一种客观而科学的抽样方法。
一般而言,概率抽样调查的基本组织形式分为单阶段抽样和多阶段抽样两大类。
单阶段抽样是指只需一次的抽样过程,它有以下四种:简单随机抽样、等距抽样、分层抽样、整群抽样。
多阶段抽样是指将总体分层、再逐层抽取样本的过程。
多阶段抽样在总体特别大时使用。
不管哪种随机抽样,样本必须始终被看作总体的近似而不是总体自身。
概率抽样是一种数理统计学上的专业化术语。
它是指根据随机性理论在单位样本量中抽取同样数目的样本作为研究对象。
理论上讲,每个样本被抽中的概率相等,这样就保证了抽选样本中没有掺杂所谓的人为因素。
概率抽样是定量研究中的基本抽样方式,也是定量研究效度的体现方式概率抽样的具体抽样方法还有很多。
简单随机抽样法、系统抽样法以及分层抽样法等。
总体而言,建立在数学概率理论基础上的概率抽样方法有着无可避免的自然科学化的倾向。
在一般情况下的定性研究中。
研究者较少使用这种抽样方式选取研究对象。
但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质,特征.概率抽样主要分为简单随机抽样,系统抽样,分类抽样,整群抽样,多阶段抽样等类型.现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本。
原则概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。
根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。
因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。
原理概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。
简单随机抽样名词解释
![简单随机抽样名词解释](https://img.taocdn.com/s3/m/9719e067ff4733687e21af45b307e87101f6f87f.png)
简单随机抽样名词解释简单随机抽样又称概率抽样或纯随机抽样,它是一种不考虑总体的特性而完全从样本统计量抽取样本的随机抽样方法。
简单随机抽样时应遵循以下几点:简单随机抽样,又称概率抽样或纯随机抽样,是一种不考虑总体的特性而完全从样本统计量抽取样本的随机抽样方法。
由于这种方法不受样本的具体情况的影响,因此能够得到有关的样本资料比较符合实际的结果。
为了保证数据的可靠性,在抽取样本时还需要注意以下事项:(1)每个被抽中的样本都应当是独立的;(2)至少要抽取3个样本,以免遗漏重要的样本;(3)抽取的样本应当代表总体的一部分;(4)样本应当尽可能包括更多的个体,使样本含量足够大,避免抽取的样本对研究对象的性质产生显著的影响。
(2)方差极大法。
所谓方差极大法是指每次取的样本都按大的样本来估计总体,并将样本统计量代入概率密度函数求解的一种方法。
由于样本含量较大,样本容量也就越大,可以减小由抽样误差造成的抽样误差。
但是,如果每个样本都按大的样本估计总体,则要求样本统计量与总体密度函数之间的关系服从正态分布。
当总体的密度函数非正态分布时,往往采用方差极大法进行抽样。
方差极大法主要适用于离散变量的统计分析,如正态分布、指数分布、二项分布等。
方差极大法又分为等组距方差极大法和等比例方差极大法两种,常用的是等组距方差极大法。
等组距方差极大法就是每个样本都按大的样本估计总体。
5、抽样分布。
抽样分布是指某一样本出现的各种类型的机会。
样本各种类型出现的频率之和即为该样本的抽样分布。
每个样本出现的频率即为该样本的分布,在离散分布中称为频数分布,在连续分布中称为概率分布。
频数分布和概率分布是统计分析中最常用的分布。
例如在一般的正态分布中,各类型的频数分别是0、 0、 0、 0、 0、0。
在二项分布中,各类型的频数是0、 1、 0、 1、 1、 1。
对于正态分布、二项分布,一般都需要知道其样本的分布,也就是说样本分布必须是已知的。
例如,在研究指数分布时,我们通常需要知道一个样本的平均值和标准差。
概率抽样的组织方式
![概率抽样的组织方式](https://img.taocdn.com/s3/m/5be1ce4e1fd9ad51f01dc281e53a580216fc50ae.png)
概率抽样的组织方式
答:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
调查的实践中经常采用的概率抽样方式有以下几种:
(1)简单随机抽样。
简单随机抽样指从包括总体N个单位的抽样框中随机地、逐个地抽取n个单位作为样本,每个单位入样的概率是相等的;
(2)分层抽样。
分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;
(3)整群抽样。
整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接随机抽取一个群,然后对中选群中的所有单位全部实施调查;
(4)系统抽样。
系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;
(5)多阶段抽样。
采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。
将这种方法推广,使抽样的段数增多,就称为多阶段抽样。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率抽样也称随机抽样1.概率抽样也称随机抽样2.特点按一定的概率以随机原则抽取样本●抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样1.从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的2.最基本的抽样方法,是其它抽样方法的基础3.特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便4.局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样1.将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差系统抽样1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位2.优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难多阶段抽样1.先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查二阶抽样中群是初级抽样单位,第二阶段抽取的是最终抽样单位。
将该方法推广,使抽样的阶段数增多,就称为多阶段抽样2.具有整群抽样的优点,保证样本相对集中,节约调查费用3.需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开4.在大规模的抽样调查中,是经常被采用的方法非概率抽样1.相对于概率抽样而言2.抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查3.有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式方便抽样1.调查过程中由调查员依据方便的原则,自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产品柜台前对路过顾客进行的调查2.优点:容易实施,调查的成本低3.缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体判断抽样1.研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本有重点抽样,典型抽样,代表抽样等方式2.判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性3.抽样成本比较低,容易操作4.样本是人为确定的,没有依据随机的原则,调查结果不能用于推断总体自愿样本1.被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本2.自愿样本与抽样的随机性无关样本是有偏的不能依据样本的信息推断总体滚雪球抽样1.先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
这个过程持续下去,就会形成滚雪球效应2.适合于对稀少群体和特定群体研究3.优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低配额抽样1.先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位2.操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似3.抽取具体样本单位时,不是依据随机原则,属于非概率抽样概率抽样与非概率抽样的比较1.概率抽样依据随机原则抽选样本样本统计量的理论分布存在可根据调查的结果推断总体2.非概率抽样不是依据随机原则抽选样本样本统计量的分布是不确定的无法使用样本的结果推断总体抽样误差1.由于抽样的随机性所带来的误差2.所有样本可能的结果与总体真值之间的平均性差异3.影响抽样误差的大小的因素样本量的大小总体的变异性非抽样误差1.相对抽样误差而言2.除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异3.存在于所有的调查之中概率抽样,非概率抽样,全面性调查4.有抽样框误差、回答误差、无回答误差、调查员误差、测量误差误差的控制1.抽样误差可计算和控制2.非抽样误差的控制调查员的挑选调查员的培训督导员的调查专业水平调查过程控制●调查结果进行检验、评估●现场调查人员进行奖惩的制度分类数据的图示—饼图1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题3.绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定环形图1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究4.用于展示分类和顺序数据数值型数据的整理与展示组中值= (下限值+上限值)/2分组数据—直方图1.用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图分组数据—直方图(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据未分组数据—茎叶图1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留最后一位数字6. 茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据未分组数据—箱线图1.用于显示未分组的原始数据的分布2.由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数M e和两个四分位数(下四分位数Q L和上四分位数Q U)连接两个四分位数画出箱子,再将两个极值点与箱子相连接该箱线图也称为Median/Quart./Range箱线图时间序列数据—线图1.表示时间序列数据趋势的图形2.时间一般绘在横轴,数据绘在纵轴3.图形的长宽比例大致为10 : 73.一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断多变量数据—雷达图1.也称为蜘蛛图(spider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度1.也称为蜘蛛图(spider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度1.也称为蜘蛛图(spider chart)2.显示多个变量的图示方法3.在显示或对比各变量的数值总和时十分有用3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度众数1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据中位数1.排序后处于中间位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据4.各变量值与中位数的离差绝对值之和最小,即四分位数1.排序后处于25%和75%位置上的值2.不受极端值的影响3.计算公式平均数1.也称为均值2.集中趋势的最常用测度值3.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.有简单平均数和加权平均数之分6.根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数,记为?x简单平均数设一组数据为:x1 ,x2 ,… ,x n (总体数据x N)离中趋势1.数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离散程度)3.从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值极差1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布R = max(x i) - min(x i)平均差1.各变量值与其平均数离差绝对值的平均数2.能全面反映一组数据的离散程度3.数学性质较差,实际中应用较少方差和标准差1.数据离散程度的最常用测度值2.反映了各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差(标准差),记为σ2(σ);根据样本数据计算的,称为样本方差(标准差),记为s2(s)样本方差和标准差。