第2章 分类数据的检验

合集下载

《统计学》课程 学习指南

《统计学》课程  学习指南

第一章统计学及其基本概念一、学习指导本章介绍统计学的一些基本问题。

通过本章学习可以知道和掌握统计的含义,统计的内容和统计学的产生和发展。

认识数据的类型,理解和掌握统计学的基本概念。

了解统计计算的软件工具。

本章各节的主要内容和学习要点见下表。

二、主要术语1.统计:统计工作、统计资料和统计学。

2.统计工作:为了认识和管理的需要,对社会经济现象和自然现象进行数量收集的活动。

3.统计资料:统计工作过程中所取得的各项数字资料以及与之相关信息的总称。

4.统计学:在统计工作的经验积累到一定程度时自然产生的,它是收集、整理、描述和分析统计数据的方法和技术,为决策提供“量”方面的依据。

5.描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。

6.推断统计:研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。

7.数据:进行各种统计、计算、科学研究或技术设计等所依据的数值。

8.分类数据:对事物进行分类的结果。

9.顺序数据:也称等级数据,是对事物进行分类的结果,并表现出明显的顺序或等级关系。

10. 数值型数据:使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体数值。

11. 时间序列数据:在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况。

12. 截面数据:在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻或某一时间段的变化情况,13. 面板数据:对若干个单位在不同时间进行重复跟踪调查所形成的数。

14.统计总体:是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。

15.个体:构成统计总体的个别事物,又称为总体单位。

16.样本:指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的样本总体,其目的是用来推断总体。

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1。

1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1。

2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1。

3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据.它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的.实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1。

7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学重点

统计学重点

第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。

第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。

每个单位被抽中的概率是已知的,或是可以计算出来的。

当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。

2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。

(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。

贾俊平统计学第7版课后习题答案

贾俊平统计学第7版课后习题答案

贾俊平《统计学》课后习题答案在线阅读:https:///cUb7v8DC
【解析】数据的测量尺度有四种:①分类尺度,即名义尺度。按照事物的某种属性对其进行 平行的分类,数据表现为类别,如“性别”。②顺序尺度。对事物类别顺序的测度,数据表 现为有序的类别,如“产品登记”“受教育程度”。③差距尺度。对事物类别或次序之间间 距的测度,没有绝对零点,数据表现为数字。④比例尺度。对事物类别或次序之间间距的测 度,有绝对零点,数据表现为数字。 8 以下关于参数和统计量的说法正确的是( )。[中央财经大学 2011 研] A.总体参数是随机变量 B.样本统计量都是总体参数的无偏估计量 C.对一个总体参数进行估计时,统计量的表达式是唯一的 D.样本统计量是随机变量 【答案】D 【解析】参数是用来描述总体特征的概括性数字度量,研究者所关心的参数通常有总体平均 数、总体标准差、总体比例等,由于总体数据通常是不知道的,所以参数是一个未知的常数。 无偏性是指估计量抽样分布的数学期望等于被估计的总体参数,并非所有的估计量都具有无 偏性。对总体参数进行估计时,用不同估计方法得到的估计量可能不同。统计量是根据样本 数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。 9 以下哪一种情形涉及定性数据的收集?( )[中山大学 2012 研] A.质量控制工程师测量电灯泡的寿命 B.社会学家通过抽样调查来估计广州市市民的平均年收入 C.运动器材厂家在区分各大俱乐部棒球选手是左撇子还是右撇子时做的调查 D.婚礼策划公司通过抽样调查来估计上海市市民举办婚礼的平均开销 【答案】C
试读(部分内容)
第 1 章 导 论 一、单项选择题 1 在抽样推断中,总体参数是一个( )。[中央财经大学 2018 研]
贾俊平《统计学》课后习.已知的量 C.统计量 D.确定的量 【答案】D 【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特 征值。由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。 2 统计年鉴中 2016 年全国各大城市的人均家庭收入数据属于( )。[中央财经大学 2018 研] A.定类数据 B.定序数据 C.截面数据 D.时间序列数据 【答案】C 【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得 的,用于描述现象在某一时刻的变化情况。比如,2010 年我国各地区的国内生产总值就是 截面数据。时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用 于描述现象随时间变化的情况。比如 2010~2012 年我国的国内生产总值就是时间序列数 据。 3 在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是( )。 [浙江工商大学 2017 研]

第2章-统计数据的来源与整理(3学时)

第2章-统计数据的来源与整理(3学时)

70
60
50
40
30
20
10
横坐标代表广告投入, 而纵坐标代表销售收入。 看得出有何种关系吗?
0 2 4 6 8 10 12 14
额 销售
0
广告投入
定量变量间的关系
• • • • • • 能否从该数据回答下面问题: 这两个变量是否有关系? 如果有,它们的关系是否真实的(显著)? 这些关系是什么关系,能否用数学模型来描述? 这个关系是否带有普遍性? 这个关系是不是因果关系?
搜集数据的基本方法
调查的数据
实验的数据
自填式
面访式
电话式
自填式问卷调查
1. 没有调查员协助的情况下由被调查者自己完成 调查问卷
– 问卷递送方法有:调查员分发、邮寄、网络、媒体
• •
要求调查问卷结构严谨,有清楚的说明 弱点
– – – – 问卷的返回率比较低 不适合结构复杂的问卷 调查周期比较长 数据搜集过程中出现的问题难于及时采取调改措施
统计数据的来源与整理
第 2 章
§2.1 §2.2 §2.3 §2.4
数据的搜集与整理
数据案例 数据的计量与类型 统计数据的收集 统计数据的整理
数据案例
案例:证券交易数据
案例:成都市居民理财行为调查
• 提高居民的财产性收入成为经济发展 目标 • 成都居民理财情况具有代表性的 • 调研目的
–商业银行个人理财产品的市场定位 –制定提高居民财产性收入的政策
1. 对现象进行计量的结果 2. 不是指单个的数字,而是由多个数据构成 的数据集 3. 不仅仅是指数字,它可以是数字的,也可 以是文字的
统计数据的分类
• 统计数据的分类
• 按计量层次 • 按收集方法 • 按时间状况

《统计学》(贾俊平,第五版)分章习题及答案

《统计学》(贾俊平,第五版)分章习题及答案

《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分 (2)第1章导论 (3)第2章数据的搜集 (4)第3章数据的整理与显示 (5)第4章数据的概括性度量 (6)第5章概率与概率分布 (10)第6章统计量及其抽样分布 (11)第7章参数估计 (11)第8章假设检验 (13)第9章分类数据分析 (14)第10章方差分析 (16)第11章一元线性回归 (17)第12章多元线性回归 (19)第13章时间序列分析和预测 (22)第14章指数 (25)答案部分 (30)第1章导论 (30)第2章数据的搜集 (30)第3章数据的图表展示 (30)第4章数据的概括性度量 (31)第5章概率与概率分布 (32)第6章统计量及其抽样分布 (33)第7章参数估计 (33)第8章假设检验 (34)第9章分类数据分析 (34)第10章方差分析 (36)第11章一元线性回归 (37)第12章多元线性回归 (38)第13章时间序列分析和预测 (40)第14章指数 (41)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。

第2章:查检表(Check Sheet

第2章:查检表(Check Sheet

第2章:查检表(Check Sheet;Check list)一.定义:查检表是使用简单易于了解的标准化表格或图形,人员只需填入规定之查检记号,再加以统计完整其数据,即可提供量化分析或比对检查用者谓之,亦称为点检表或查核表。

二.查检表的分类:一般而言查检表可依其工作的目的或种类分为下述两种。

1.点检表用查检表:在设计时即已定义使用时,只做是非或选择的注记,其主要功用在于确认作业执行、设备仪器保养维护的实施状况或为预防事故发生,以确保使用时安全用,此类查检表主要是确认检核作业过程中的状况,以防止作业疏忽或遗漏,例如教育训练查检表、设备保养查检表内部稽核查检表,行车前车况查检表……等等均属之。

2.记录用点检表:此类查检表是用来搜集计划资料,应用于不良原因和不良项目的记录,作法是将数据分类为数个项目别,以符号、划记或数字记录的表格或图形。

由于常用于作业缺失,品质良莠等记录,故亦称为改善用查检表。

三.查检测表制作应注意的事项1.明了制作查检表的目的。

2.决定查检的项目。

3.决定查检的频率。

4.决定查检的人员及方法。

5.相关条件之记录方式,如作业场所、日期、工程等。

6.决定查检表格式(图形或表格)。

7.决定查检记录的方式。

如:正、++、△、√、⊙。

四.查检表的制作方法1.点检用查检表之制作方法:A.列出每一需要点检的项目。

B.非点检不可的项目是什么?如:非执行不可的作业,非检查不可的事项……等。

C.有顺序需求时,应注明序号,依序排队列。

D.如可行尽可能将机械别、机种别、人员、工程别……等加以层别,利于解析。

E.先用看看,如有不符需求处,加以改善后,才正式复印。

2.记录用查检表制作方法:A.决定希望把握的项目和及所要搜集的数据。

B.在执行此一步骤时,应该由相关人员以过去累积的经验及知识来决定!最佳的方法是召集部门内所有人共同参与,集思广益以免遗漏某些重要项目。

C.决定查检表的格式,格式的决定,应依据欲层别分析的程度,设计一种记录与整理都很容易及适合自己使用的格式。

检测技术 第二章:误差分析与数据处理

检测技术 第二章:误差分析与数据处理

可以得到精确的测量结果,否则还可能损坏仪器、设备、元器件等。
2.理论误差 理论误差是由于测量理论本身不够完善而采用近似公式或近似值计算测量 结果时所引起的误差。例如,传感器输入输出特性为非线性但简化为线性 特性,传感器内阻大而转换电路输入阻抗不够高,或是处理时采用略去高 次项的近似经验公式,以及简化的电路模 型等都会产生理论误差。
误差,周期性系统误差和按复杂规律变化的系统误差。如图2.1所示,其中1为定值系差,2 为
线性系统误差,3为周期系统误差,4为按复杂规律变化的系统误差。 系统误差的来源包括仪表制造、安装或使用方法不正确,
测量设备的基本误差、读数方法不正确以及环境误差等。
系统误差是一种有规律的误差,故可以通过理论分析采 用修正值或补偿校正等方法来减小或消除。
•理论真值又称为绝对真值,是指在严格的条件下,根据一定的理论,按定义确定的数值。 例如三角形的内角和恒为180°一般情况下,理论真值是未知的。 •约定真值是指用约定的办法确定的最高基准值,就给定的目的而言它被认为充分接近于 真值,因而可以代替真值来使用。如:基准米定义为“光在真空中1/299792458s的时间 间隔内行程的长度”。测量中,修正过的算术平均值也可作为约定真值。
表等级为0.2级。
r=
0.12 100% 100% 0.12 A 100
在选仪表时,为什么应根据被测值的大小,在满足被测量数值范围的前提下,尽可能 选择量程小的仪表,并使测量值大于所选仪表满刻度的三分之二。在满足使用 要求时,满量程要有余量,一般余量三分之一,为了装拆被测工件方便。 (同一精度,量程越大,误差越大,故量程要小,但留余量)
第二章 误差分析与数据处理
三.测量误差的来源
1.方法误差 方法误差是指由于测量方法不合理所引起的误差。如用电压表测量电压时,

教育统计学_第二章 数据的初步整理

教育统计学_第二章 数据的初步整理
2020/10/22
表 2.2 对大学生影响最大的人
父亲 母亲 老师 同学 其他人 合计
男 n 250 233 73 82 52
690
生 % 36.2 33.8 10.6 11.9 7.5
100
女 n 485 514 105 124 92 1320
生 % 36.7 38.9 8.0 9.4 7.0
上海师范大学课堂教学情况调查问卷(学生用表一)
亲爱的同学: 你好! 这是一份关于上海师范大学教师课堂教学情况的调查 问卷,通过这份问卷我们将收集和分析我校课堂教学过程中 的有关数据,并在此基础上作出适当的评估,以督促教师的 教学,完善我校的教学工作。为了收集到真实有效的数据, 这份问卷采取无记名方式,希望你能认真填写。数据统计结 果会以适当的方式向全校师生公布。
2020/10/22
二、表示间断变量的统计图 1.直条图:用直条的长短表示统计事项数量的 图形为直条图。常用来表示点计数据。
人数
60
40 20
0




等级 图2.1a某班级操行评定结果
2020/10/22
制作直条图的方法
(1)条宽应一致。只是高度不同,从而控制高 度来表示大小。
人数
60 40 20
2020/10/22
续六 教育统计学的基础知识
• 证明:∑CX=C∑X
2020/10/22
习题一
• 要研究“上海师大学生的课外活动兴趣”, 总体是什么?个体是什么?如需选择100 人作为这个研究的样本,你准备怎样取样?
2020/10/22
习题二
• 下列变量,从变量与数据的关系上来看,属于什 么类型的变量?
类型 变量 类型

统计学第2章 统计数据的描述(1)

统计学第2章 统计数据的描述(1)

(4)组中值:上下限之间中点的值。
组中值=(上限+下限)/2=上限-组距/2 =下限+组距/2
“××以上”、“××以下”这样的组叫开口组。一般假 定开口组的组距与其相邻组的组距相等。其组中值计算如下: 缺下限最小组的组中值=上限-相邻组组距/2 缺上限最大组的组中值=下限+相邻组组距/2 见第37页的表2.15
第三节 统计整理
一、统计整理的概念和步骤
概念:统计整理是根据统计研究的目的和要求,把统计调查 从而得到反映事物总体特征资料的过程。
步骤: 第一,统计资料审核。包括及时性(整个工作期限、搜 集资料的时间、资料所属的时间);准确性(事实求地反映 实际情况、计算正确);完整性(规定应调查的总体单位、 每个调查单位应调查的内容)等方面的审核。 第二,统计分组 第三,统计汇总 第四,编制统计表或绘制统计图
提供统计数据的部分政府网站
美国政府机构 人口普查局 联邦储备局 预算编制办公室 商务部 网 址 数据内容
人口和家庭等 http://www.bog.frb.fed. 货币供应、信誉、 us 汇率等 http://www.whitehouse. 财政收入、支出、 gov/omb 债券等 商业、工业等
统计数据的来源主要有两个: 一是直接来源,即来源于直接的调查和科学试验, 得到第一手数据。 二是间接来源,即来源于别人调查或试验的数 据,得到第二手数据。
见第8-9页
一、统计数据的直接来源 1、普查
(1)概念 为了某一特定目的而专门组织的一次性全面调查。 (2)特点 ①具有一次性和周期性。
“一次性”是指调查现象在某一时点上的数据。
(1)对称分布:以变量值的中点为对称轴的对称分布。
(2)偏态分布:

统计学 第二章 统计调查

统计学 第二章  统计调查

抽样调查
概念:是一种非全面调查,它从总体中抽 出部分单位组成样本,以样本推断总体 的调查方式。 根据抽取样本的方式不同分概率抽样和 非概率抽样。
优点:经济节省、时效性强、准确度高、 灵活方便。
作用:P29-30
1、用于认识不能或难以进行全面调查的总体数量特征。如无限 或范围很大的有限总体,以及破坏性产品的质量检验。 2、用于收集灵敏度高、时效性强或时间要求紧迫的统计数据。 如市场信息 3、用于不必进行全面调查的总体。(从经济效益考虑) 4、用于提高调查数据的质量(如与普查结合、重点调查结合) 5、用于对总体特征的某种假设检验,判断这种假设的真伪,支 持决策。
1953年的第一次人口普查,普查对象仅需填写5 个普查项目,到了1964年,普查项目增加到了9 项。改革开放后,普查项目继续大幅增加,1982 年19项,1990年21项,最近一次2000年人口普查, 长表所填项相比90年增加了38项,达到了59项。 普查项目的逐次增加,
• 五普普查表共分为:普查表短表、普查表长表、 死亡人口调查表和暂住人口调查表(附表)四 种表。 长表之于短表,在按户填报的部分增 加了关于调查对象生活情况的内容,而按人填 报的部分则增加了关于调查对象的学业完成情 况,迁移情况,经济活动情况,婚姻情况等许 多更加具体的内容。相比于前四次人口普查, 第五次人口普查不仅保证了中国人口的基本信 息如实汇总,而且加入了长表的抽样调查,这 样就可以获取更多更具有代表性的人口,经济 和社会数据,
• 单一表:“一户一表”。一张表格只列一个观测单位。问卷是其 特例。
一览表:“多户一表”。一张表格列多个观测单位。
问卷是一种特殊的调查表。
表头 表体 表脚
名称、编号、 制表单位、填 表日期等等

管理统计学第02章-数据收集方法

管理统计学第02章-数据收集方法
成绩年龄产量数据的来源直接来源统计调查方式统计调查方法间接来源直接来源普查统计调查方式统计报表重点调查典型调查抽样调查统计调查方法询问法实验法观察法选择适合调查方式的方法确定调查时间地点和方法确定调查时间地点和方法调查时间包括两个方面的内容即调查登记调查时间包括两个方面的内容即调查登记的资料的所属时间和调查工作的期限

例:教育程度、 产品等级
定量数据

数字变量(离散、连续)
例:成绩、年龄、产量
定比数据

数据的来源
直接来源
统计调查方式
• 统计调查方法
间接来源
数据来源——间接来源
国家统计机构 咨询公司、行业分析公司 权威报刊杂志 广播电视传媒 英特网

数据的来源——直接来源
直接来源
统计数据收集的意义

1. 2. 3. 3. 4. 5.
为研究提供素材 对表现进行衡量 检验各标准的一致性 帮助阐明决策路线 满足好奇心 进行知识积累
统计调查的意义


统计调查的概念及地位
统计调查是根据统计研究的目的、要求和任务,采用科学的 调查方法,有计划、有组织地搜集统计资料的工作过程。




5)填写说明和解释(又称指导语)
填写说明和解释包括填写问卷的要求、调查项目的含义、被调查者 应注意的事项等,其目的在于明确填写问卷的要求和方法。
4.问卷的设计形式



1)自由询问式 自由询问式是只提问题不设答案,由被调查者自由回答。 2)二项选择式 二项选择式的问卷只让被调查者在两个可能答案中选择一 个。 3)多项选择式 多项选择式是设置了多种答案供被调查者选择。 4)顺位式 顺位式是让被调查者依据自己的爱好和认识程度对调查项 目中所列答案定出先后次序。 5)赋值评价式 赋值评价式是指通过打分或定级来评价事物的好坏或优劣 的方法。

统计学(第四版)课后题答案

统计学(第四版)课后题答案

者比平均分数高 出 1 个标准差,而在 B 项测试中只高出平均分数 0.5 个标准差,由于 A 项 测试的标准化值高于 B 项测试,所以 A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值 Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。
-15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计 60 (3)直方图(略) 。 2.9 (1)直方图(略) 。 (2)自学考试人员年龄的分布为右偏。 2.10(1)茎叶图如下
A班 数据个数 树 叶 树茎 B班 树叶 数据个数பைடு நூலகம்
0 3 59 2 1 4 4 0448 4 2 97 5 122456677789 12 11 97665332110 6 011234688 9 23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分 布比 A 班分散, 且平均成绩较 A 班低。 2.11(略) 。 2.12(略) 。 2.13(略) 。 2.14(略) 。 2.15箱线图如下: (特征请读者自己分析)
2 4.1 (1)200。 (2)5。 (3)正态分布。 (4) (100 1) 。
4.2 (1)32。 (2)0.91。 4.3 0.79。 4.4 (1) x 25 ~ N (17,2 2 ) 。 (2) x100 ~ N (17,1) 。 4.5 (1)1.41。 (2)1.41,1.41,1.34。 4.6 (1)0.4。 (2)0.024 。 (3)正态分布。 4.7 (1)0.050,0.035,0.022,016。 (2)当样本量增大时,样本比例的标准 差越来越小。 4.8 (1) (2)E=4.2; (3) (115.8,124.2) 。 x 2.14 ; 4.9 (87819,121301) 。 4.10(1)81±1.97; (2)81±2.35; (3)81±3.10。 4.11(1) (24.11,25.89) ; (2) (113.17,126.03) ; (3) (3.136,3.702) 4.12(1) (8687,9113) ; (2) (8734 ,9066) ; (3) (8761,9039) ; (4) (8682, 9118) 。 4.13(2.88,3.76) ;(2.80,3.84);(2.63,4.01)。 4.14(7.1,12.9) 。 4.15(7.18,11.57) 。 4.16(1) (148.9,150.1) ; (2)中心极限定理。 4.17(1) (100.9,123.7) ; (2) (0.017,0.183) 。 4.18(15.63,16.55) 。 4.19(10.36,16.76) 。

《统计学》(贾俊平,第五版)分章习题及答案

《统计学》(贾俊平,第五版)分章习题及答案

《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分 (2)第1章导论 (3)第2章数据的搜集 (4)第3章数据的整理与显示 (5)第4章数据的概括性度量 (6)第5章概率与概率分布 (9)第6章统计量及其抽样分布 (10)第7章参数估计 (11)第8章假设检验 (12)第9章分类数据分析 (13)第10章方差分析 (15)第11章一元线性回归 (17)第12章多元线性回归 (19)第13章时间序列分析和预测 (22)第14章指数 (25)答案部分 (29)第1章导论 (29)第2章数据的搜集 (29)第3章数据的图表展示 (29)第4章数据的概括性度量 (30)第5章概率与概率分布 (31)第6章统计量及其抽样分布 (32)第7章参数估计 (32)第8章假设检验 (33)第9章分类数据分析 (33)第10章方差分析 (35)第11章一元线性回归 (35)第12章多元线性回归 (37)第13章时间序列分析和预测 (38)第14章指数 (40)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y 1 y
其中,y 0,1

即:0-1分布是二次考试有10道选择题,每题有五个选 项。一位完全没有准备的学生随机猜测每道题的 答案。试问可能回答正确的题数及其概率如何。 【解】结果见表2.1

可以看出,仅当π=0.5时,二项分布才是对称的。


对于固定的n,随着π趋近0或1,二项分布表现越加偏 斜。 对于固定的π ,随着n增加,二项分布更趋近钟形。
二项分布
当n很大时,二项分布趋近于均值 n, 2 n (1 ) 的正态分布(近似分布)。 原则上,要使二项分布趋近正态分布,要 求期望 n 和 n(1 ) 都不小于5。



当π较大时(如0.5),n相对较小(如≥10)就可以 满足要求; 当π较小时(如0.1或0.9) ,则要求n取较大的值( 如≥50) ,即大样本要求。


二项分布的统计推断

似然比检验

利用似然函数构造似然比统计量,其中分子是 原假设成立时似然函数的极大值,分母是不限 定参数时似然函数的极大值,形式为:
2ln(l0 / l1 ) 在原假设成立条件下,该统计量服从df=1的大 样本卡方分布 可以利用统计软件计算似然函数的极大值
几种方法的比较
【例】试对前例进行假设检验,其原假设与 备择假设分别为 H0 : 0.5,H1 : 0.5 Wald检验的统计量:
z (0.9 0.5) / 0.9(0.1) /10 4.22

得分检验的统计量:
z (0.9 0.5) / 0.5(0.5) /10 2.53

在描述分析基础上,进行推断统计分析

参数估计 假设检验 什么是统计量 什么是抽样分布
二项分布 多项分布

统计推断要求知道统计量的抽样分布



属性数据的两种重要分布:

二项分布


属性数据常常来源于每次试验仅有两种试 验结果的n次独立重复试验,如成功与失败、 合格与不合格、男与女、等等 假设 代表一次试验成功的概率, Y 代表n 次试验中成功的次数,这时 Y 服从指标n以 及参数 的二项分布,即 Y ~ B(n, )
p 0
0 (1 0 ) / n
代入p和n求解得 1.96 (0.596, 0.982)
二项分布的统计推断

对二项参数的假设检验: Wald检验(最简单的方法)

是利用 极大似然(ML)估计值代替真实标准误表 达式中的未知参数而构造的统计量
z ( p 0 ) / p(1 p) / n 近似服从标准正态分布,z 2 近似服从df=1的卡 方分布 称为Wald统计量
多项分布



多项分布是二项分布的推广,其试验结果 的类别多于两种,记为 M (n, 1, 2 , 。 c) 令c代表结果的类别数,用 1, 2 , c表示每 种结果出现的概率,且 j 1 对于n次独立试验,具有 n1次观测落入第1 类, n2次观测落入第2类……的概率为:

单类别的计数服从二项分布 多类别的计数服从多项分布

n, 任何一个确定类别 j 计数 n 具有均值 j j 标准差 n j (1 。 j)
其他分布

超几何分布

设N件产品中有M件次品,从中无放回取n件时 所含次品数X是一个随机变量,其概率为:
m n m CM CN M P( X m) n CN
(1) p z /2 p(1 p) / n
(2)( p1 p2 ) z /2 p1 (1 p1 ) / n1 p2 (1 p2 ) / n2
二项分布的统计推断



需要强调的是,以上方法使用的前提是样 本量n要足够大,或者二项比例接近0.5; 否则区间估计的效果将非常差,特别是在 二项比例趋近1或0时; 这时,可以采用假设检验(得分检验)的方法 来进行参数估计,其效果要优于一般直接 采用区间估计的方法。

原因在于:计算样本比例的标准误时,不需要 用样本比例作为总体比例的点估计。
二项分布的统计推断
【例】一项新治疗手段在10次试验中有9次成 功,试对总体比例进行区间估计(α=0.05)。 【解1】基于直接区间估计方法的结果为:
0.90 1.96 (0.90)(0.10) /10 (0.714,1.086) 【解2】运用检验统计量构造区间: 对于给定的p和n,使检验统计量值 z 1.96 的 0是下面方程的解.
P(Y y) C (1 )
y n y
y n
n y
n! 其中,C ,y 0,1, 2, y !(n y )!
n
二项分布


二项分布的期望和方差分别为: E (Y ) n D(Y ) n (1 ) 当n=1时,二项分布简化为:
P(Y y) (1 )

似然比检验统计量:
2ln(l0 / l1 ) 2ln(0.00977 / 0.3874) 7.36
几种方法的比较

9 1 l [10!/ 9!1!](0.5) (0.5) 0.00977 其中, 0
l1 [10!/ 9!1!](0.9) (0.1) 0.3874
P (n1 , n2 , 其中, nj n n! n2 nc ) 1n1 2 n1 !n2 ! nc !
cn
c
多项分布


显然,当c=2时多项分布简化为二项分布。 通常不需要使用以上多项分布概率公式, 只需掌握基于多项分布律的统计量即可。 大部分针对属性数据的方法都假设:

泊松分布

描述指定时间内,或面积、体积内某一事件出 现的个数的分布,其概率为:
P( X x)
x e
x!
,其中为出现的平均次数
二项分布的统计推断


实际中,二项分布和多项分布的参数值未 知,需要通过样本数据估计总体参数。 在统计学原理中,可以根据样本比例的抽 样分布,用样本比例估计总体比例的区间, 或用样本比例的差估计总体比例差。
相关文档
最新文档