统计学第三章
统计学 第三章抽样与抽样分布
=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取
统计学 第3章 统计数据的整理
统计分组的标志
第三章 统计数据的整理
统计分组的标志:分组标志就是将总体分为各个性质不同的标准或根据。
根
据分组标志的特征不同,总体可按属性标志分组,也可按数量标志分组。
1.按属性标志分组
以属性标志作为分组标志,并在属性标志的变异范围内划分各组界限,将总体 分为若干组。属性标志划分,概念明确,容易确定分组组数,如性别。
2.按数量标志分组
以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体 分为若干组。如工资。
第三章 统计数据的整理
(五)简单分组和复合分组
在统计分组时,根据统计研究目的不同,分组标志的选择可以是一个标志,也可以是 两个或两个以上的标志,这样就有简单分组和复合分组之分:
1.简单分组 对总体只按一个标志分组称为简单分组。
第三章 统计数据的整理
数量次数分布的编制方法
在组距次数分布中,各组组距相同的次数分布称为等距次数分 布(表3-8)。各组组距不同的次数分布称为异距次数分布。
等距次数分布一般在现象性质差异变动比较均衡的条件下使用。
优点:
• 易于掌握次数分布的特性。
• 各组次数可以直接比较。
组数= 全距/组距
组距=全距/组数
100.00
提问:这是单 项次数分布还 是组距次数分 布?
第三章 统计数据的整理
数量次数分布的编制方法
例:对某工厂某月50名工人装配零件(件)情况进行调查, 得到下列初级资料:
106 81 98 111 91 107 86 105 93 106 82 108 114 122 109 104 125 103 113 102 106 84 128 104 91 112 85 96 115 89 97 105 92 111 107 97 105 124 106 86 96 110 112 103 108 110 109 125 101 119
统计学原理(第三章)
3.4数据资料的展示
3.4.1定类数据的展示 3.4.2定序数据的展示 3.4.3定距数据的展示 3.4.4定比数据的展示
3.4.1定类数据的展示
1)条形图:适合于展示分类型数据 条形图是用宽度相同的条形的长短来表 示数据的变动。 2)圆形图:适合于展示结构型数据 又称饼图,是用圆形及圆内扇形的面积 来表示数值大小的图形。
品质数列 分配数列 变量数列 组距数列 不等距数列 单项数列 等距数列
3.3.1分配数列
品质数列:按品质标志分组后,再按一定顺序排列, 所组成的数列。如表3-2所示。
表3-2 某商学院新生按专业分组表
按专业分组 金融学 会计学 工程管理 工商管理 国际贸易 财务管理
人数(人) 56 55 50 58 54 40
1)钟型分布 2)U型分布 3)J型分布
钟型分布
钟型分布又叫正态分布,其特征是“两头 小,中间大”,分布曲线图宛如一口古钟。
钟型分布的类型
对称的钟型分布 非对称的钟型分布
U型分布
U型分布的特征是“两头大,中间小”, 分布曲线图宛如英文字母U。
J型分布
J型分布的特征是“一边大,一边小”,分 布曲线图宛如英文字母J。 1)正J型分布:次数与变量值同向变化 2)反J型分布:次数与变量值反向变化
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
3.3.1分配数列
不等距数列 表3-7 某企业职工月收入分组
按月收入分组 人数(人) 频率(%)
500以下
500—800 800—1000 1000—1500 1500以上
10
15 25 12 8
统计学第3章统计整理
14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。
例
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2
例
产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)
孙允午-统计学第三章
城镇电脑拥有量每百户47.2台。
农村网民对互联网各项功能应用 看网络新闻和使用搜索引擎的比例分别比城镇网民低了15和13个百分点;
但在网络音乐、游戏、影视等娱乐功能上,城乡应用程度相当。
资料来源:2007-9-9《解放日报》
M
e
f
L
2
s
m 1
f
i
3-9
m
中位数的特点
将总体次数一分为二 不受极端数值影响
四分位数
将一次数分布顺序排列并四等分,就形成 3 个 分割点。每一分割点的变量值记为M1、M2、M3 ,分别称其为第一、第二、第三个四分位数。 M1
M2 M3
Me 四分位数的确定
M M M
的位次 1
2
一 算术平均数
X
x
i 1 n
设一组数据为x1,x2,…,xn,则
x
x
1
x
2 n
x
n
i
n
(3 - 2)
设原始数据被分成k组,各组组中值为xi,各组 变量值出现的频数为fi,Σ fi=n,则
x
x f
1 k
x f x f f f f
1
1
2
2
k
k
∑ x f
i 1
例子
• 一定总体范围内粮食总产量 • 工农业总产值 • 企业单位数
分类
变量总值 按反映总体的内容分 单位总数 时期数 按反映的时间状态分 时点数 实物量 按计量单位分 价值量
指某变量观 察值之和 观察值的个数 表示一段时 期累积的总 量
统计学(第三章)
四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。
统计学课件第三章 综合指标(总量 相对 平均 变异指标)
水平法的计算方法:
1、 计划完成程度 计划期末年实际达到的水平
计划期规定末年应达到的水平
例、某地区“九五”计划规定某种产品产量在2000年应达到 200万吨,实际到220万吨。则该产品产量的计划完成程度 为:
220 计划完成程度 100% 110% 200
计算表明,超额10%完成“九五”计划。 2、计算提前完成计划的时间:是以连续12个月的实际数达到 了计划规定的末年水平,则往后的时间均为提前完成计划的 时间。 例:某种产品产量从1999年7月份至2000年6月份实际已达到 200万吨。则该产品产量提前半年时间完成计划。
折合系数 (4)=(2) ÷21% 1.00
(甲)
(1)
(2)
硫酸铵
82000
21.00
硝酸铵
25000
34.65
8662.5
1.65
41250
尿
素
45000
46.20
20790
2.20
99000
碳酸氢铵
16000
16.40 —
2624
0.7809 —
12495
合计
168000
49297
234745
第一产业
第二产业 第三产业
103.53 107.41
298.67
585.38 545.21
284.28
604.39 591.04
283.00
657.51 648.83
95.18 99.54 103.25 111.25 108.41 109.78
5、计划完成程度相对数:是现象在某一段时间 内实际完成数值与计划任务数值的对比。 计划完成程度相对数=实际完成数 / 计划任务数
《统计学》-第三章-统计整理
第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。
在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。
2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。
3、统计分组实质上是在统计总体内部进行的一种定性分类。
4、对原始资料审核的重点是真实性。
5、区分现象质的差别是统计分组的根本作用。
6、标志是统计分组的依据,是划分组别的标准。
7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组.8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组.9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。
10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。
11、按品质标志分组的结果,形成品质分布数列。
12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值.13、组距变量数列的组距大小与组数的多少成反比。
与全距的大小成正比。
14、组距变量数列的分布可以用次数分布曲线图表示。
15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。
16、统计资料的整理方法主要有统计分组和统计汇总两种。
17、钟形分布、U形分布和J形分布是次数分布的三种主要类型.18、统计分组体系有品质标志分组和数量标志分组两种.19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。
20、统计表从内容结构上看,是由主词和宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C。
组内同质性,组间同质性 D。
组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组 B。
统计学第三章 统计数据的整理
汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
《统计学》第三章--统计指标
常住单位是在一国经济领土上具有经济利益中
心的机构单位。
机构单位是国民经济统计的基本经济单位,它 是能以自己的名义拥有资产、发生负债、从事经济 活动并与其它实体进行交易的经济实体。
“非常住单位”——也称为“国外” 。
经济领土是由一国政府控制的地理领土组成。 我国的经济领土—— 包括我国大陆的领地、领海、领空和位于国际水 域而我国具有捕捞和海底开采管辖权的大陆架、我 国住外使馆、领馆用地, 不包括位于我国领土范围内的外国使馆、领馆用 地及国际组织用地。
保险密度=保费/人口数 金融相关度(率)=金融资产总量/GNP
每万人口医院病床数
年份
每万人口医院病床数(张/万人)
2001 2002 2003 2004 2007
23.9 23.2 23.4 24.0 26.3
强度相对数的特点
相对数是惟一有单位(且为复名数)的相对数 (有的也用无名数形式);
分子分母一般可以互换,故有正指标与逆指标之 分。
4.40 31.20 27.90 63.10
66.40
10.60
7.90 28.10 26.80 61.20
65.10
33.80 29.50 65.50
69.60
2.60 14.50
1.60 10.20
23.20 28.40
20.60 29.80
74.30 57.10
77.80 60.00
2.比例相对数——比例(结构性的比例)
•货币化程度=用货币支付的商品和劳务总量 / 全部商品和劳务总量
国家和地区
中国 日本 韩国
新加坡
美国 俄罗斯联邦
按三次产业分就业人员构成
第一产业
第二产业
统计学 第3章集中量数
MW
W1 X1 W2 X 2 W1 W2
72 4 86 6 46
80.4
3、计算方法
3)加权算数平均数(weighted mean)的计算:
用M W 表示
如高考的标准分换算法。 研究生入学考试总分不一样。 P69例3-7
3、计算方法
4)使用次数分布表计算平均数:
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
3、计算方法
2)一组数据中有重复数据 当重复数值没有位于数列中间时,求中数
与无重复数据时求中数的方法相同; 当中间的数值为重复数时:可将重复数看
作一个连续区间,然后根据中间数在区间 内的位置来确定中位数。
例如:P70 例3-8
2、几何平均数的应用
2)应用几何平均数的变式计算: 一组数据彼此间变异较大,几乎按一定的比 例关系变化,所要求的不是平均数,而是平 均增长率。平均增长率=平均发展速度-1
学习方面的进步率 学生或人口增加率 教育经费增加率
本章主要内容
一.算术平均数 二.中数 三.众数 四.平均数、中数、众数三者之间的关系 五.加权平均数 六.几何平均数 七.调和平均数
平均数
中数
众数
① 感应灵敏② 严密确 ③④
定③ 意义简明,易理
于
优 点
解④ 容易计算⑤ 适合
代数法的处理⑥ 少受
抽
③④
样变动的影响
1.加权平均数 2.离差、相关计算 应 3、统计推断 用
1.有极端数值时 2.模糊数据时 3.快速估计集中
量数时
1.有极端数值时 2、数据不同质时 3、粗略估计数据的
统计学 第三章
分组
25% 33%
42%
分组前 分组后
种类: 1 区分事物的性质:类型分组
例:按所有制性质划分,我国现有8种经济类型: 国有经济;集体经济;私营经济;个体经济联 营经济;股份制经济;外商投资经济;港澳台 投资经济
◦ 表3-1 1997年社会固定资产投资分布情况
按投资主体性质分组 国有经济 集体经济 城乡居民个人 其他 合计 投资额(亿元) 比重(%) 13 419 3 873 3 427 4 581 25 300 53.0 15.3 13.6 18.1 100.0
1
本章是统计研究活动的第三阶段—统计资料整理 阶段,阐述了统计整理的理论与方法,包括分组、 汇总和统计表的设计。重点要求为:
明确统计资料整理的概念,了解统计整理的步骤。 通过学习统计分组理论,能够对不同的社会经济现象进行 统计分组。 运用分配数列对原始数据进行系统整理。 掌握统计表的具体编配方法。 能够结合excel进行统计图表制作。
例:高等学校学生分组:
29
练习题1: 产值: 30万元以下 30万-50万元 50万-100万元 100万-500万元 500万元以上
请问是哪一种分组方式,组数,组距,组中值
练习题2 管理局对其所属企业对生产计划完成百分比采用如下分组, 请指出哪项是正确的? 1)80-89% 90-99% 100-109% 110%以上 3)90%以下 90-100% 100-110% 110%以上 2)80%以下 80.1-90% 90.1-100% 100.1-110% 4)85%以下 85-95% 95-105% 105-115%
3· 研究现象之间的依存关系:分析分组
例:中国农民家庭按收入分组的恩格尔系数(1984年)
统计学原理_第三章_陈本炎
三、统计整理的原则和步骤
统计整理的原则:根据统计研究的任务和要求,从 实际出发,在对所研究的客观现象进行全面、系统、 深刻分析的基础上,抓住最基本的、最能说明问题 本质特征的统计分组和统计指标体系对统计资料进 行加工整理。
统计整理的基本步骤是: (1)设计和编制统计资料的汇总方案; (2)审核原始资料,包括完整性、正确性、可比
性;
(3)用一定的组织形式和方法,对原始资料进行 分组、汇总和计算;
(4)对整理好的统计资料再一次进行审核,改正 在汇总过程中发生的差错;
(5)编制统计表、统计图及统计报告。 以上统计资料整理的基本步骤紧密相关,统计资
料的汇总是统计资料整理的中心内容,统计分组 是统计资料整理的关键和基础,统计表则是统计
(三)变量数列的编制方法
例如,某生产车间50名工人日加工零件数如下:
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
第三章意义 统计分组的意义和种类 分布数列的编制
技能目标
具有对统计数据进行统计分组的能力 具有编制统计分布数列的能力 具有应用Excel工具编制频数分布数列的能力
主要内容
第一节 第二节 第三节 第四节
统计整理的意义和步骤 统计分组 分 配数列 统计资料的汇总技术
资料整理成果的表现形式。
第二节 统计分组
统计学(第3章)
4、定比尺度(比率尺度 ratio scale)
是对事物之间比值的一种测度,可用
于参数与非参数统计推断。 特征:
除区分事物的类别、进行排序、比较大 小,而且还可以进行加减乘除运算。 具有绝对零点,即“0”表示“没有” 或“不存在”。 所有统计量都可以对其进行分析。与定 距尺度的唯一区别是有绝对固定的零点。
第三章 统计数据的整理 10
3、观察数据和实验数据
观察数据:通过调查或观测而得 到的数据。 实验数据:通过控制实验对象而 收集的数据。
第三章 统计数据的整理
11
4、直接数据和间接数据
直接数据:即原始数据。
间接数据:已加工整理过的数据。
第三章 统计数据的整理
12
第二节 统计整理的含义和步骤
当异距分组时,各组的次数还受 到组距不同的影响。为消除异距 分组的这种影响,须计算频率密 度(或次数密度),计算公式: 频数密度 = 频数/组距 频率密度 = 频率/组距
第三章 统计数据的整理
36
二、分布数列的编制
将原始资料按其数值大小重新排列 2. 确定全距 3. 确定组距和组数 4. 确定组限 5. 编制变量数列 示例3-5
第三章 统计数据的整理
某地人口
21
(三)按分组标志的不同性质分
品质分组(属性分组):是将总体按
品质(或属性)标志进行分组。如企 业按经济成份、企业规模,职工按性 别、文化程度分组等。 数量分组(变量分组):是将总体按 数量标志进行分组,如企业按职工人 数、劳动生产率分组,职工按工龄、 工资分组等。
第三章 统计数据的整理 31
4、开口组的组距与组中值
统计学基础(第三章)
7.0 40.0 66.0 87.3 100.0 —
300 279 180 102 38 —
100.0 93.0 60.0 34.0 12.7 —
statistics
统计学——第三章数据整理与显示 数值数据(定距数据)的分组
单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量 或变动范围较大的离散型变量的数据分组。
statistics
统计学——第三章数据整理与显示
具体步骤:
(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。
(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。 (3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域” 一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他 选项根据需要选择。点击“确定”按钮,得结果。 (4)对输出结果进行还原并适当改造,即可得频数分布。
统计学——第三章数据整理与显示
第四节 统 计 图
statistics
统计学——第三章数据整理与显示
统计图的结构
标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。
答:调查整理的结果为
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数/户 24 108 93 45 30 300 百分比/% 8 36 31 15 10 100 向上累积 24 132 225 270 300 — 8.0 44.0 75.0 90.0 100.0 — 向下累积 百分比/% 100 92 56 25 10 — 300 276 168 75 30 — 户数/户 百分比/% 户数/户
统计学--第三章总体均数的估计与假设检验
总体均数的估计 与假设检验
课件
1
统计推断的目的:
用样本的信息去推论总体。
医学研究中大多数是无限总体, 即使是有限总体,但也经常受各种条 件的限制,不可能直接获得总体的信 息。
课件本科生卫生学(5)
2
第一节 均数的抽样误差与标准误
• 抽样误差(sampling
error):因各样本 包含的个体不同,所得的各个样本统计量 (如均数)往往不相等,这种由于个体差 异和抽样造成的样本统计量与总体参数的 差异,称为抽样误差。
均数的95%可信区间为3.47~ 3.81(mmol / L) 95%参考值范围为1.29~ 5.99(mmol / L)
S 1.20 X u / 2 S X X 1.96 3.64 1.96 n 200 (3.47, 3.81)
X 1.96S 3.64 1.961.20 (1.29, 5.99) 32 课件本科生卫生学(5)
t分布的应用: 总体均数的区间估计 t检验
课件本科生卫生学(5) 18
第三节 总体均数的置信区间估计 confidence interval
可信区间的概念 总体均数可信区间的计算 均数可信区间与参考值范围的区别
课件本科生卫生学(5)
19
一、可信区间的概念
统计推断:参数估计与假设检验。 参数估计: parametric estimation,用样本统 计量估计总体参数的方法。 点(值)估计:point estimation,直接用样 本统计量作为总体参数的估计值。方法简 单但未考虑抽样误差大小。 区间估计:interval estimation,按预先给定 的概率95%,或(1-),确定的包含未知总 体参数的可能范围。考虑了抽样误差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
≈ 10
4.分组。 50—60,60—70,70—80,80—90,90—100。 5.划计。将总体单位划归各组并得出各组单位总数 --频数。(注意组限处数值) 6.列表。
17
表3-1
某班统计学考试成绩频数分布表
人数(人) 比率(%) 5.0 17.5 27.5 30.0 20.0 100.0 2 7 11 12 8 40
(四)数列的具体编制: 1.总体单位划记入组; 2.计算频数、频率、合计等数值; 3.列表。
16
三、成绩举例:
成绩数据50,53,…,93,98(共40人) 1.排序。计算全距= 98 - 50 = 48 2.组数。优秀、良好、中等、及格、不及格, 共五组。 3.组距。全距/组数= 48/5
表3-3 甲城市家庭对住房状况评价的频数分布表
回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数(户) 24 108 93 45 30 300 百分比(%) 8 36 31 15 10 100 较小制累计 户数(户) 24 132 225 270 300 — 百分比(%) 8 44 75 90 100 — 较大制累计 户数(户) 300 276 168 75 30 — 百分比(%) 100 92 56 25 10 —
<三> 环形图(Doughnut chart):
1.定义:环形图中间有一个 “空洞”,总体中的每组 频率用环中的一段圆环表示。 2.环形图区别圆形图: � 圆形图只能显示一个总体各组频率; � 环形图则可以同时绘制多个总体的数据系列,每一 个总体的数据系列为一个环。 3.作用: � 环形图可用于进行比较研究 ; � 环形图可用于展示多个总体定类或定序数据。
0
年龄
图3-6
某工厂工人年龄分布的直方图
32
频数密度
<二>折线图(Frequency polygon ) :
1.定义:折线图也称频数多边形图,是在直方图的 基础上,把直方图顶部的中点 (组中值) 与横轴终点用折线封闭连接而成。 2.绘制:折线图的两个终点位于横轴上,使得 折线图下所围成的面积与直方图的面积 相等。
统计学 第三章
9
变量数列分为单项式数列和组距式数列
� 单项式数列:各组以一个变量值为名称; 适用:离散变量,数值变化幅度不大; � 组距式数列:各组以一个变量值的变化范围 为名称,简称组距数列; 适用:变量取值个数多或变化幅度较大。
10
4.几个名词:
上限:各组最大变量值; 下限:各组最小变量值; 组距:各组上限减下限的差值; 组中值:位于各组组限中点的数值; 等距数列:各组组距相等的数列; 异距数列:各组组距不等的数列;
6
2.确定分组界限: � 按品质标志分组---关于属性的不同表现的定义要 清晰,可按照国家的相关统一规定执行。 � 按数量标志分组---将数值界限的确定与事物 性质特征相结合。
7
四、统计分组体系:
1. 两种分组: 简单分组--单一分组,按一个标志分组。 复合分组---总体选择两个或两个以上标志, 进行层叠分组。 2.统计分组体系:采用一系列相互联系、相互补充 的标志对现象进行多种分组,以形成一个完整 的体系叫统计分组体系。 分为…. � 平行分组体系:同一总体的几个简单分组 一一排列。 � 复合分组体系:包含复合分组的体系。
29
(1)等距数列直方图例
表3-4 某班级学生成绩分布表
频 成绩 50-60 60-70 70-80 80-90 90-100 合计
数
12
30
人数(人) 比率(%) 2 7 11 12 8 40 5.0 17.5 27.5 30.0 20.0 100.0
图3-5 某班级学生成绩分布直方图
8
20
4
10
lg( n ) K =1+ lg( 2 )
或K= 3,5,7 组
13
2.确定组距:等距:组距 全距/组数(数值分布均匀) 异距:总体数值分布不均匀 3.确定组限: � 基本原则:体现组内一致性和组间差异性。 � 离散变量:变量值为整数,相邻组的组限 可界定清楚。 � 连续变量:前一组上限与后一组下限重叠, 位于重叠处的数值习惯上归入后一组 则每一组包含下限不包含上限。
广 房地产广告 告 金融广告 类 型 服务广告
商品广告
0
40
80
人数(人) 120
图3-1 某城市居民关注不同类型广告的人数分布条形图
22
<二>圆形图(Pie chart):
1.定义:也称饼图,是用圆形及圆内扇形的面积来 表示频数分布的图形。主要用于定类测定 中表示总体中各组频率,对于研究结构性 问题十分有用。 2.绘制:将总体中各组频率对应圆内的各个扇形面积 所占比重,即扇形的中心角度根据 3600乘以 各组频率确定。
表3-2 某班统计学考试成绩累计频数分布表
频数(率) 成 绩
人数(人) 比率(%)
较小制累计频数 (上限)
人数(人) 比率(%)
较大制累计频数 (下限)
人数(人) 比率(%)
50-60 60-70 70-80 80-90 90-100 合计
2 7 11 12 8 40
5.0 17.5 27.5 30.0 20.0 100.0
经济学院2014FX 统计学 第三章
3
3.错误数据、不符合要求数据且无法弥补, 予以删除或择选; 4.数据排序: 定类数据---字母型(升序降序); 汉字型(笔画多少); 定量数据---递增;递减。 ---
x1 , x2 ,⋯ , xn
x(1) < x(2) < ⋯ < x( n ) x(1) > x( 2) > ⋯ > x( n )
11
二、频数分布编制:
(一)数据的预处理: 1.排序:常为升序,即由小到大 2.计算:全距=最大值-最小值 (二)确定数列形式: 单项式数列(离散变量) 组距式数列(离散变量或连续变量)
12
(三)关于组距数列: 1.确定组数:过多(影响 组间差异性 ) 过少(影响 组内一致性 )
Sturges 提出的经验公式来确定组数K
27
� 累计频数图例:
累 积 300 户 数 200 (户) 100 0 24 一般 满意 非常 满意 132 400 270 300 累 积 300 户 数 200 (户) 100 0 400 276 168 75 30 非常 满意
225
300
非常 不满意 不满意
(a) 较小制累积
非常 不满意 一般 满意 不满意 (b) 较大制累积
14
≈
� 闭口组:上下限俱全
组中值 ==(上限+下限)/2 (代表各组变量值平均水平) � 开口组:数列首或末两组为 “…以下”(缺 下限) “…以上”(缺 上限) 组中值: (近似计算) 缺下限组组中值==上限 -(邻组组距/2) 缺上限组组中值==下限 +(邻组组距/2)
15
35
成绩累计频数折线图:
(50,40) (100,40)
40
(60,38) (70,31) (90,32) (80,20) (70,9) (90,8) (100,0)
100 75 (%) 累计频率 50 25 0
30 20
累计人数
10 (60,2) (50,0) 0 50 60
25
�
13% 10% 15% 21% 7% 8%
环形图例:
非常不满意 33% 36% 一般 满意 非常满意 26% 不满意
31%
图3-3 甲乙两城市家庭对住房状况评价 环形图 甲乙两城市家庭对住房状况评价环形图 26
<四>累计频数图(Cumulative frequencies chart): 适用于定序测定数据的显示 ,将各类别的频数逐级累 加,便于显示某一类别以下或以上各组的频数之 和。
33
�
12 8 4 0
折线图例:
30 20 10 0
80 90 100 110
40
50
60
70
4
3.组距数列累计频数折线图:
表3-6 某班学生成绩分布表 成 绩 50-60 60-70 70-80 80-90 90-100 合计 频 数 2 7 11 12 8 40 较小制累计数 2 9 20 32 40 较大制累计数 40 38 31 20 8 -
4
二、统计分组概述:
1.定义:把同质总体中的在某一标志下具有不同表 现的总体单位分开,将统计总体区分为若干组成 部分,从而正确地认识事物的本质及其规律性的 统计研究方法。
5
三、统计分组方法:
统计分组关键:选择分组标志;确定分组界限 1.选择分组标志: 分组依据,应当 � 体现基本原则---组内一致性;组间差异性; � 围绕研究目的,力争反映现象的本质特征; 按品质标志分组、按数量标志分组。
0
40
50
60
70
80
90 100 110
0
30
(2)异距数列直方图
用矩形的面积来表示各组的频数分布 ,则仍用 宽度表示各组距,高度则改为频数密度。
频数密度=频数(率)/组距
31
�
70 60 50 40 人数 30 20 10 0
10 15 20
异距数列直方图例
14 12 10 8 6 4 2
25 30 35 40 45 50 55
23
关注服务广告的人数占总人数的 � 圆形图例: 百 分比为 25.5%,那么其扇形的中心角度就应为 3600×25.5%=91.80,其余类推。
房地产广告 金融广告 4.5% 招生招聘广告 8.0% 5.8% 其他广告 1.0%
服务广告 25.5%
商品广告 56.0%
图3-2 某城市居民关注不同类型广告的人数构成圆形图 24