第十一章描述统计
第十一章专题数据分析方法——描述性统计市场调研描述

数量标志的描述方法(1)
表3 某年某工地100名工人的月工资情况 工人数(人) 10 35 20 20 15 100
厦门理工学院文化传播系 蔡清毅 14
按工资水平分组(元) 500以下 500—600 600—700 700—800 800以上 合计
2018/12/10
数量标志的描述方法(1)
注意几个问题: 第一 工资水平是连续变量 要用重叠组限
2018/12/10
厦门理工学院文化传播系 蔡清毅
4
区分不同的测量水平
区分原则:定类数据没有大小之分;定序数据
有大小之分,差值有意义;定距数据有大小之 分,差值有意义,但其比值无意义;定比数据 比值有意义。 定比定距数据可以向前化成定序或者定类数据, 但是将损失一定信息;反之,不能将定序定类 数据化成定距定比数据。
第二 组限的确定,即分组界限的确定
第三 组距大小的确定
全距 第四 组数的确定,组数= 组距
2018/12/10
厦门理工学院文化传播系 蔡清毅
15
数量标志的描述方法(1)
(3)不等组距变量数列 如在生命统计中,人口死亡率将人口按年龄分组
1岁以下 1—1.9岁 2—2.9岁 组距为1 5—9.9岁 10—14.9岁 组距为5 15—19.9岁 20—29.9岁 30—39.9岁 40—49.9岁 组距为10
3—3.9岁
4—4.9岁
50—59.9岁
60—64.9岁 …… 组距为5
2018/12/10
厦门理工学院文化传播系 蔡清毅
16
数量标志的描述方法(2)
某校20名学生的身高分布表
身 高 <156 156~162 162~168 168~174 174~180 >=180 累计
11 第十一章 定性资料的统计描述

表4 两班人数及百米跑优秀率统计
性别
男生 女生 合计
电子科大某班
人数
优秀率
60
60(%.00)
10
10.00
70
52.86
华西医大某班
人数
优秀率
30
7(0%.0)0
30
20.00
60
45.00
三、率的标准化法
(一)率的标准化法的意义: 采用统一的标准构成,以消除混杂因素
的影响,使算得的标准化率具有可比性。
316
2.3
1.7
359
2.7
1.4
0.85
其它心血管病
611
4.5
3.3
736
5.6
2.9
0.80
合计
18311 133.7
100.0
25334 192.0
100.0
0.70
二、应用相对数时应注意的问题
• 分母一般不宜过小 • 不能以构成比代率 • 特别注意不能用构成比的动态分析代替率的
动态分析 • 对观察单位不等的几个率不能相加求平均率 • 相对数进行比较应注意可比性 • 比较样本率或构成比的比较需假设检验
• 计算公式:
p P • r P • SMR
ni Pi
标准化死亡比(SMR)
• SMR是观察人群死亡率与总人群(参照人群)
相比较的指标。
• 计算: SMR=实际死亡数/期望死亡数=D/E
• 期望死亡数:假定研究人群的年龄别死亡 率与标准的年龄别死亡率一样,理论上的 死亡人数。
标准化率的计算步骤
本例,n=201,p=127/201=0.6318
Sp
p(1 p) n
第11章第3成对数据的统计分析

基本思想、方法及其简单应用.
出线性回归直线
3.回归分析
(2)利用独立性检验判
了解回归的基本思想、方法及其简单应 断两个变量是否有关
用.
讲
课
人
:
邢
启
强
2
两个变量有关系,但又没有确切到可由其中的一个去精确地决
定另一个的程度,这种关系称为相关关系.
不一定是因果关系,也可能是伴随关系
3
1.散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组
成了统计图.我们我们把这样的统计图叫做散点图
2.两个变量的线性相关
(1)正相关
在散点图中,点散布在从 左下角 到 右上角 的区域,对于两个变量的
这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从 左上角 到 右下角 的区域,两个变量的这种
2
ˆ
(
y
y
)
i i
i 1
n
2
(
y
y
)
i
残差平方和
1
。
总偏差平方和
i 1
在使用经验回归方程进行预测时,需要注意下列问题:
(1)经验回归方程只适用于所研究的样本的总体,例如,根据我国父亲身高与儿子身高
的数据建立的经验回归方程,不能用来描述美国父亲身高与儿子身高之间的关系,同
样,根据生长在南方多雨地区的树高与胸径的数据建立的经验回归方程,不能用来描
,利用 χ2 的取值推断分类
(a+b)(c+d)(a+c)(b+d)
变量 X 和 Y 是否独立 的方法称为 χ2 独立性检验.
第十一章 统计分析和调查报告

• 2、定序变量 • 3、定距或定比变量
第十三章 撰写研究报告
• 研究研究报告及其类型 • 研究报告是反映社会调查成果的一种书面 报告,它以文字、图表等形式将调查研究 的过程、方法和结果表现出来。其目的是 告诉有关读者,对于所研究的问题是如何 进行调查的,取得了哪些结果,这些结果 对于认识和解决这一问题有哪些理论意义 和实际意义等等
其它故事与发表情况
• 另外两种形式的故事叫做批判的故事(吸 引读者对社会问题的注意和重视)和形式 的故事(理论的表述)。 • 民族志写作惯例发生了变化。今天,被发 表的现实主义的故事越来越少,而印象主 义或坦白的故事则相对越来越多。 • 没有完美的理论,也没有完美的报告。
• 导言部分 • 普通调查报告的第一部分称作导言,它的主要任务是向读者简要地介绍 整个调查的有关背景。其中,最主要的内容包括调查的目的、调查的内 容、调查的对象、调查的时间、地点、调查的方法等等。导言的具体写 法有下列几种常见的方式。 • (1)直述式 • 即开门见山,平铺直述,直接把调查的目的,内容,对象,范围等一一写出.例 如: • 为了全面了解老年人的生活状况,加强老年人的社会保障工作,沈阳 师范大学社会学系于2003年2月至4月,在辽宁省沈阳市调查了300位老 年人的家庭与生活情况。下面是这次调查的方法及主要结果。 • (2)悬念式。 • 即先描述某种社会现象和社会问题,然后对这种社会现象和问题产生的 原因、它的影响等等提出一系列疑问,最后介绍调查的基本情况.例如: • 老年人丧偶是生活中十分普遍的现象,而老年人再婚,则是近年来出 现在我国社会中的一种新的社会现象。据有关部门统计,本市1980年再 婚老年夫妇为68对,1984年为116对,1988年为302对;1991年为: 495对;1994年为623对。促使老年人再婚比例提高的原因是什么?;社 会舆论对老年人再婚的评价如何?老年人再婚给他们的家庭及其生活带 来了哪些变化?;为了弄清这些问题,沈阳师范大学社会学系于今年3—5月,对沈阳市180对再婚老年夫妇进行了调查。
统计学第十一章相对数分析

Snqnq
p1 N1
N p22
.ห้องสมุดไป่ตู้ . N pnn
三、两个总阳性率的比较
以两村各次的复检人数及阳性人数合并 计算其期望阳性率,以各村各次受检人 数乘以该次期望阳性率即得各村各次检 验的期望阳性人数,然后将各村阳性人 数相加为TA及TB与两村实际人数OA及OB 作卡方检验
5、两样本标化率是样本值,存在抽样误差, 若欲得出标化组和被标化组的总率是否相等 的结论,还应作假设检验
五、标化率差别的统计意义检验
当选用直接法计算时,可应用“ 内部构成 不同的两率差别的统计意义检验”法中的 加权卡方检验法(Cochran 检验),计算过程 见P147-149
第四节 重复检验结果 总阳性的计算
相对比型指标:
指任何两个相关联的变量A和B之比。它表示相 对于B的一个单位A有多少个单位。=A/B
常用指标:
1、对比指标:两个同类事物某种指标之比。 如性别比、某指标随时间的变化
2、关系指标:指两个有关的、但非同类事 物的数量比。如医务从员与床位比、
3、计划完成指标:说明计划完成的程度, 常用实际数达到计划数的百分之几或几倍表 示。
率=可发 能生 发某 生现 某象 现的 象观 的 单察 观 数 位单 察 数位k
A A A k
k为比例基数:100%、1000‰、10万/10万 等,主要根据习惯用法和使算得的率一般至 少保留一、二位整数,以便阅读。
常用率有:
患病率prevalence rate:时点和期间患病率 感染率infection rate 发病率morbidity rate, incidence rate 死亡率death rate, mortality rate 病死率fatality rate 治愈率cure rate
人大《统计学》第十一章时间序列分析ppt

中国人民大学 出版社
All rights reserved
第11章 时间序列分析
第11章 时间序列分析
§1 时间序列的描述 §2 时间序列的分解法 §3 时间序列的平滑法 §4 ARIMA模型
2
§1 时间序列的描述
§1.1 时间序列及其分类 §1.2 图形描述 §1.3 水平变动描述 §1.4 速度变动描述
17
§1.3 水平变动描述
2.增长量与平均增长量 增长量用来描述现象在观测期内增长的绝对数量,由报告期 发展水平减去基期发展水平得到。 增长量按基期的选择分类 1. 逐期增长量 2. 累计增长量
18
§1.3 水平变动描述
设时间序列观测值为 Y(i i 0,1, , n),增长量为 。计算公式为
定基发展速度:
Ri
Yi Y0
( i 1,2, ,n )
各期环比发展速度的连乘积等于相应的定基发展速度:
n Yi Yn
Y i1 i1 Y0
相邻两个定基发展速度之商等于相应的环比发展速度:
Yi Yi1 Yi Y0 Y0 Yi1
23
§1.4 速度变动描述
2.增长速度(增长率)
增长速度
报告期发展水平 基期发展水平
增长1%的绝对值
=
Yi Yi1
Yi1
Yi
Yi Yi1
1
100
100
28
§2 时间序列的分解法
§2.1 时间序列的分解模型 §2.2 时间序列的分解步骤 §2.3 利用时间序列分解模型展开预测
29
§2.1 时间序列的分解模型
时间序列的变动分解 长期趋势(T) 季节变动(S) 循环变动(C) 不规则变动(I)
第十一章 概率与统计

第十一章 概率与统计两个计数原理1.分类计数原理: 。
分步计数原理: 。
2.王云同学有参考书若干本,其中有5本不同的外语书,4本不同的数学书,3本不同的物理书,他欲带参考书到图书馆阅读,若他从这些参考书中带一本去图书馆,有 种不同的方法;若带外语,数学,物理各一本,有 种不同的带法;若从这些参书中选2本不同学科的参考书带到图书馆,有种不同的带法。
3.设*,x y N ∈,且4x y +≤,则点(,)x y 共有 个.、4.设{1,2,3},{4,5}A B ==,从集合A 到集合B 共可建立不同的函数个数为 . 5.一种号码锁有4个拨号盘,每个拨号盘上有从0到9共10个数字,这4个拨号盘可以组成 个四位数字号码。
6.11n mi ji j a b==⋅∑∑展开后共有 项.例1.(1)有4名学生报名参加数学、物理、化学竞赛,每人限报一科,有多少种不同的报名方法?(2)有4名学生争夺数学、物理、化学竞赛的冠军(无并列),有多少种不同的结果? (3)某人要将4封不同的信投入3个不同信箱中,不同的投寄方法有多少种?(4)将3个不贩小球放入4个不同编号的盒子中(一个盒子只放一个小球),不同的放法有多少种?例2.在一次综艺节目的演出中,热心观众坐成四个方阵(如下图),现有4种不同颜色的T 恤衫,要求相邻方阵着不同颜色的T 恤,有多少种不同的着衣方法?例3.(1)用数字0,1,2,3,4可组成多少个不同的三位数?(2)甲、乙、丙3人互相传1只篮球,开始球在甲手中,经过5次传球后,球在甲手中,问共有多少种不同的传球方式?例4.(备选题)设整数4,(,)n P a b ≥是平面直角坐标系xOy 中的点,其中,{1,2,3,,}a b n ∈L ,a b >.(1)记n A 为满足3a b -=的点P 的个数,求n A ; (2)记n B 为满足1()3a b -是整数的点P 的个数,求n B .排列、组合的概念和运算1.排列的定义: ,叫做从n 个不同元素中取出m 个元素的一个排列.2.排列数的定义: ,叫做从n 个不同元素中取出m 个元素的排列数,用符号 表示.3.排列数公式:mn A = = ;m n A = = ;0!=4.组合的定义: ,叫做从n 个不同元素中取出n 个元素的一个组合.5.组合数的定义: ,叫做从n 个不同元素中取出m 个元素的给合数,用符号 表示.6.组合数公式:mn C = = = ;0n C = 7.组合数的两个性质:(1) (2)例1.(1)若17161554mn A =⨯⨯⨯⨯⨯L ,则n = ,m = .(2)若*n N ∈,则(55)(56)(57)(68)n n n n ----L 用排列数符号表示为(3)若33210n n A A =,则n =(4)若75589n nnA A A -=,则n = 例2.(1)若*x N ∈,求123231x x x x C A ---++的所有可能值.(2)求11224n nn n A A -++的值.例3.(1)化学:1!22!33!!n n +⋅+⋅++⋅L (2)化简:12312!3!4!!n n -++++L (3)化简:122nn n n C C nC +++L例4.(备选题)已知(2)p p ≥是给定的某个正整数,数列{}n a 满足:111,(1)()k k a k a p k p a +=+=-,其中1,2,3,,1k p =-L .(1)设4,p =求234,,a a a ; (2)求123p a a a a ++++L .二项式定理及通项公式的应用1.二项式定理:对于*n N ∈,()na b += ,二项式展开式的通项公式为 ,二项式展开式中第r 项的二项式系数为 ,要分清展开式中第一项的系数与该项的二项式系数.2.6(23)a b +的展开式的第3项是 ;6(32)b a +的展开式的第3项是 . 3.15(12)x -的展开式的第1r +项为 .4.37(2)x x +展开式的第4项的二项式系数是 ,第4项的系数是 .5.*n N ∈,式子01122(1)2(1)n n k k n k n n n n n C C C C ---++-++-L L = .例1.求10的展开式中,求:(1)第3项的二项式系数及系数;(2)含2x 的项及系数;(3)常数项、有理项.例2.(1)已知9a x ⎛- ⎝的展开式中3x 的系数为94,求常数a 的值 (2)求2521(2)x x++的展开式中2x 项 (3)求64(1)(1)x x -+展开式中3x 的系数例3.(1)求100.998的近似值(精确到0.01) (2)当n 为正奇数时,求112215555n n n n n n n C C C ---++++L 被7除所得的余数.(3)当*3,n n N ≥∈,求证:221nn >+例4.(备选题)是否存在等比数列{}n a ,使12121(1)2nn nnn na C a C a C --+++=L 对一切*n N ∈都成立?如存在,求出n a ;如不存在,请说明理由.二项式系数的性质及应用1.二项式系数的性质(1)对称性:在()na b +展开式中, 的两项的二项式系数相等.(2)增减性与最大值;当12n k +<时,二项式系数是逐渐 的,由对称性知它的后半部分是逐渐的,且在中间取得最大值,当n 是偶数时,中间的一项 取得最大值;当n 是奇数时,中间两项 相等,且同时取得最大值.(3)二项式系数的和:012nn n n n C C C C ++++L = ;022135n n n n n n C C C C C C +++=+++L L = .2.在()nx y +的展开式中,若第7项的系数最大,则n 等于 .3.若29323636012,(2),n n n n n C C x a a x a x a x ++=-=++++L 则011n a a a -+++L = ;12323n a a a na ++++L = .4.函数1010()(1cos )(1cos )(0)f x x x x π=++-≤≤的最大值为 .5.若1)nx的展开式中各项系数和为P ,所有二项式系数和为2,272,r n S P S C +=最大,则r .例1.(1)求7(2)x y +展开式中系数最大的项;(2)求7(2)x y -展开工中系数最大的项.例2.求12(13)x -的展开式中 (1)各项二项式系数之和; (2)奇数项二项式系数和; (3)各项系数和; (4)各项系数绝对值的和.例3.已知数列{}n a 的首项为1,011222111231()(1)(1)(1)(1)n n n n n n n n n n n n n n p x a C x a xC x a x C x a C x x a C x ----+=-+-+-++-+L .(1)若数列{}n a 是公比为2的等比数列,求(1)p -的值;(2)若数列{}n a 是公差为2的等差数列,求证:()p x 是关于x 的一次多项式.例4.(备选题)(1)当*k N ∈时,求证:(1(1k k ++-是正整数;(2)试证明大于2(1n +的最小整数能被12n +整除*()n N ∈ .排列、组合的应用题(1)1.特殊元素、特殊位置的“优先安排法” 2.正难则反:排除法(去杂法)3.相邻问题:捆绑法4.不相邻问题:插空法5.顺序一定问题:除法6.至多、至少问题:正面与反面的选择7.染色问题:“树型图法”、恰当的分类与准确的分步8.相同元素问题:隔板法例1.4男3女坐成一排,下列各小题分别有多少种排法?(1)某人必须在中间(2)某两人只能在两端(3)某人不在中间和两端(4)甲、乙两人必须相邻(5)甲、乙两人不相邻(5)甲、乙两人必须相隔1人(7)4男必须相邻(8)4男必须相邻,3女也必须相邻(9)3女不相邻(10)4男不相邻(11)4男不在两端(12)甲在乙左边(13)3男不等高,按高矮自左向右顺序排列例2.用0、1、2、3、4、5六个数字分别可以组成多少个符合下列条件的没有重复数字的自然数?(1)四位偶数(2)四位奇数(3)是25的倍数的六位数(4)比240135大的六位数(5)个位数字比十位数字小的五位数例3.某旅行社有导游9人,其中3人只会英语,2人只会日语,其余4人既会英语又会日语,现要从中选6人,其中3人做英语导游,另外3人做日语导游,则不同的选择方法有多少种?例4.(备选题)将4个编号1、2、3、4的小球放入4个编号为1、2、3、4的盒子中,(1)每盒子至多一球,有多少种放法?(2)恰好有一个空盒,有多少种放法?(3)每个盒子放一球,并且恰好有一球的编号与盒子的编号相同,有多少种放法?(4)把4个不同的小球换成4个相同的小球,恰有一个空盒子,有多少种放法?(5)把4个不同的小球换成20个相同的小球,要求每个盒子内的球数不少于它的编号数,有多少种放法?排列、组合的应用题(2)1.某天某班的课程表要排语文、数学、外语、物理、化学、体育六门课程,如果第一节不排体育,最后一节不排数学,一共有种不同的排法。
社会研究方法(第四版)第十一章

a 71.87 176 8212 . Y 8212 . .87 X
有了这一回归方程后,我们就可以由预测变量的值 经回归方程计算出标准变量的预测值。如另一名大学生 的身高为170厘米,则其体重的预测值为65.78公斤。
资料审核的方法主要有两种,即逻辑审核与 计算审核。 逻辑审核,即核查资料的内容是否合乎逻辑 和常识,项目之间有无互相矛盾之处,与其 他有关资料进行对照是否有明显出入等等。 计算审核,是针对数字资料进行的审查。要 检查计算有无错误。度量单位有没有错,前 后数字之间有无相互矛盾之处等等。
二、资料的转换
2 定序层次:中位值(中位数)(单选)
其意义为按大小顺序排列,处在一群数据中央位置的数值。 (1)原始资料,求中位值 例如:有9个人,他们的月工资分别如下: 47,42,50,51,92,112,71,83,108 首先作排列处理,从小到大排列 42,47,50,51,71,83,92,108,112 其次求中央位置 Md的位置=(N+1)÷2=(9+1)÷2=5 最后求中位置Md=71
二、单变量推论统计
区间估计 以样本统计量的抽样分布为理论依据,按一 定概率要求,由样本统计量的值来估计总体 参数的值所在的范围,叫做总体参数的区间 估计。 区间估计的实质就是在一定的可信度(置信 度)下,用样本统计值的某个范围来估价总 体的参数值 。范围的大小反映的是这种估计 的精确性问题,而可信度高低反映的是这种 估计的可靠性或和握性问题。
a b
两个变量(预测变量X与标准变量Y)间的回 归分析,是只有一个自变量的线性回归,也叫 一元线性回归。其回归方程为:
Y a bX
其中a,b、对一对特定数据来说是常数:
统计学第十一章统计决策

第十一章统计决策I.学习目的本章对统计决策的基本理论、方法及其应用,作扼要的介绍。
通过学习,要求:1. 理解有关统计决策的基本概念与基本步骤,能够运用收益矩阵表与决策树形图表述所要研究的决策问题;2. 了解各种决策准则的特点与适用的场合,能够运用这些准则,进行完全不确定性决策与一般风险型决策;3. 了解贝叶斯决策的基本思想,掌握后验概率的计算方法,并在此基础上进行决策分析。
n.课程内容要点第一节统计决策的基本概念一、什么是统计决策所谓决策,就是在占有一定信息的基础上,利用各种方法,对影响特定目标的各种因素进行计算和分析,从而选择关于未来行动的“最佳方案”或“满意方案”的过程。
狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。
开展统计决策研究,有助于避免决策的盲目性,提高决策的科学性。
二、统计决策的基本步骤(一)确定决策目标;反映决策目标的变量,称为目标变量。
当决策所要求达到的目标只有一个时,称为单目标决策。
当决策所要求达到的目标不止一个时,称为多目标决策。
(二)拟定备选方案备选方案是决策者可以调控的因素,备选方案中所调控的变量称为行动变量。
所有备选方案的集合称为行动空间。
(三)列出自然状态所谓自然状态,是指实施行动方案时,可能面临的客观条件和外部环境。
所有可能出现的状态的集合称为状态空间,而相应的各种状态可能出现的概率的集合称为状态空间的概率分布。
(四)测算结果(五)选择“最佳”或“满意”的方案(六)实施方案三、收益矩阵表第二节完全不确定型决策一、完全不确定型决策的准则(一)最大的最大收益值准则该准则又称乐观准则或“好中求好”准则。
在决策时,先选出各种状态下每个方案的最大收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。
(二)最大的最小收益值准则该准则又称悲观准则或“坏中求好”准则。
在决策时,先选出各种状态下每个方案的最小收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。
高等数学 第十一章 电子课件

第一节
概率论
一、随机事件
(一)随机事件的概念
引例1 如果问“苹果从树上脱落,会往地上落吗?”,答案是“会”. 引例2 如果问“掷一枚骰子,能否出现7点?”,答案是“不能”. 引例3 抛掷一枚质地均匀的硬币,结果可能是正面朝上,也可能是反面朝上, 且事先无法确定抛掷的结果是什么. 引例4 在400 m短跑比赛前,运动员需通过抽签决定自己所在的跑道,且每 次抽签前都无法预测自己会在哪条跑道.
(二)概率的古典定义
在某些情况下,随机试验具有以下特征. 有限性:试验中所有可能出现的基本事件只有有限个. 等可能性:每个基本事件出现的可能性相等. 具有以上两个特点的概率模型是大量存在的,这种概率 模型称为古典概率模型,简称古典概型,也称等可能概型.
(二)概率的古典定义
定义 3 对于古典概型,设试验含有 n 个基本事件,若事件 A 包含 m 个基本事件,则事件 A
第十一章
概率统计基础
导学
概率论与数理统计是研究随机现象内在规律性的重要工具,其应用已 遍及自然科学、社会科学、工程技术、军事科学及生活实际等各领域,因 此掌握一定的概率统计知识十分必要.
本章主要介绍随机事件及其概率,随机变量及其分布,随机变量的期 望与方差,数理统计的基础知识,参数估计,假设检验及回归分析.
随机试验的一切可能结果所组成的集合称为样本空间,记作 .随机试验的每
一个可能结果称为样本点,样本空间就是全体样本点的集合.
(一)随机事件的概念
定义1 随机试验的每一种可能的结果称为随机事件,简称事件.它通常用大写 英文字母A, B, C… 表示.
随机事件可分为基本事件和复合事件. 基本事件:在随机试验中,不可再分解的事件. 复合事件:在随机试验中,由若干个基本事件组合而成的事件.
第11章 统计分析—双变量

10- 13 10-
社会 统计学
2、方差齐性检验和t检验结果 、方差齐性检验和t
F值>F 0.025 (n 1-1,n 2-1), 说明方差不齐。
10- 14 10-
P值小于给定的显著性水平α, 说明方差不齐。
P值小于给定的显著性水平α, 拒绝原假设。
社会 统计学
社会 统计学
10- 44 10-
社会 统计学
10- 45 10-
社会 统计学
【例2】“年龄段”与“忙碌程度”
10- 46 10-
社会 统计学
10- 47 10-
社会 统计学
10- 48 10-
社会 统计学
10- 49 10-
社会 统计学
斯皮尔曼等级相关系数(spearman)在这: 斯皮尔曼等级相关系数(spearman)在这: Analyze Correlate Bivariate
2、 比较重要 3、 一般 5、 很不重要 6 、说不清楚
10- 40 10-
社会 统计学
1、将被访者学历与“读书的地位”都看成 定类变量,作列联相关的检验。 2、被访者学历与“读书的地位”均为定序 量,作等级相关检验。
10- 41 10-
社会 统计学
10- 42 10-
社会 统计学
10- 43 10-
社会 统计学
二、独立样本T 检验 独立样本T
Analyze Compare Means
IndependentIndependent-Samples检验变量栏 T Test,
打开Independent-Samples T Test对 IndependentTest对
分组变量栏, 话框 只能有一个分 组变量
第十一章 统计决策.

11 - 2
统计学
STATISTICS
11.1 统计决策的基本概念
一、什么是统计决策 二、统计决策的基本步骤 三、收益矩阵表
11 - 3
统计学
STATISTICS
什么是统计决策
狭义的统计决策方法是一种研究非对抗型 和非确定型决策问题的科学的定量分析方 法。
11 - 4
统计学
STATISTICS
11 - 13
统计学
STATISTICS
11.3 一般风险型决策
一、然状态概率分布的估计 二、风险型决策的准则 三、利用决策树进行风险型决策
11 - 14
统计学
STATISTICS
自然状态概率分布的估计
客观概率是一般意义上的概率,通常是由 自然状态的历史资料推算或按照随机实验 的结果计算出来的。 主观概率是决策者基于自身的学识和经验 作出的对某一事件发生可能性的主观判断。
11 - 24
统计学 完全信息价值与补充信息价值
STATISTICS
完全信息,是指在对某一问题进行决策时, 对于所有可能出现的状态都可以提供完全 确切的情报。完全信息的价值,可以由掌 握完全信息前后,所采取的不同行动方案 的收益值的差额来表示。用收益值差额的 期望值来综合反映完全信息的价值。
11 - 25
11 - 45
统计学
STATISTICS
11 - 46
统计学
STATISTICS
11 - 47
2 j 1 n
Vi=
11 - 17
Var (ai ) E(Q(ai))
(i =1,2,…,m)
统计学
STATISTICS
(三)最大可能准则 在最可能状态下,可实现最大收益值的方案为最佳方案。 最大可能准则是将风险条件下的决策问题,简化为确定条 件下的决策问题。只有当最可能状态的发生概率明显大于 其他状态时,应用该准则才能取得较好的效果。 (四)满意准则 利用这一准则进行决策,首先要给出一个满意水平。然后, 将各种方案在不同状态下的收益值与目标值相比较,并以 收益值不低于目标值的累积概率为最大的方案作为所要选 择的方案。利用该准则的决策结果,与满意水平的高低有 很大关系。
第十一章第三节概率与统计的综合问题课件共51张PPT

(2)设受访者购买 A 款饮料的可能性高于购买 B 款饮料的可能性为事件 C.
记购买 A 款饮料的可能性是 20%为事件 A1;购买 A 款饮料的可能性是 60%为事件 A2;购买 A 款饮料的可能性是 90%为事件 A3;购买 B 款饮料的可 能是 20%为事件 B1;购买 B 款饮料的可能性是 60%为事件 B2;购买 B 款饮 料的可能性是 90%为事件 B3.
所以 P(X=65)=C33
1 (3
)3=217
,
P(X=70)=C23 (13 )2(23 )1=29 ,
P(X=75)=C13
1 (3
)1(23
)2=49
,
P(X=80)=C03
2 (3
)3=287
.
X 的分布列为
X
65
70
75
80
P
1
2
4
27
9
9
8 27
所以 E(X)=65×217 +70×29 +75×49 +80×287 =75.
(1)求所抽取的 100 包速冻水饺该项质量指标值的样本平均数 x(同一组中 的数据用该组区间的中点值作代表).
(2)①由频率分布直方图可以认为,速冻水饺的该项质量指标值 Z 服从正
态分布 N(μ,σ2),利用该正态分布,求 Z 落在(14.55,38.45]内的概率;
②将频率视为概率,若某人从该市某超市购买了 4 包这种品牌的速冻水 饺,记这 4 包速冻水饺中该项质量指标值位于(10,30]内的包数为 X,求 X 的分布列和数学期望.
年龄大于 50 岁
12
40
52
年龄不大于 50 岁
18
20
38
总计
11.人教版 高中数学 第十一章 概率与统计(理) 知识网络图及导读分析

第十一章概率与统计(理)编写:王建宏【网络图】【网络导读】数理统计学的核心问题是如何根据样本的情况对总体的情况作出一种推断。
这里包括两类问题:一类是如何从总体中抽取样本;另一类是如何根据对样本的整理、计算和分析,对总体的情况作出判断。
最常用的有三种基本的抽样方法:简单随机抽样、系统抽样、分层抽样.离散型随机变量的分布列完全决定了随机变量的取值规律,但是分布列往往不能明显而集中地表现随机变量的某些特点,例如它的取值的平均水平、集中位置、稳定与波动情况、集中与离散程度等。
离散型随机变量的期望与方差就是体现上述特点的最重要的两种特征数(或数字特征)。
【易错指导】易错点1:统计图表的识图及各个图表和使用限制条件,解题过程中常因为大量的信息数据提取不全面理解不到位而出现各种错误.统计公式记忆不牢,计算过程中计算量太大也是造成失分的重要因素.易错点2:正态总体2(,)N μσ的概率密度函数为2()2(),x f x x R μσ--=∈,当0,1μσ==时,22(),x f x x R -=∈叫做标准正态总体(0,1)N 的概率密度函数,两者在使用范围上是不同的.例题1一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图)。
为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000)(元)月收入段应抽出_____人。
0.0005300035000.00030.0004200015000.00020.0001400025001000月收入(元)频率/组距【解析】由已知可得,每个个体被抽入样的概率均为100110000100=,由条形图可得在[2500,3000)内的频率为该矩形的面积,即得0.0005(30002500)0.25⨯-=,即得该范围内的人数为100000.2525⨯=人,则分层抽样时,该范围内应当抽取的人数为1250025100⨯=人. 【点评】本题考查了统计初步知识及条件统计图的解图及识图能力.考查了考生分析问题与解决实际问题的能力.考生对于条件统计图中数据的收集不正确而出现错误.例题2某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家。
贾俊平版统计学课件 第11章

从相关矩阵可以看出,在不良贷款与其他几个变量的关 系中,与贷款余额的相关系数最大,而与固定资产投资额的 相关系数最小。
11.1.3 相关系数的显著性检验
1. r 的抽样分布
回归模型
1、回答“变量之间是什么样的关系?” 2、方程中运用 1 个数值型因变量(响应变量) 被预测的变量 1 个或多个数值型或分类型自变量 (解释变量) 用于预测的变量 3、主要用于预测和估计
11.2.1 一元线性回归模型
1.回归模型(regression model)
y 0 1 x
i 1 i 1 i 1
n
n
n
相关系数的取值范围及意义
1. r 的取值范围为[-1,1]. 2. r 1 ,称完全相关,即存在线性函数关系. r =1,称完全正相关. r =-1,称完全负相关. 3. r =0,称零相关,即不存在线性相关关系.
4. r <0,称负相关.
5. r >0,称正相关. 6. r 愈大,表示相关关系愈密切.
t 0.05 (23) 2.069
2
由于
t 7.5344 t 0.05 (23) 2.069
2
因此,拒绝 H 0,认为 x 和 y 的相关系数 0 ,即不良贷 款与贷款余额之间的线性相关关系显著.
表11-3 各相关系数显著性检验的t 统计量值
11.2 一元线性回归
11.2.1 一元线性回归模型 11.2.1 参数的最小二乘估计
相关系数的性质
性质 1 : r 具有对称性。即 x 与 y 之间的相关系数和 y 与 x 之间 的相关系数相等,即rxy= ryx 性质 2 : r 数值大小与 x 和 y 原点及尺度无关 ,即改变 x 和 y 的 数据原点及计量尺度,并不改变r数值大小 性质3:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意味着, r=0只表示两个变量之间 不存在线性相关关系,并不说明变量之间没有任何关系 性质 4 : r 虽然是两个变量之间线性关系的一个度量,却不 一定意味着x与y一定有因果关系
第十一章 统计表与统计图

第十一章统计表与统计图(一)名词解释1.统计表 2. 统计图(二)简答题1.统计表和统计图在表达资料中各有何特殊意义?2.统计表有哪些要素构成?制表的注意事项有哪些?3.统计图有哪些要素构成?绘制统计图的注意事项有哪些?4.为什么半对数线图可以描述发展速度的变化?(三)列表、制图与分析题1.某医院对麦芽根糖浆治疗急慢性肝炎161例的疗效列表,试作改进。
2.某地1952年和1972年三种死因别死亡率下表,试将该资料绘制成统计图并作分析。
表12-9 某地1952年和1972年三种死因别死亡率(1/10万)死因1952年1972年肺结核165.2 27.4心脏病72.5 83.6恶性肿瘤57.2 178.21.据下例统计资料试作统计图。
表12-10 某地居民两次粪便蠕虫卵检查结果第一次阳性率(%)第二次阳性率(%)蛔虫钩虫91.4361.2286.3931.36鞭虫17.14 16.51表12-11 某部队1997年各月传染病发病人数月份 1 2 3 4 5 6 7 8 9 10 11 12 合计传染病人数 3 4 7 14 9 14 17 104 58 12 5 2 249表12-12 224例胸膜炎病人的年龄分布年龄(岁)各组人数占全部病人的百分比11~ 4.116~ 13.521~ 44.631~ 27.141~ 8.951~合计 1.8 100.04. 某县防疫站1972年开始在城关镇建立“预防接种卡”,使计划免疫得到加强。
为说明效果,1975年5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性21人;小学生145人,阳性22人;中学生236人,阳性15人。
相比起来,1947年为:幼儿园儿童144人,阳性37人;小学生1417人,阳性323人;中学生359人,阳性41人。
试用适当的统计表和统计图描述上述结果,并作简要分析。
(四)是非题1.一个绘制合理的统计图可直观的反映事物间的正确数量关系。
高考数学一轮复习第十一章统计与统计案例2用样本估计总体课件新人教A版2

;b.决定组距与
组数;c. 将数据分组
;d.列频率分布表;e.画频率分布直方
图.
-3知识梳理
双基自测
(3)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中
点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,
底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方
24
图如图所示,则在抽测的60株树木中,有
株树木的底部
周长小于100 cm.
解析 由题意知,在抽测的60株树木中,底部周长小于100 cm的株
数为(0.015+0.025)×10×60=24.
-11考点1
考点2
考点3
考点 1
组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,
统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体
在各个范围内取值的百分比,它能提供更加精细的信息.
(4)茎叶图:茎叶图中茎是指 中间 的一列数,叶是从茎的 旁边
生长出来的数.当样本数据较少时,用茎叶图表示数据的效果较好,
它不但可以保留所有信息,而且可以随时记录,给数据的记录和表
月平均用电量在[260,280)的用户有0.005×20×100=10(户),
月平均用电量在[280,300]的用户有0.002 5×20×100=5(户),抽
11
1
= ,
取比例为
25+15+10+5
5
所以月平均用电量在[220,240)的用户中应抽取25×
1
5 =5(户).
-14考点1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方法:鉴于实际情况产品的大小、形状、存取状态等方 面的差异及条件限制,常用的随机抽样方法为: (1)简单随机抽样法: (单纯随机抽样) ① 抽签法(或掷骰子法) ② 随机数表法 (2)分层随机抽样 (3)系统随机抽样 (4)多级随机抽样
第十一章描述统计
随机数表法
(1)定义:用随机数表查出样本号码的方法 (2)步骤:
第十一章描述统计
二 总体、个体、样本、样品
1 总体与个体
定义:研究对象的全体,称为总体或母体;组成总体的每个单元称为个体
● 研究对象的全体,指的是研究对象某 个数量 指 标 的 全部取值,由于一个
数量指标通常就是一个随机变量,因此,总体是指某随机变量的取值的全
体。而其中的每 个 值 都 是 一 个 个 体。例如,工厂生产一批晶体管, 共
●自然,由样本推断和估计总体很难做到完全精确和可靠。但是必须 采取措施获得比较精确和具有一定可靠性的推断。其措施涉及两方 面的问题:即抽取样本的方法和统计推断的方法。
● 当样本的抽取满足下列两个条件时,样本将能很好地反映总体的统 计规律性: (1)样本容量n足够大。样本容量越大,推断的结论越准确,可 靠性越高; (2)采用随机抽样,即总体中每个个体被抽到的机会均等,即使 一个个体被抽取后,总体的成分不变。换句话说,每个样品 的抽取都是一次独立、重复试验。
数据的收集是一项重要的基础工作,为了给质 量管理工作提供可靠的准确的情报,搜集数据 时,必须遵循以下原则 1 随机抽样 2 数据的分层 3 明确数据收集的目的和方法 4 作好数据记录,保证数据真实、可靠、准确
第十一章描述统计
1 随机抽样
定义:是指从总体抽取样品时,使每个个体被抽到的机 会均等以使所抽取的样本数据能够很好地代表
第一章 描述统计
• 概率论是研究随机现象统计规律的学问,它为数理统计奠定了理论 基础。所谓数理统计,是以概率论为基础,通过合理地获取随机现 象的少量数据资料,估计和检验反映随机现象的某种数字特征,或 分析和判断随机现象所具有的统计规律性的学问。
• 数理统计的应用相当广泛,它已成为工业、农业、商业、医药卫生、 教育、社会学、经济学、生物学、气象学等各领域必不可少的数学 工具和分析方法,因此又被称为统计技术。
● 至于应采用的统计推断方法将在以后各章讨论
第十一章描述统计
样本与总体的关系
个体具有随机性 总体
总体具有统计规律性
抽样方法正确:①n足够大
条件
②随机抽取
决
统计推断方法正确
定
结果:样本的统计规律性在一定程 度上反映总体的统计规律性
样本
样本随机性 样本具有统计规律性
第十一章描述统计
三 数据收集的原则
一 数据及其实质 二 总体、个体、样本、样品 三 数据收集的原则 四 数据的分类
第十一章描述统计
一 数据及其实质
● 数据:在质量管理的各项活动中,记录有关科 学试验、质量特征、生产状态及管理现 状得到的数字资料统称为数据。
● 实质:收集的数据绝大多数都 既 具 有 随机性 (偶然性)又具有统计规律性。也就是 说它们具有随机现象的某些特征,或者 说是随机变量的一组取值。
• 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并 对数据的分布状态、数字特征和随机变量之间关系进行估计和描述 的方法。它是统计技术的重要组成部分,并在以后各章的统计推断 技术中被应用。
§11.1 数据的收集 §11.2 数字特征描述(估计) §11.3 分布状态描述——频数直方图 §11.4 排列图、因果分析第图十一、章描趋述势统计图
● 随机决定所用数表页码(瞎子点点法或掷骰子法) ● 决定起点(瞎子点点法) ● 查样本号数:
﹡N≤10,查一位数字即可,取到n个样品为止,重复的数字取消 ﹡11≤n≤100,查两位数字,大于n的以n除之取余数,重复数字去掉 ﹡n>100,向下取三位,大于n的以n除之取余数,重复数字去掉
(3)例:从批量N =50的产品中抽n = 4的样本采用掷骰子 采用掷骰子法确定选随机数表“I”;用瞎子点点法确定起点为11行 第1 列,随机号码为18、18、07、92、45、44…取18、7、42、
例: 从批量为10,000的一批晶体管中随机抽取20 件 进行检查,被抽查的20件产品称为样本,而其 中每一件产品称为样品;样本大小为20。由 于人们通常只第获十一得章描样述统本计 数据,故简称为数据
3 样本与总体
● 人们从总体中抽取样本的目的是根据样本数据对总体的数字特征和 分件。其直流放大系数是一个随机变量,10000件产品直流放大系数 数
据的全体称为总体,而其中的一个数据则是一个个体。
● 如果要研究的不是一个,而是几个数量指标,如对一批晶体管不仅要研究
其直流放大系数,还有研 究 集电极-发射电极反向电流时,则要分为几个
总体来研究。
● 总体的有限和无限 类 型 随 研究的问题而定,对于上述的一批晶体管而言,
总体是有限的;但有时根据研究的需要,我们常把相同条件下的生产的所
有晶体管看成一个总体,显然,此时,它是一个无限总体。
2 样本与样品
第十一章描述统计
2 样本与样品
定义:从总体中随机抽取的若干个个体的总和称为 样本或子样;组成样本的每个个体称为样品; 样本中所有的样品的数目称为样本容量或子 样大小,样本容量常用符号n代表
45
第十一章描述统计
分层随机抽样
● 定义:将总体按产品的某些特征把整批产品划分为若干层
(即小批),即分为层,同一层内的产品质量尽可
能均匀一致,在各层内分别用简单随机抽样法抽取
一定数量的个体组成一个样本的方法
● 分层按比例随机抽样:若按各层在整批中所占比例分别在
各层内抽取就称为分层按比例随机
抽样
● 例:某批产品批量为N=1600,由A、B、C三条生产线加工
§11.1 数据的收集
科学研究中,若无定量分析,就不会有明确的 概念,也就不易找出科学的规律。质量管理如果不 进行定量分析,也就不会有明确的质量概念,就不 会有科学的质量管理。因此质量管理是一种以数据 为基础的活动。人们必须通过有目的的搜集数据, 从中获取有关产品质量或生产状态的正确情报,从 而做出正确的判断和决策,更有效地管理生产。