【学习课件】第三章资料的测度与描述(1)
第三章统计数据的描述概要PPT课件
对象的不同而变化的。
如:某地区工业企业职工总数
以该地区每个工业企业职工为总体单位时——总体总量
以该地区每个工业企业为总体单位时——标志总量
7
-
(2)按反映的时间状况——时期指标和时点指标
时期指标——流量 反映总体在一段时期内活动过程的总量, 指标数值可以累计相加, 数值大小和时间的长短有直接关系;
2、作用
最常用的对比分析方法;
使一些不能直接对比的现象有了共同对比的基础; 是经济管理和考核评价企业经济活动状态的重要指标。
9-Leabharlann 3、表现形式百分数:分母抽象成100的比值
相对数的表现形式无名数千 成分 数数
系数(倍数)
有名数——复名数
10
-
(二)相对指标在社会经济分析中的应用
根据研究的目的不同、对比的基础不同,分为: 计划完成相对数——检查计划完成程度 结构相对数——反映现象的结构和分布 比例相对数——反映现象内部比例关系 比较相对数——评价不同单位的实力、优劣 强度相对数——反映现象强度、密度和普遍程度 动态相对数——反映现象发展变化的状态
343.3 477.6 739.1 1510.2 4283.0 6280.0 6859.6 7702.8 8472.2 9421.6 10493.0 11759.5 13785.8 15780.8 17174.7
农村与城镇之 农村居民家庭恩格 城镇居民家庭恩格
比(%)
尔系数(%)
尔系数(%)
38.9
17
-
例2和例3计划完成百分数都大于100%
但是一例完成了计划,一例没有完成计 划,这就表明,在分析计划完成情况时,要注 意计划任务数的性质差异。若计划任务是正指 标,如产值、利润等,其计划完成相对数大于 100%为超额完成计划;若计划任务是逆指标, 如产品成本、原材料消耗量等,其计划完成相 对数小于100%为超额完成计划。
统计学 第3章 数据分布特征描述PPT参考幻灯片
关于加权问题 权数确定方式:
➢客观权数: 权数由实际统计资料获得或推算。
➢主观权数: 根据研究问题,由研究者主观赋值。
权数作用: ➢权衡变量的各种取值在计算平均数时的重 要性。 ➢权数作用,根本上是通过权数结构实现。
#
权数作用:
➢即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。 例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
平均年龄为(单位:周岁)
22 22 25 25 25 25 25 30 30 50 22 ... 30
20
538 26.9 20
表 3-2
年龄 人数(人)
x
f
22
4
25
10
30
5
分组数据不能简单平 均 !因为各组变量值 的次数(权数)不等! 若采用简单平均:
xi fi
i 1 n
fi
xf f
i 1
例3-1单项式分组资料(表3-2)计算方法为:
x 22 4 2510 305 501 4 10 5 1
538 26.9 20
#
3.由组距分组资料计算
➢ 组距分组资料中,各组变量值不唯一,是一个区间;
#
➢位置平均数 根据对总体中处于特定位置的单个或部
分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
#
一、集中趋势指标及作用 集中趋势指标作用 1.反映变量分布的集中趋势和一般水平。
➢如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。
人大《统计学》第三章 数据的描述1
§1.4.1 定性变量的统计表描述
例如:假设某项调查中3000名被访问者按照受教育水平高低可分为四大 类时,除了可以得到每一类所对应的频数、比例分布表,还可计算累积 频数或频率分布表:
§1.4.2 定量变量的统计表描述
对于定量变量,通常采用统计分组,得到每一组所对应的频 数、频率或比例表,用来对数据特征进行描述。
用来描述定性变量取值的图示法都能够用来描述定性变量的数值。 此外,还可以采用直方图、折线图、茎叶图、盒形图来进行描述。
§2.3 定量变量的图示
1.直方图
直方图(Histogram)是根据定量变量的取值范围来显示观测频数的 图。 常用于显示连续型变量在取值区间内的频数分布。 用矩形的宽度和高度(即面积)来表示频数的分布。
§1 用统计表描述数据 §2 用统计图描述数据 §3 用计算机实现制统计图
§1 用统计表描述数据
§1.1 统计表的构成 §1.2 统计表的类型 §1.3 统计表的编制规则 §1.4 数据的统计表描述
§1.1 统计表的构成
统计表一般是由四个主要部分构成:表头,行标题,列标题,数据资料
,必要时需要在统计表的下方加上表外附加。
§1.2 统计表的类型指标按照两个或两个以上的标志层叠分类 所形成的统计表。
§1.2 统计表的类型
4.交叉表
行标题和列标题中的变量指标同时采用分类的形式来表示,使得数 据依据行或列变量分类结果在交叉的单元格中显示。
§1.3 统计表的编制规则
编制统计表的基本指导原则: 简练 美观、科学、实用” 简练、 编制统计表的基本指导原则:“简练、美观、科学、实用
§2.3 定量变量的图示
频 20 数 人
) (
15
10
第三章---数据的概括性度量PPT课件
vs
s x
.
39
4.3 偏态与峰态的度量
• 4.3.1 偏态及其测度 • 4.3.2 峰态及其测度
.
40
偏态与峰态分布的形状
.
41
偏态(skewness)
1. 统计学家Pearson于1895年首次提出 2. 数据分布偏斜程度的测度
3. 偏态系数=0为对称分布
4. 偏态系数> 0为右偏分布
5. 偏态系数< 0为左偏分布
(Population variance and Standard deviation)
.
34
标准分数(standard score)
1. 也称标准化值 2. 对某一个值在一组数据中相对位置的度量 3. 可用于判断一组数据是否有离群点(outlier) 4. 用于对变量的标准化处理 5. 计算公式为
6. 偏态系数大于1或小于-1,被称为高度偏态分布; 偏态系数在0.5~1或-0.5~-1之间,被认为是中 等偏态分布;偏态系数越接近0,偏斜程度就越 低
第 3 章 数据的概括性度量
• 集中趋势的度量 • 离散程度的度量 • 偏态与峰态的度量
.
1
数据分布的特征
.
2
3.1集中趋势(central tendency)
• 一组数据向其中心值靠拢的倾向和程度 • 测度集中趋势就是寻找数据水平的代表值
或中心值 • 不同类型的数据用不同的集中趋势测度值 • 低层次数据的测度值适用于高层次的测量
4. 按着这一逻辑,如果对n个观测值附加的 约束个数为k个,自由度则为n-k
.
32
5. 样=据本5可。有以当3自个由x数取=值值5,确,即定另x后1一=2,个,x则x1,2=不4x能,2和x自x3=3由有9,取两则值个数,x 比取其如他x1=值6,x2=7,那么x3则必然取2,而不能
最新浙教版八年级下册数学第三章《数据分析初步》复习课件(共32张PPT)精品课件
第二十四页,共32页。
5.某公司有15名员工,他们所在的部门(bùmén)及相应每 人所创的年利润如下表所示:
部门 A
人数(个) 1 利润(万元) 20
B CD E F G 1 24 2 2 3 5 2.5 2.1 1.5 1.5 1.2
17,12,5,9,5,14;
解 把这组数据从小到大排列:
5,5,9,12,14,17 位于中间的数是9和12,这两个数的平均数是10.5,因此 这组数据的中位数是10.5; 这组数据的平均数是:(17+12+5+9+5+14)÷6=10.3
第十八页,共32页。
众数的定义(dìngyì):在一组数据中,把出现次数最多的数 叫做这组数据的众数众数.(允许一组数据有多个出现)
刘亮、李飞的射击成绩(chéngjì)的方 差分别是
s2刘亮
=
1 10
[(7
-
8)2
+(8-
第八页,共32页。
• 小明家的超市新进(xīn jìn) 种类
售价
质量
了三种糖果,应顾客要求, 妈妈打算把糖果混合成杂
甲
24元/千克 2千克
拌糖出售,具体进价和用 量如下表:
乙 19元/千克 2千克
丙 28元/千克 6千克
你能帮小明的妈妈计算(jìsuà n)出杂拌糖的售价吗 ?
第九页,共32页。
7、已知数据x1,x2,x3的平均数为a,数据y1,y2,y3的平均数为b,则数据 3x1+y1,3x2+y2,3x3+y3的平均数为 .
第十二页,共32页。
中位数定义:把一组数据(shùjù)从小到大的顺序排列, 位于中间的数称为这组数据(shùjù)的中位数.
现代概率论03:测度空间(1)
现代概率论03:测度空间(1)⽬录第三讲 测度空间(1)2.1 测度的定义及性质2.1.1 测度的公理化定义本节主要讨论测度的定义及性质,在此之前需要引⼊⼏个概念:⾮负集函数:给定空间 X 上的集合系 E ,将定义在 E 上,取值于 [0,∞] 上的函数称为⾮负集函数,常⽤希腊字母 µ,ν,τ,⋯ 来表⽰。
可列可加性:如果对任意可列个两两不交的集合 {A n ∈E,n ≥1} 满⾜ ∞⋃n =1A n ∈E ,均有µ∞⋃n =1An=∞∑n =1µ(An ),则称⾮负集函数 µ 具有可列可加性。
有限可加性:如果对任意有限个两两不交的集合 {A k ∈E,1≤k ≤n } 满⾜ n⋃k =1Ak∈E ,均有µn⋃k =1Ak=n∑k =1µ(Ak ),则称⾮负集函数 µ 具有有限可加性。
可减性:如果对 ∀A ,B ∈E ,满⾜ A ⊂B ,且有 B −A ∈E ,只要 µ(A )<∞ ,就有µ(B −A )=µ(B )−µ(A ),则称⾮负集函数 µ 具有可减性。
本节的核⼼是测度的公理化定义,具体如下:测度的公理化定义:指的是在抽象空间的集合上建⽴的测度。
设 E 是 X 上的集合系,且 ∅∈E 。
若 E 上的⾮负集函数 µ 满⾜:(1) µ(∅)=0 ;(2) 可列可加性,则称 µ 为 E 上的测度。
若 µ(A )<∞, ∀A ∈E ,则称测度 µ 为有限测度。
()()若 ∀A ∈E ,存在 {A n ∈E,n ≥1} ,使得 ∞⋃n =1An⊃A ,则称测度 µ 为 σ 有限测度。
命题 2.1.1:测度具有有限可加性和可减性。
命题 2.1.2:设 X ⊂R, E =Q R ,F 是 R 上⾮降右连续的实值函数。
《管理统计学》第三章 第二节数据集位置的测度.ppt
几何平均数
(其简计单算几公何式平为均数)
N
XG N X1 X 2 X N N Xi i 1
可以用对数形式表示为
N
1
log XG N (log X1 log X2
log Xi log X N ) i1 N
N
log
Xi
XG arc log XG
arc i1
N
几何平均数
15000 25000 8000
合计
—
36900
48000
Xh
X i Fi X i Fi Xi
m m
36900 0.769(元) 48000
Xi
调和平均数
(算例:由相对数计算)
【例3.10】某工业公司有三个工厂,已知其计划完成程度 (%)及计划产值资料如下表,计算平均计划完成程度。
某公司各企业
(简单几何平均数算例)
【例3.11】我国某工业产品1994~1998年期间产量资料如 下表,计算产品平均发展速度。
某工业产品产量平均发展速度计算表
年份 产品产量
逐年发展速度(X)
逐年发展速度的对数
(亿吨) (各年产量为前一年的%)
(lgX)
1993 9.80
--Leabharlann 1994 10.54107.6
2.0319
加权算术平均数的计算公式为
K
X X1F1 X 2F2 F1 F2
X N FN FN
X i Fi
i 1 K
Fi
i 1
简单算术平均数
(算例)
原始数据:
10 5 9 13 6 8
N
X i1 X i X1 X 2 X 3 X 4 X 5 X 6
人教版高中数学必修三第三章第3节 3.3.1 几何概型 课件(共17张PPT)
【变式2】:圆O是边长为2的正方
形的内切圆 , 向这个正方形中随机
地投一点M,设M落在正方形中任一
点的可能性是相同的,试求点M落圆
O中的概率.
O
4
•M
知识探究(二):几何概型的概率
【变式3】一只小虫在一个棱长为20cm盛满 水的正方体容器中游动, 假设小虫出现在容 器中的任意一个位置均为等可能的, 记“它 所在的位置距离正方体中心不超过10cm”为 事件A, 那么事件A发生的概率是多少?
B
N
N
B
B
N
BB
N
N
B
知识探究(一):几何概型的概念
思考 3:上述每个扇形区域对应的圆弧的长度(或 扇形的面积)和它所在位置都是可以变化的,从 结论来看,甲获胜的概率与字母 B 所在扇形区域 的哪个因素有关?
B
N
N
B
B
N
BB
N
N
B
与扇形的弧长(或面积)有关.
知识探究(一):几何概型的概念 思考 4:如果每个事件发生的概率只与构成该事 件区域的长度(面积或体积)成比例,则称这样 的概率模型为几何概型. 参照古典概型的特性, 几何概型有哪两个基本特征?
所有基本事件构成 的区域是什么?
事件A构成的区域 是什么?
在线段AB上任取一
3m
点
A
B
3m
取到线段AB上某一点 A
B
3m
线段AB(除两端外) A
B
线段CD
1m
AC DB
知识探究(二):几何概型的概率
【变式1】:在等腰直角三角形 ABC中,在斜边AB上任取一点M,
求AM的长大于AC的长的概率.
知识探究(二):几何概型的概率
第三章测度
第三章可测集合一、内容结构在R积分的情形,被积函数的定义域是区间或简单区域, 定义域的度量有明确的意义——长度、面积或体积。
在实变函数论中,被积函数的定义域是可测点集,推广积分的概念,首先要定义一般点集的度量,就是本章讨论的集合测度。
测度理论的建立有多种方法,不同的实变函数教材引入的方法有所不同,本章为了更直观、更好地理解掌握L积分,通过测度理论的建立推广R积分的数学思想与方法,直接从L测度的引入建立测度理论。
对于可测集合性质,主要讨论可测集合的充要条件、零测度集及其性质、可测集合的运算性质、可测集合与Gδ型集、Fδ型集的关系、最常用的可测集类型。
主要内容:勒贝格外测度的定义及其基本性质;勒贝格可测集及其基本性质;勒贝格可测集类;开集、闭集、Gδ型集、Fδ型集、Borel集之间的联系。
基本要求:理解勒贝格可测集的定义及其几何意义、勒贝格测度及其基本性质,特别是可数可加性;掌握怎样用开集、闭集、Gδ型集、Fδ型集刻画勒贝格可测集;可测集合的类型与充要条件。
二、主要的数学思想与方法1、从长度、面积、体积到一般点集测度概念由内、外测度建立的思想与方法。
2、Lebesgue当初首先引入外测度m* 与内测度 m*,然后通过条件m* A = m*A 定义可测集, Caratheodory 给出的可测集的导入法:m*T = m * (T∩E ) + m *(T∩CT) (∀T)称E可测,把m*E称为E的测度,记为mE。
两种定义引入的背景、相互间的关系、在学习讨论可测集相关性质等问题时的意义与作用。
3、合列极限定义的思想与方法。
4、零测集的引入及其在实变函数学习中的意义与作用。
5、一般可测集由Gδ集、Fδ集、零测集构成的思想与方法。
三、疑难点学习方法(一)直线上有界点集的测度点集的测度更着重于直线上有界点集的测度。
用构造的方法来讲解点集的测度,从中我们可以学到一种成套理论的模型。
先从最简单的开集测度出发,再学习闭集的测度、一般点集的内测度与外测度及可测集合。
自考统计学原理第三章:统计数据的描述与显示(PPT)
d为众数组的组距;
1=fm-fm-1,即众数组的次数与下一组(或前一组)次数之差;
2=fm -fm+1,即众数组的次数与上一组次数之差
众数计算
按产值分组 (万元) 50 以下
50—60 60—70 (L)70—80(U) 80—90 90 以上
合计
人数 (人)
10 20 40(fm-1) 50(fm) 40(fm+1) 30 190
当n为偶数时,Me =中间位置两侧的两个变量值的简单平均。
如,24,25,25,26,26,27,28,29
按年龄分组 人数(f)
向上累计
向下累计
(二)根据分组资料确定中位数 1、由单项式数列确定中位数
15(下方) 16 17
18(Me 组) 19
20(上方)
合计
10
10(1—10)
181(171—180)
(2)绝对值运算给数学处理带来很多不便。
三、方差和标准差
方差( ):2 各变量值与其算术平均数离差平方的算术平均数;
标准差(
):各变量值与其算术平均数离差平方的算术平均数
的平方根。
(一)方差和标准差的计算
方差的简单式 : σ2
Σ(x
x)2 ;(未分组资料)
n
方差的加权式 : σ2
Σ(x
x)2f ;(已分组资料)
G nx 1 •x 2 •.x .n . nπx
• 计算方法:
举例:计算我国2002—2007年期间的GDP年平均增长率
我国 2002—2007 年各年国内生产总值及增长率
年份
GDP(亿元)
增长率(%)
发展速度(%)
2002 2003 2004 2005 2006 2007
实变函数课件第三章测度论
授课对象:17级数应班 教师:侯利元
第二章
§1.外侧度 §2. 可测集 §3. 可测函数
§4.不可测集✷
第三章 测度论
• 1、掌握外测度的定义及其基本性质.
• 2、理解区间及有理点集的外测度及其证明方 法.
• 3、深刻理解可测集的定义,学会用 Caratheodory条件验证集合的可测性.
i1
mE inf{ | Ii | : E Ii}
i 1
i 1
第一节 外测度 1、定义
下确界:
(1) 是数集 S 的下界,即 x S , x (2) 是数集 S 的最大下界,即 0, x S, 使得 x
0, 开区间列{Ii },
使得 E
i 1
Ii
且
m*E | Ii | m*E i 1
n1
由
的任意性,即得
m*
(
n 1
An
)
n1
m* An
第一节 外测度 2、性质
注:一般证明都是从大的一边开始,因为外测 度的定义用的是下确界
第一节 外测度 3、例题
例1 设E是[0,1]中的全体有理数,试证明E 的外测度为0.
思考: 1. 证明平面上的有理点全体外测度为0 2. 平面上的X轴的外测度为0
Inm 近似替换 An ) In1, In2 ,
ቤተ መጻሕፍቲ ባይዱ
Inm ,
, 使得 An
m1
Inm
且
m*
An
|
m1
I nm
|
m* An
2n
从而
n1
An
n1
m1
I
nm
,且
|
n,m1
管理统计学 第2版 第三章 数据特征的描述与分析
某工厂有五条相同的流水线,生产同一产品且生产速度相同,各流水线的合 格率分别为 95%、92%、90%、85%、80%,那么该工厂产品的平均合格率 是多少?如果某流水生产线有前后衔接的五道工序,各工序产品的合格率分 别为95%、92%、90%、85%、80%,那么产品的平均合格率又是多少?
x x1 x2 xn 95% 92% 90% 85% 80% 88.40%
X F2 2
X N FN
9 (105.3%)3 (104.5%)2 (102.1%)4
103.90%
投资者平均股票的平均收益率为103.90%-1=3.90%
3.1 集中趋势的测度与应用
中位数
中位数是位置平均数,若将变量值按大小顺序排 列,处于中点位置的变量值即为中位数。
中位数不受极端数值的影响,在由个别极端数值 存在的数列种,中位数的代表性比算术平均数的 代表性强。
为:
X
K
Xi
Fi
K
593 .10(元)
i 1Leabharlann Fii 1算术平均数
3.1 集中趋势的测度与应用
算术平均数的性质 (1)各变量值与其均值的离差之和等于零,即:
未分组资料: 分组资料:
N
(X i - X ) 0
i 1
N
(X i - X )Fi 0
i 1
(2)各变量值与其均值的离差平方和最小,即:
中位数的计算一般分两步,首先确定中位数位置, 然后找出中位数位置对应的变量值。
3.1 集中趋势的测度与应用
中位数
未分组资料计算中位数 (1)中位数的位次= N 1 2
式中,N为变量值的项数。
(2)若用Me表示中位数则有:
Me
数据分布特征的测度 86页PPT文档
132
一般
93
225
满意
45
270
非常满意
30
300
合计
300
—
解:下四分位数(QL)的位置为: QL位置=(300)/4=75 上四分位数(QL)的位置为: QU位置=(3×300)/4=225
从累计频数看, QL在“不满意 ”这一组别中; QU在“一般” 这一组别中。因此
QL =不满意 QU =一般
数据分布的特征和测度
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰度
第一节 集中趋势的测度
一. 定类数据:众数 二. 定序数据:中位数和分位数 三. 定距和定比数据:均值 四. 众数、中位数和均值的比较
数据特征分布的和测度 (本节位置)
5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定
众数
众数
(概念要点)
1. 集中趋势的测度值之一 2. 出现次数最多的变量值 3. 不受极端值的影响 4. 可能没有众数或有几个众数 5. 主要用于定类数据,也可用于定序数据
和数值型数据
众数
(众数的不唯一性)
无众数 原始数据: 10 5 9 12 6 8
QU = 28+0.25(30-28) = 28.5
数值型分组数据的四分位数
(计算公式)
下四分位数:
QL
LL
N 4
SL fL
iL
上四分位数:QU
LU
N 4
SU
fU
iU
数值型分组数据的四分位数
第三章资料的测度与描述-统计学
n
=
n
Xi
2
X i i 1
n
2
i 1
n
0
n 1
3-23
變異數性質:
(1) 設X的母體變異數為
2 X
,平均數為X,
若Y = aX + b,a,b R,則 Y = aX + b,
Y = a2
2
2 X
,Y = |a|X
(2) ( X i )
统计学
3-1
第三章
■ 3-1 ■ 3-2 ■ 3-3 ■ 3-4 ■ 3-5 ■ 3-6 ■ 3-7
資料的測度與描述
集中趨勢量數 離勢量數 形狀 平均數與標準差的應用 枝葉圖及箱形圖 電腦範例 流程圖
3-2
透過各種蒐集方法的資料經過整理後,還 需進一步描述一群數量資料的特性,其方 法大致有:
1. 2. 3. 集中趨勢量數(measured of central tendency)。 離勢量數(measured of dispersion)。 形狀(shape)。
其中N表全部資料的個數,a表落在( - , + )之間的個數,b表落在 ( - 2, + 2 )之間的個數,c表落在( - 3, + 3 )之間的個數。
k
k
1
(,+)
至少0
2
2.5 3
( 2, + 2 )
至少75%
( 2.5, + 2.5) 至少84% ( 3 , + 3 ) 至少88.9%
3-40
• 二、經驗法則(empirical rule) • 設資料近似單峰對稱分配,則 • 1. 在平均數左右1個標準差之範圍內的觀 測值約佔68%。 • 2. 在平均數左右2個標準差之範圍內的觀 測值約佔95%。 • 3. 在平均數左右3個標準差之範圍內的觀 測值約佔99.7 %。 • 將謝比雪夫定理,經驗法則與實際結果整 理如下表:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D9 = P90
.
3-11
• 四、眾數(mode):通常以M0表示。 • (三) 眾數的求法 • A. 未分組資料 • B. 已分組資料 • 普通求眾數的方法大致有:
.
3-12
• 1. 視察法
• 2. King’s插補法(W.I. King’s method)
• 3. Czuber’s比例法(Czuber’s proportional method)
deviation)
.
3-20
• A. 未分組資料
母體變異數 2 =
N
(X
i
)2
N
X
2 i
i 1
N
= i1
N
2
.
3-21
樣本變異數
S2
n
(X
= i1
i
X
)2
n 1
=
n
X
2 i
nX
2
i 1
n 1
=
n
X
2 i
i 1
n
(
X
i
)2
i 1
n
n 1
=
n
n
X
2 i
i 1
n
i 1
X
i
2
n(n 1)
標準差就是變異數的平方根,通常
• 1. 母體資料:母體平均數 • 2. 樣本資料:樣本平均數 X 、Y 等。
.
3-4
(二)加權算術平均數:
• 母體加權算術平均數
w
=
w1X1 wNX=N
w1 w2 wN
N
w iX i
i1 N
wi
i1
樣本加權算術平均數
X w=
n
w iX i
i1 n
wi
i1
.
3-5
• B. 已分組資料:
N11 N22
以(或S)表示。
.
3-22
母體標準差 =
N
(X
i
)2
i 1
N
=
N
X
2 i
N
2
i 1
0
N
樣本標準差 S = =
n
(X
i
X
)2
i 1
n 1
n i 1
X
2 i
n i 1
X n變異數性質:
(1)
設X的母體變異數為
2 X
,平均數為X,
若Y = aX + b,a,b R,則 Y = aX + b,
組界 L1~U1 L2~U2
Lk~Uk
合計
次數fi f1 f2
fk
k
fi
i1
組中點mi m1 m2
mk
fimi f1m1 f2m2
fkmk
k
fimi
i 1
.
3-6
k
•
(1) 母體平均數: =
i1
fim
i,N
=
k
f 。i
N
i1
k
• (2) 樣本平均數: X =
i1
fim
i ,n
=
n
k
f。i
統計學
郭信霖 許淑卿
.
3-1
第三章 資料的測度與描述
■ 3-1 集中趨勢量數 ■ 3-2 離勢量數 ■ 3-3 形狀 ■ 3-4 平均數與標準差的應用 ■ 3-5 枝葉圖及箱形圖 ■ 3-6 電腦範例 ■ 3-7 流程圖
.
3-2
透過各種蒐集方法的資料經過整理後,還 需進一步描述一群數量資料的特性,其方 法大致有: 1. 集中趨勢量數(measured of central
i1
.
3-7
二、中位數(median):通常以Me(或)表示。
• A. 未分組資料 其步驟如下: • 1. 由小到大順序排列,X(1) X(2) … X(n)。
• 2.
Me =
X
n 2
1
,
X
n
X n 1
2
2
2
n 不為整數 2 , n 為整數 2
.
3-8
• B. 已分組資料
•
• 4. Perason’s經驗法(K. Pearson’s method)
• 當次數分配為單峰對稱時,則 X = Me = M0 • 當次數分配為單峰微偏時,則 X M0
3( X Me)或M0 - 3( X Me)
.
3-13
圖33 單峰對稱分配
.
3-14
圖34 單峰微偏分配
.
3-15
• ※五、全距中點(midrange)與中樞紐 (midhinge)
Me = Li +
n 2
F i1 h
fi
三、其他分位數: • 四分位數(Quartiles,Qi,i = 1, 2, 3 ) • 十分位數(Deciles,Di,i = 1, 2, ‥., 9) • 百分位數(Percentiles,Pi,i = 1, 2, ‥., 99) 。
.
3-9
• A. 未分組資料 • B. 已分組資料 • Me、Qj、Dj及Pj之關係 • 1. 表3-13
tendency)。 2. 離勢量數(measured of dispersion)。 3. 形狀(shape)。
.
3-3
3-1 集中趨勢量數
用來描述該組資料的中心位置所在或集中的程度,謂之集 中趨勢量勢,又稱中心位置量數(measure of central location)。 一、平均數(mean) (一)算術平均數 • A. 未分組資料:
• (一) 全距中點(midrange) • (二) 中樞紐(midhinge) • 六、截尾平均數與溫塞平均數 • 1. 截尾平均數 • 2. 溫塞平均數
.
3-16
3-2 離勢量數
• 離勢(dispersion),又稱為離差(derivation)或 差異量數。
• 一、意義 • 離勢是用來衡量資料的集中或分散程度,亦就是
of absolute dispersion)
絕對離勢量數四 :全 分距 位、 差、變異 準數 差、。標 相對離勢量數數 :變異係
.
3-19
• 1. 全距(range,R) • 2. 四分位差(quartile deviation,Q.D.) • 3. 平均偏差(average deviation,A.D.) • 4. 變異數與標準差(variance and standard
2 Y
= a2
2 X
,Y = |a|X
(2)
N
(X i
)2
i 1
N
(Xi
A) 2
i 1
N
N
.
3-24
• (3) 若甲、乙二組母體資料的變異數、平均 數及大小如下表,則合併後之平均數、變
異數為何?
• 表3-16
組 別 大 小 平均數 變異數
甲
N1
1
2 1
乙
N2
2
2 2
.
3-25
則
總平均數 =
名稱 中位數 四分位數 十分位數 百分位數
分割點 1個 3個 9個 99個
分位數值
Me Q1,Q2,Q3
D1, …, D9 P1, …, P99
.
3-10
• 2. (1) Me = Q2 = D5 = P50
(2) Q1 = P25,Q3 = P75
(3) D1 = P10 ; D2 = P20
‥.
測量各個觀測值之間的差異變化情形。 • 如表3-15。
.
3-17
組別
資料
平均數 中位數 全距
甲 10 0 10 20 30 10
10
40
乙 4 5 10 15 16 10
10
12
丙 10 10 10 10 10 10
10
.
0
3-18
• 二、種類 • 離勢量數:(一) 絕對離勢量數(measure