数值变量的统计描述
数值变量的统计描述
累计频率(%) (5)
4.17 8.33 14.17 25.83 41.67 65.83 78.33 88.33 93.33 96.67 100.00
2、频数分布图
以观测变量为横轴,频数(或频率)为纵轴所 作的直方图,称为频数分布图。横轴依次以等距 标出各组段的起点,在各组段上方分别绘制宽度 等于组距、高度等于相应频数的长方形。
观察分布范围及有无可疑值
确定分布的类型:对称或不对称分布
对称分布
频数分布图表现为图形以某一数值对称或近似 对称分布
直方图形中间直条最高,两边对称地逐渐减少 ,统计学称之为正态分布或近似正态分布
不对称分布
分布不对称者称为偏态分布skewness distribution
偏态分布又分为正偏分布和负偏分布
列出组段:第一组段的下限略小于最小值,最后一个组段上限 必须包含最大值
统计出各组的频数并整理成频数分布表
根据这些数据编制成的频数表能显示出这组数据分布的特征
组段 (1)
0.98~ 1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~ 1.89~ 2.02~ 2.15~ 2.28~2.41 合计
你能看出资料有什么规律?
理想的描述结果ຫໍສະໝຸດ 组段 (1)0.98~ 1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~ 1.89~ 2.02~ 2.15~ 2.28~2.41 合计
频数 (2)
5 5 7 14 19 29 15 12 6 4 4 120
频率(% )
(3) 4.17 4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00
第八章 数值变量资料的统计描述
第三节 离散趋势指标
32
离散度(变异度):一组同质计量 离散度(变异度) 资料各数据之间参差不齐的程度, 资料各数据之间参差不齐的程度, 称为离散度。 称为离散度。 全距 常用指标: 常用指标: 全距 四分位数间距 四分位数间距 方差和标准差 方差和标准差 变异系数 变异系数
平均抗体效价 :16。 平均抗体效价1: 。
23
二、几何均数
计算几何均数注意事项: 计算几何均数注意事项: ①变量值中不能有0,因为0和负数 变量值中不能有0 因为0 不能取对数。 不能取对数。 ②不能同时有正值和负值; 不能同时有正值和负值; ③若全是负值,计算时可先把负号 若全是负值, 去掉,得出结果后再加上负号。 去掉,得出结果后再加上负号。
16
1.直接法:用于观察值个数不多时 1.直接法: 直接法
X1 + X 2 + + X n X= = n
∑X
n
17
2.加权法:用于变量值个数较多时。 2.加权法 用于变量值个数较多时。 加权法:
f1X1 + f2X 2 ++ fk X k ∑ fX X= = f1 + f2 ++ fk ∑f
29
计算公式: 计算公式:
i Px = L + (n x% Σf L ) fx
30
计算中位数及百分位数的步骤: 计算中位数及百分位数的步骤:
先找到包含Px的最小累计频率; Px的最小累计频率 1. 先找到包含Px的最小累计频率; 该累计频率同行左边的组段值为L 2. 该累计频率同行左边的组段值为L; 同行右边的频数为fx( fm); fx(或 3. L同行右边的频数为fx(或fm); 前一行的累计频数为∑fL; 4. L前一行的累计频数为∑fL; 将上述已知条件代入公式计算Px Px或 5. 将上述已知条件代入公式计算Px或 P50 。
第二章数值型变量的统计描述
例:某公司五名职员的薪水分别是: 10,100,1000,10000,100000。
10 100 1000 10000 100000 X 22222 5
G 10 100 1000 10000 100000 1000
5
lg 10 lg 100 lg 100000 1 15 G lg ( ) lg ( ) 1000 n 5
统计工作四大步骤之一:分析资料
分析资料:计算有关指标,反映数据的综合特 征, 阐明事物内在联系和规律 (1)统计描述(descriptive statistics):指用统计
指标、统计表、统计图等方法,对资料的数量特 征及其分布规律进行测定和描述 。
(2)统计推断(inferential statistics):指如何根
n 2 n 1 2
2
求:中位数
第1组数:1、4、 3、 2、 3 第2组数: 3、 2、1、 3 第3组数:1、2、 1、 2
(2)频数表法:
适用于样本例数较大的资料(百分位数法)
步骤: ①从小到大计算累计频数和累计频数; ②确定中位数和百分位数所在组段;
③计算中位数M和百分位数PX
i Px= L n x % f L fx
考考你: BUN组段(1)
BUN组段(2)
2.00~2.40 2.40~2.80 2.80~3.20 3.20~3.60
BUN组段(3)
2.00~ 2.40~ 2.80~ 3.20~3.60
2.00~2.30
2.40~2.70 2.80~3.10 3.20~3.50
4、列表划记(数频数):统计各组段内的
例2-3
二、几何均数(geometric mean)
数值变量资料的统计描述知识介绍
包括均值、中位数、众数、标准差、变异系数等统计量,用于描述数值变量的 集中趋势和离散趋势。
图形描述
直方图
通过直方图可以直观地展示数值变量取值的分布情况,包括 频数和频率。
箱线图
通过箱线图可以展示数值变量的最小值、下四分位数、中位 数、上四分位数和最大值,以及异常值的情况。
文字描述
众数
总结词
众数是数据中出现次数最多的数值。
详细描述
众数是一组数据中出现次数最多的数值。在统计学中,众数用于描述数据的分布特征,特别是当数据 中出现多个众数时,说明数据存在多个峰值,此时数据的分布可能是多峰的。众数在市场调研、人口 统计等领域有广泛应用。
03
数值变量的离散程度描述
方差
方差是衡量数值变量离散程度的 重要指标,它表示各个数值与平 均数的偏差的平方的平均值。
回归分析
01
回归分析
通过建立一个或多个自变量与因 变量之间的数学模型,来描述变 量之间的因果关系。
Байду номын сангаас
02
回归分析的种类
03
回归分析的应用
线性回归、多项式回归、逻辑回 归等。
预测、解释和调控因变量的变化 趋势。
协方差分析
协方差分析
用于比较两组数值变量的总体均 值是否存在显著差异,同时考虑 变量的共同变异。
正态分布
总结词
正态分布是最常见的连续型概率分布, 其特征是钟形曲线,对称轴为均值所在 直线。
VS
详细描述
正态分布适用于许多自然现象的概率分布 ,如人的身高、考试分数等。其概率密度 函数曲线呈钟形,对称轴为均值所在直线 ,即曲线关于均值所在直线对称。在正态 分布中,约68%的数据落在均值的1个标 准差范围内,约95%的数据落在均值的2 个标准差范围内。
数值变量资料的统计描述
第一章数值变量资料的统计描述统计描述(statistical description)即利用原始数据,选择适宜的统计指标及统计图表,简明准确地探察数据的分布类型和数量特征,以便研究者根据样本信息,正确地推论其总体规律的统计分析方法。
统计指标(statistical index)是表示数据分布特征的一个或一组数值,是统计分析的基本依据.第一节频数分布的概念与应用对获取的数据进行统计学分析之前,了解数据的分布特征是至关重要的。
因为很多参数分析方法都要求样本数据来自某种已知分布的总体,否则,就应对数据实施合适的数据转换,或者采用非参数分析方法。
对频数表及频数图进行分析是描述性统计学分析的基本内容,也是表达或探索数据分布特征的基本手段.一、频数分布1.频数分布(frequency distribution)的概念频数(frequency)是相同观察值或观察结果出现的次数;分布(distribution)指随着随机变量取值的变化,其相应的概率变化的规律性。
频数分布即观察值(变量值)按大小分组,各个组段内观察值个数(频数)的分布,它是了解数据分布形态特征与规律的基础.2.频数分布的特征(1)集中趋势(central tendency):指一组变量值的集中倾向或中心位置.(2)离散趋势(tendency of dispersion):指一组变量值的分散倾向。
3.频数分布的类型⑴对称分布:指集中位置居中、左右两侧的频数分布基本对称的频数分布。
又可分为正态分布(normal distribution)和非正态分布(non-normal distribution).⑵偏态分布:是集中位置偏倚、两侧频数的分布不对称的频数分布,可分为两类:①正偏态:亦称右偏态,特点是峰偏左,此时均数与众数之差为正值,长尾向右侧(即观察值较大一端)伸延;②负偏态:亦称左偏态,特点为峰偏右,此时均数与众数之差为负值,长尾向左侧(即观察值较小一端)伸延。
预防医学-数值变量的统计描述PPT
M
n为偶数时,
M=
x n x n 1
2
2
2
(2)频数表法:适用于频数表资料 步骤: ①从小到大计算累计频数和累计频数; ②确定百分位数和中位数所在组段; ③计算百分位数Px和中位数M
Px=
L
i fx
n
x
%
fL
M=P50=
L
i fx
n 2
fL
L=Px或M所在组段的下限 i=Px或M所在组段的组距 fx=Px或M所在组段的频数
P25:下四分位数,简记QL P75:上四分位数,简记QU 2、意义:中间一半观察值的极差,意义与R相似。 3、特点:(1) 比R稳定,但仍未考虑每一个观察
M=23.52 (h)
fx=63(或M所在组段的频数)
f L =30(小于L各组段的累计频数)
Descriptive Statistics
描述数值变量资料的集中趋势(central tendency)指标 • 中位数( median )和百分位数( percentile )
M 所在组段下限值 组距 (n 50% 至该下限值的累计频数)
⑶组距=极差/组数(拟采用等距分组) ⑷定组段:划范围 ⑸统计各组段的人数:
划记
80.1
读取数据,然后“对号入座”
100.1
Descriptive Statistics
频数分布表(frequency table)
• 频数表的用途: 1.描述频数分布的类型和特征
2.便于发现一些特大或特小的可疑值
3.便于进一步做统计分析和处理
fL =小于L各组段的累计频数
起点
数值变量资料的统计描述
fX2
(5)= (2)×(3) 2
20.10 37.07 114.70 198.98 346.74 521.67 401.03 313.27 227.53 148.21 106.92 57.67
2493.89
N=∑f .
红细胞数
40
30
20
Frequency
10
Std. Dev = .45
可用于反映一组经对数转换后 呈对称分布或正态分布的变量值在 数量上的平均水平。
.
几何均数(geometric mean)
G n X1X2 Xn
lgG
1 n
(lg
X1
lg
X2
lg Xn)
lg X n
Glg1 lg X
n lg 表示以10为底的对数;
几何均数:变量对 数值的算术均数的 反对数。
lg1表示以10为底的反对数 X 0,为正值
(3) 列出组段:第一组段的下限略小于最小值,最后一个组段 上限必须包含最大值。
(4) 划记计数:用划记法将所有数据归纳到各组段,得到各组 段的频数。
.
138名成年女子的红细胞数(×1012/L)频数分布
组段
(1) 3.07~ 3.27~ 3.47~ 3.67~ 3.87~ 4.07~ 4.27~ 4.47~ 4.67~ 4.87~ 5.07~ 5.27~5.47
.
算术均数
算术均数:简称均数(mean) 可用于反映一组呈对称分布的变量
值在数量上的平均水平或者说是集中 位置的特征值。
.
1、计算方法
(1)直接计算法
公式 : XX1X2 Xn X
n
n
举例:试计算4,4,4,6,6,8,8,8,10的均数?
数值变量统计描述10.9.12
2.便于发现一些特大或特小的可疑值
3.便于进一步做统计分析和处理
Descriptive Statistics
描述数值变量资料的集中趋势(central tendency)指标
统计上使用平均数(average)指标体系来描述一组变量值的集中 位置或平均水平。 常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median)与百分位数(percentile) 众数(mode)
2 1.54 5 3.85 12 9.23 15 11.54 25 19.23 26 20.00 19 14.62 15 11.54 10 7.69 1 0.77 130 N=∑f
2 7 19 34 59 85 104 119 129 130
1.54 5.38 14.62 26.15 45.38 65.38 80.00 91.54 99.23 100.00
统计描述:利用 统计图、统计表 、统计指标等来 描述样本资料的 特征。
统计分析
变量关系
参数估计
统计推断
假设检验
Descriptive Statistics
频数分布表(frequency table)
数值变量资料的分类:
离散型资料(discrete data):是指变量取值可以一一列举
的资料。例如,每个育龄妇女现有的子女数。 如1998年某山区96名孕妇产前检查次数资料如下:0,3,2, 0,1,5,6,3,2,4,1,0,6,5,1,3,3,…4,7。
77
69 84 80
75
68 66 68
79
65 70 76
64
70 73 70
79
2-数值变量与分类变量的统计描述分析
实习二统计描述第164~180页实习二统计描述医学统计资料类型¾数值变量资料:又称为计量资料。
变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。
变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。
变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述统计描述包括两个方面:集中趋势的描述和离散趋势的描述一、数值变量资料的统计描述(一)数值变量资料的频数表频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途1.描述数值变量资料的分布特征集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。
反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途2.描述数值变量资料的分布类型正态分布:集中位置居中,左右两侧频数基本对称。
常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线直方图及近似正态分布直方图及正偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(三)集中趋势指标描述1.算数均数(均数mean )适用于正态分布或者近似正态分布总体均数:µ;样本均数:一、数值变量资料的统计描述一、数值变量资料的统计描述(三)集中趋势指标描述2.几何均数(geometric mean,G)适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。
二数值变量统计描述-精选
根据表2-1频数的分布可绘出频数分布图。
30
25
20
频 率 % 15
10
5
0
产前检查次数 0
1
2
3
4
5
>5
某地96名妇女产前检查ics
频数分布表(frequency table)
连续型资料( continuity data) 2019年某校100名18岁健康女大学生(cm)资料
频数表的用途:
1.描述频数分布的类型和特征
Descriptive Statistics
频数分布表(frequency table)
频数表的用途:
1.描述频数分布的类型和特征
(1)对称分布 :若各组段的频 数以中 心位置左右两侧大 体对称,就认为该资料是对 称分布
频数
25
20 15
10 5
0 2.45 3.05 3.65 4.25 4.85 5.45 6.10 血 清 总 胆 固 醇(mmol/L)
本例i= R /10=1.26/10=0.126≈0.1。 (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限 必须包含最大值,其它组段上限值忽略。 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的 频数。
Descriptive Statistics
频数分布表(frequency table)
Descriptive Statistics
描述数值变量资料的集中趋势(central tendency)指标
算术均数(arithmetic mean :简称均数(mean)
可用于反映一组呈对称分布的变量值在数量上的平均水平 或者说是集中位置的特征值。
第二章 数值变量资料的统计描述
频数分布的类型
频数分布分为对称分布和偏态分布两种类型。 频数分布分为对称分布和偏态分布两种类型。 对称分布是指集中位置在正中, 对称分布是指集中位置在正中,左右两侧频 数分布大体对称,如上表所示。 数分布大体对称,如上表所示。若将其绘制 成频数分布直方图,则更清楚。 成频数分布直方图,则更清楚。 直方图是以x 本例为体重) 为横坐标 , 直方图是以 x( 本例为体重 ) 为横坐标, 频 数或百分数为纵坐标, 数或百分数为纵坐标,用矩形面积大小表示 频数多少。 频数多少。
某地150名12岁男童体重频数分布图 名 岁男童体重频数分布图 某地
40
30
Frenquency
20
10
0 21.5 24.5 27.5 30.5 33.5 36.5 39.5 42.5 45.5 48.5 51.5
体重(kg)
频数分布的类型
偏态分布指集中位置偏向一侧, 偏态分布指集中位置偏向一侧 , 频数分布 不对称。 不对称。 一些以儿童为主的传染病, 一些以儿童为主的传染病 , 患者的年龄分 布 , 集中位置偏于年龄小的一侧, 频数尾 集中位置偏于年龄小的一侧 , 部向右侧延伸, 称为正偏态 ( 部向右侧延伸 , 称为正偏态( 峰 ) 分布 , 分布, 如图
一、频数分布表(frequency table)的编制 频数分布表( table)
某地儿研所测得该地150名12岁健康男童体重 某地儿研所测得该地150名12岁健康男童体重 kg)原始数据如下,试编制频数表。 (kg)原始数据如下,试编制频数表。
25.2 30.5 36.5 35.1 37.1 37.1 28.7 31.4 36.8 27.3 37.6 37.8 35.7 34.9 36.2 42.5 37.8 44.0 29.2 33.7 34.1 27.2 48.6 25.5 33.4 39.3 34.3 51.0 33.7 32.4 35.6 38.2 35.1 25.3 34.0 35.8 37.3 32.2 42.2 38.1 38.0 29.3 38.5 44.5 41.1 42.9 29.6 34.7 29.7 37.5 33.4 35.3 41.3 43.8 39.6 28.2 46.5 36.2 20.1 38.2 44.4 45.6 41.5 32.4 30.1 27.8 40.9 37.5 36.5 35.0 43.5 35.4 43.7 41.2 41.8 38.4 32.8 27.2 33.8 37.5 39.6 23.4 31.8 32.8 26.5 33.8 35.3 33.0 44.2 36.8 37.7 36.6 33.2 35.8 36.4 36.3 42.0 24.5 42.6 28.3 43.2 45.7 28.4 33.4 32.1 34.1 36.2 31.8 39.6 29.2 34.1 33.3 31.5 41.2 33.5 47.4 29.9 27.6 47.9 30.6 38.7 45.9 30.0 35.1 40.2 40.9 47.3 36.4 43.7 42.6 38.7 38.5 35.4 32.5 31.4 40.6 34.5 36.5 34.8 41.4 33.8 23.1 20.5 39.6 51.2 23.5 40.8 38.2 37.4 47.9
2.数值变量资料的统计描述
3. 中位数 (median,M)
﹡ 将一批数据从小至大排列后,位次居中的数
据值为M。 ﹡应 用
﹡计算方法
偏态分布资料; 变量值分布一端或两端无确定数值; 分布不明资料。
M = n+1
2
直接用变量值计算 或 M=
1 2
(n为奇数时) (n为偶数时)
18
n 2
+ n
2
+1
用频数表计算
i M= L+ (
2
• 对一组研究对象进行观察,某变量或指标 (如肺活量)数值出现的次数被称为频数 (frequency); • 可以将各变量值及其出现的频数编制频 数分布表(frequency distribution table); • 用来反映各变量值与其频数之间的关系, 并观察资料的分布类型
3
一、频数分布(Distribution of frenquency)表与频数分布图
= 9.83(天)
医学院 预防医学教研室 2013/7/4
24
均数、中位数的关系
正态分布时: 均数=或中位数;
正偏态分布时: 均数>中位数;
负偏态分布时: 均数<中位数
25
例:有3组同龄男孩体重(kg)如下,其平均
体重 X 都是30(kg),试分析其离散趋势。
组别
甲组 乙组 丙组
1
1
抗体滴度 ⑴ 1:2.5 1:10 1:40 1:160 1:640 合计
人数,f ⑵ 14 18 22 12 6 72
滴度倒数,X ⑶ 2.5 10.0 40.0 160.0 640.0
lgX ⑷ 0.3979 1.0000 1.6021 2.2041 2.8062
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
根据这些数据编制成的频数表能显示出这组数据分布的特征
表4-2 2005年某市120名9岁男孩肺活量(L)频数分布 组段 (1) 频数 (2) 频率(%) (3) 累计频数 (4) 累计频率(%) (5)
0.98~
1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~ 1.89~ 2.02~ 2.15~ 2.28~2.41 合计
0.98 1.11 1.24 1.37 1.50 1.63 1.76 1.89 2.02 2.15 2.28 肺活量
频数 (2 ) 5 5 7 14 19 29 15 12 6 4 4 120
频率(%) (3 ) 4.17 4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00
19
对称分布
频数分布图表现为图形以某一数值对称或近似 对称分布 直方图形中间直条最高,两边对称地逐渐减少, 统计学称之为正态分布或近似正态分布
3
统计描述
为什么要对资料进行统计描述?
医学研究得到的原始数据(raw
data)往往是庞大的、混乱的
个体变异的存在,医学研究中某指标在各个体上的观察结
果不是恒定不变的,但也不是杂乱无章的;从总体的角度上
个体值的出现是有一定规律的,即呈一定的分布
统计描述的结果为进一步的统计推断提供参考
4
本章内容
1.665
1.175
1.289
1.867
1.724
1.676
1.548
1.277 0.989
1.608
… 1.291 1.670 1.930
1.890
1.796 1.056 1.725
1.733
1.647 1.969 1.374
1.736
0.996 2.123 1.438
1.450
1.936 1.988 1.645
15
2、频数分布图
以观测变量为横轴,频数(或频率)为纵轴所作
的直方图,称为频数分布图。横轴依次以等距标出 各组段的起点,在各组段上方分别绘制宽度等于组 距、高度等于相应频数的长方形。 用途与频数表类似,但更直观、形象。
16
图4.1 2005年某市120名9岁男孩肺活量频数分布
17
肺活量的分布形态
例4.2 在某市2005年进行的小学生体质评价研究中, 测定了120名9岁男孩的肺活量(L),资料如下,根据 该资料制作频数表。
1.706
2.091
1.326
1.847
1.632
1.213
1.876 1.796
1.415 1.654
2.161 1.203
1.873 1.663
1.684
2.235
1.533
7
(一)离散型定量变量的频数表
其取值是不连续的变量被称为离散型变量。
其取值是0,1,2等不连续的量。 已婚育龄妇女的现有子女数; 引体,每一组段往往 是一个取值。
表4.1的第(1)、(2)栏。
8
9
10
(二).连续性变量的频数表的编制
12
15 10 5 0
1.89~ 2.02~ 2.15~ 2.28~2.41 合计
如何得到上述理想的结果?
原始资料
分组划计
频数分布表
频数分布图
各项统计指标
13
1.频数表
求极差R:R=max-min 确定组数:组数的确定应以能够显示数据的分布特征和规律为目 的。对于100余例的数据通常分为8-15组。或根据以下经验公式:
复习
连续型变量:如:身高,体重
数值变量
离散型变量:如脉搏数
变量
类型
多分类
等级资料:如血清反应等
多项分类:如血型,职业特征等
分类变量
二分类:如性别、中奖等
1
第四章 定量资料的统计描述
福建医大流行病与卫生统计学系 何保昌
2
统计描述
统计描述就是用适当的表格、图形、数量化 的指标,表达数据的数量特征,揭示其分布 的规律性 统计描述分为:形象化描述(统计图表)— —建立对资料的初步印象;数值化的描述 (统计指标)——给出分布规律及具体数值
5
5 7 14 19 29 15 12 6 4 4 120
4.17
4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00
5
10 17 31 50 79 94 106 112 116 120
4.17
8.33 14.17 25.83 41.67 65.83 78.33 88.33 93.33 96.67 100.00
确定组距:组距i是一个组的下限与下一个组段下限之差,可根据 全部数据的最大值和最小值及所分的组数来确定,即i=Int [( max - min)÷ 组数 ] 列出组段:第一组段的下限略小于最小值,最后一个组段上限必 须包含最大值 统计出各组的频数并整理成频数分布表
lg n K 1 (k为 组 数 , n为 样 本 含 量 ) lg 2
9岁男孩肺活量介于0.98~2.41L间 以“1.63~”组段的频数最多 从“1.63~”组段向两端逐渐减少 表现出以“1.63~”组段为中心基本对称的 特点
18
频数表与频数图的作用
频数表与频数图可以提供不同分组的观察人数、频 率与频率密度 观察分布范围及有无可疑值 确定分布的类型:对称或不对称分布
1.633
1.526 1.512 1.214
1.555
1.424 1.030 1.184
1.352
1.589 1.886 1.735
1.481 2.406
你能看出资料有什么规律?
11
理想的描述结果
30 25 20
频数
组段 (1 ) 0.98~ 1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~
第一节 第二节 第三节 第四节 频数分布表和频数分布图 集中趋势的统计描述 离散趋势的统计描述 正态分布及其应用
第一节 频数分布表和频 数分布图 一、频数分布表 二、频数分布图
6
一、频数分布表
对一个随机事件进行重复观察,其中某变量值出现的 次数被称作频数(frequency)。 把变量值及相对应的频数列成表格即频数分布表,简称频 数表(frequency table)。 在观察值个数(即样本含量n)较多时,为了解一组同 质观察值的分布规律和便于指标的计算,可编制频数分布 表。