第3章 数据描述统计分析
第03章描述统计
补充材料:累计求和运算规则求和算子定义:对于T 个观测值,x 1, x 2, …, x T ,求和可以简化地表示为x 1 + x 2 + …+ x T =∑=Tt t x 1其中∑⋅)(称作求和算子。
求和算子的运算规则如下: ① 变量观测值倍数的和等于变量观测值和的倍数。
∑=T t t kx 1= k ∑=Tt t x 1② 两个变量观测值和的总和等于它们分别求总和后再求和。
∑=+Tt t t y x 1)(= ∑=Tt t x 1+∑=Tt t y 1③ T 个常数求和等于该常数的T 倍。
∑=Tt k 1= kT其中k 是常数。
④ 定义双重求和为∑∑==T j ij T i x 11= ∑=Ti 1(x i 1 + x i 2 + …+ x iT )= (x 11 + x 12 + …+ x 1T ) +(x 21 + x 22 + …+ x 2T ) + … +(x T 1 + x T 2 + …+ x TT )⑤ 两个变量和的双重求和等于它们各自双重求和的和。
∑∑==+T j ij ij T i y x 11)(= ∑∑==T j ij T i x 11+∑∑==Tj ij T i y 11⑥ 两个不同单下标变量积的双重求和等于它们各自求和的乘积。
∑∑==Tj j i Ti y x 11= (∑=T i i x 1) (∑=Tj j y 1)证:∑∑==Tj j i T i y x 11= ∑=+++Ti T i y y y x 121)...(= (∑=T i i x 1) (∑=Tj j y 1)第3章 统计资料的综合(Data Summarization )用频数分布表与统计图可以展示数据分布的大概特征。
为更准确的描述数据的特征,有必要用一些数值描述一组数据的特征,称这些数值为特征数。
特征数分三类:(1)表示集中位置;(2)表示分散程度;(3)表示偏斜程度;(4)相关程度。
3.1 表示集中位置的特征数: (1)平均数;(算术平均数,几何平均数,调和平均数) (2)中位数; (3)众数; (4)百分位数; 3.1.1 平均数(1)算术平均数(Arithmetic mean ) 对于不分组数据算术平均数定义:一组数据,(x 1, x 2, …, x n ),容量为n ,则算术平均数x 表示为x = n x x x n +++ (21)=n1∑=ni i x 1(1)例1:5个学生的英语考试分数是80, 70, 85, 90, 82。
SPSS统计分析--第3章--基本统计分析
3.2.1 频数统计的主要功能
• “频率”过程可以产生频数分布表,以对数据按组进行归 类整理。还可以生成各种描述性统计指标,以及条形图、 饼图、直方图等常用的统计图。通过选择SPSS中的“分析 ”︱“描述统计”︱“频率”命令,可以对各变量的数据 分布特征有一个概括的整体的认识。
.
3.2.2 频数统计的操作过程
.
3.2.3 实例分析:大学新生的心理健康状况(1)
【例3.1】某大学为了了解学生的心理健康状况,要对初 入学的大一新生进行心理测评,并建立心理档案。现要对 某班学生的生活事件量表进行分析。请用SPSS做出此测试 结果的频数分布情况。
解:本例中,主要通过“频率”过程对本班生活事件量表 的总分进行描述,并得出全班学生此量表总分各分数的频 数情况及其百分比和累积百分比,可以从中了解到学生整 体得分的高低水平,也可以由此注意到需要给予较多关注 的个体或群体。下面将介绍具体的操作过程。
• 均值标准误差:描述样本均值与总体均值之间的平均差异程度 的统计量。
• 全距:也称极差,是数据的最大值与最小值之间的绝对离差。 • 方差:也是表示变量取值离散程度的统计量,是各变量值与算
数平均数离差平方的算术平均数。
.
• 标准差:表示变量取值距离均值的平均离散程度的统计量。标 准差值越大,说明变量值之间的差异越大,距均值这个“中心 值”的离散趋势越大。
• 均值:即算术平均数,是反映某变量所有取值的集中趋势或平 均水平的指标。如某企业职工的平均月收入可用均值。
• 中位数:即一组数据按升序排序后,处于中间位置上的数据值 。如评价社会的老龄化程度时,可用中位数。
• 众数:即一组数据中出现次数最多的数据值。如生产鞋的厂商 在制定各种型号鞋的生产计划时应该运用众数。
第3章SPSS描述性统计分析
3.1.1 频数分析的基本原理
图3-14 【描述性】对话框
Step 02 在左侧的候选变量列表框中选择“male”和 “female”变量,将其添加至【变量】列表框中,表示它是 进行描述性统计分析的变量,如图3-15所示。
图3-15 选择分析变量
Step 03 单击【选项】按钮,其主要目的是选择需要输出 的描述性统计量,这里除了选择系统默认的统计量外,还勾 选了范围、偏度系数和峰度系数复选框;再单击【继续】按 钮,返回【描述性】对话框,如图3-16所示。 Step 04 单击【确定】按钮完成操作。
图3-13 【描述:选项】对话框
Step 04 在【描述性】对话框中,勾选【将标准化得分另 存为变量】复选框,表示对所选择的每一个变量进行标准化 处理,同时产生相应的Z得分,并作为新变量保存到数据窗 口中。
Step 05 单击【Bootstrap】按钮,弹出如图3-5所示的 【Bootstrap】对话框,在此对话框中可以进行均值、标准 差、方差、偏度和峰度的Bootstrap估计。
图3-17 【探索】对话框
Step 02 在对话框左侧的候选变量列表框中选取一个或多 个待分析变量,将它们移入右侧的【因变量列表】列表框中 ,表示要进行探索性分析的变量。 Step 03 在候选变量列表框中可以选取一个或多个分组变 量,将它们移入右侧的【因子列表】列表框中。分组变量的 选择可以将数据按该变量中的观测值进行分组分析。如果选 择的分组变量不止一个,那么会以分组变量的不同取值进行 组合分组。
研究生统计学讲义第2讲第3章定量资料的统计描述
现在我们把 X 转换为标准正态变量,因为μ=100, σ=10,所以
u X 90 100 1.0
10
因此90分能够用平均值下的1个标准差表示,见图 右图
P (X < 90)=P ( u <-1.0 )
附表3从u=0.00到u=4.99以增量0.01编成标准正态分布 的CDF表,沿着表的左边按所给u的一个小数找到u ,再从表的顶端找到u的第二位小数,在表内主要部
x2=78.6g/L时,u2 = (78.6-73.8)/3.9=1.23
2.查标准正态曲线下面积表(附表3):u= -0.46时 ,在表的左侧找到-0.4,在表的上方找到0.06,二者相 交处为0.3228,标准正态曲线下,横轴上u值小于- 0.46的面积为Ф(-0.46)= P(U<-0.46)=32.28%,即标 准正态变量u值小于-0.46的概率为32.28%;同样查 得u=1.23时,标准正态曲线下,横轴上u值小于1.23的 面积为Ф(1.23) =P(U<1.23)= 0.8907,即u值小于1.23的 概率为89.07% 。
图3.16左边μ=100,σ=10,X≥125 右边μ=0,σ=1, u≥2.5,注意刻度不同
只有0.62%的得分将是125或更高.
补例2 假设女高血压患者舒张压大约集中在100mmHg
,标准差是16mmHg ,血压是正态分布.求:
1.P (X<90) 2.P (X>124) 3.P (96<X<104) 4.求
2.中位数M (Median)
中位数M是排序观察值的中间值.当一组数据按照 从小到大的顺序排列起来时,值的深度d=(n+1)/2, 是它相对于极端值(末端)所在的位置.它不是由全 部观察值综合计算出来的,而是由居中位置的观察值 所决定,因此它不受个别特小或特大的观察值的影响 ,应用范围较广。
第三章 统计资料的描述
③还有一些指标,介于前两种情况之间,计 划规定的既是最高限额,同时又不能过低于 此限额,如职工人数、工资总额等指标是不 允许突破计划的,它们的计划完成程度最好 为100%,或略低于100%。 (2)结构相对数 结构相对数是指在一定范围内的部分数值和 全部数值之比,反映该范围内的内部构成状 况。
X
X
i 1
n
i
n
均值的计算公式因数据资料是否分组而有所不 同,可以分为三种情况:未分组资料;单项式 分组资料;组距式分组资料 : 1.根据未分组资料计算均值 2.根据单项式分组资料计算均值 p56例3.2
X i fi
i 1 N
N
X
X
i 1 n i 1
n
i
fi
i
某一类别数值 强度相对数 另一类别数值
强度相对数有正指标和逆指标之分,正指标是指其比 值的大小与其反映的强度、密度和普及程度成正比; 逆指标是指其比值的大小与其反映的强度、密度和普 及程度成反比 (6)动态相对数 动态相对数是指某类不同时间数值对比的比值。动态 相对数也称为发展速度,主要作用在于反映某类现象 在不同时期的发展变化程度。
相对数在股票买卖中的运用(RSI指标)
相对强弱指标RSI是用以计测市场供需关系和买卖力道的 方法及指标 。计算公式:
N日内收盘涨幅的平均值
N日RSI=
───────────
N日内收盘涨幅均值+N日内收盘跌幅均值
×100%
通常设RSI>80为超买区,市势回挡的机会增加; RSI<20为超卖区,市势反弹的机会增加。 一般而言,RSI掉头向下为卖出讯号, RSI掉头向上为买入信号。
1500
技术 元D
SPSS统计分析第3章-描述性统计分析课件
3.4 探索性分析
➢描述性统计量表
科目 成 语 均值 绩文
均值的 95% 置信区间
5% 修整均值 中值 方差 标准差 极小值 极大值 范围 四分位距 偏度 峰度
描述
下限 上限
统计量 69.17
45.63
92.70 69.91 73.50 502.967 22.427
30 95 65 34 -1.085 1.617
打开“描述:选项”对话框,选中“均值”、“标准差” 、“最小值”、“最大值”、“峰度”、“偏度”及显示顺 序的“变量列表”等选项。
SPSS统计分析第3章-描述性统计分析
3.3 描述性分析
第3步 运行结果及分析: 描述性分析结果表
描述统计量
身高
N 极小值 极大值 均值 标准差
偏度
峰度
统计
标准 统计 标准
5
打开“图表”对话框,选中“直方图”及后
4
5
面的复选框
SPSS统计分析第3章-描述性统计分析
3.2 频率分析
第3步 主要结果及分析:
统计量表
统计量ห้องสมุดไป่ตู้
教育
收入
N
有效
缺失
众数
百分位数 30
60
90
835 1 5
4.00 5.00 5.00
836 0 3
3.00 4.00 7.00
变量“教育”的频率分布表
3.3 描述性分析 3.3.1 基本概念及统计原理
描述性分析主要用于输出变量的各类描述性统计量 的值,通过上一节的学习可知,频率分析同样可以做到, 都是以计算数值型单变量的统计量为主。描述性统计分析 没有图形功能,也不能生成频率表,但描述性分析可以将 原始数据标准化为Z分数,并以变量形式存入数据文件中, 以便后续分析时应用。
spss 第3章
主要内容
3.1 频数分析 3.2 描述分析 3.3 求分组平均数 3.4 求交叉分组平均数(列联表分析) 3.5 统计分析图的制作
3.1 频数分析
• 频数分布表 知识回顾 • 统计量 – 分位数(四分位数、百分位数) – 离散趋势指标(标准差、方差、全距、 最小值、最大值) – 集中趋势指标(算术平均数、中位数、 众数、总和) – 分布参数 • 统计图:条形图、饼图、直方图
3.2 描述分析
• Descriptives:计算变量的描述性统 计量(均值、总和、标准差等)
3.2.2 例题
结果分析
3.3 求分组平均数
3.3.1 主要参数
3.3.2 例题
结果分析
3.4 交叉分组描述(卡方检验)
• 检验两个变量是否有关联 • 列联表分析 • 知识回顾
某集团公司打算进行一项改革,但此项改革涉及
Graphs
3.5.1 条形图(Bar)
1、条形图的类型 – 3种形状 – 3种统计量综述方式 – 9种组合方式构成9种 类型的条形图
例题1 简单条形图-个案分组
• 问题:对不同顾客类型(X1)的满意 度(X19)平均数进行统计作图。
例题2 简性的平均 数统计图,按照不同地区分列。
描述分析
求分组平均数
• 按照某个变量分组统计某个或多个变 量值对应的统计量。
求交叉分组平均数
• 检验两个变量是否有关联 • 列联表分析 2 • 检验
H0:两个变量独立
H1:两个变量不独立
统计分析图的制作
• • • • • • • • • • • 条形图 三维条形图 线图 面积图 饼图 高低图 盒式图 误差图 总体锥图 散点图 直方图
第三章 统计分析方法
由于对每组都有抽取,样品在总体中分布 均匀,更具代表性,特别适用于总体比较复杂 的情况。如研究混凝土浇筑质量时,可以按生 产班组分组、或按浇筑时间(白天、黑夜;或 季节)分组或按原材料供应商分组后,再在每 组内随机抽取个体。
10
1. 简单随机抽样
简单随机抽样又称纯随机抽样、完全随机 抽样,是对总体不进行任何加工,直接进行随 机抽样,获取样本的方法。
一般的做法是对全部个体编号,然后采用 抽签、摇号、随机数字表等方法确定中选号码, 相应的个体即为样品。
这种方法常用于总体差异不大,或对总体 了解甚少的情况。
11
2. 分层抽样
12
3. 等距抽样
等距抽样又称机械抽样、系统抽样, 是将个体按某一特性排队编号后均分为n组 ,这时每组有K=N/n个个体,然后在第 一组内随机抽取第一件样品,以后每隔一 定距离(K号)抽选出其余样品组成样本的方 法。如在流水作业线上每生产100件产品抽 出一件产品做样品,直到抽出n件产品组成 样本。
26
2、系统性原因
当影响质量的4M1E因素发生了较大变 化,生产过程不能正常进行,产品质量数据 就会离散过大或与质量标准有较大偏离,表 现为异常波动,次品、废品产生。这就是产 生质量问题的系统性原因或异常原因。
5
2、样本
样本也称子样,是从总体中随机抽取出来, 并根据对其研究结果推断总体质量特征 的那部分个体。
被抽中的个体称为样品,样品的数目称样 本容量,n
6
3、统计推断工作过程
总体质量状况
生产过程 一批产品
推断 分析
样本质量特征值
是否正常 是否合格
第三章 2-定性资料的统计描述
二、疾病和死因分类
疾病的命名(nomenclature of diseases):标 准化的术语 疾病分类(classification of diseases):将具有 共性的疾病归纳、分类。 区别:前者为疾病名称标准化,后者是统计研究 需要。
1853年,国际统计学会着手编制了统一的疾病 名称和死因分类,先是在欧洲使用。 1893年开始建立国际疾病和死因分类 (International Classification of Diseases,简记 为ICD)
2. 计算相对数时分母应有足够数量 例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者5人,2人有效 有效频率均为40% !?
如果资料的总例数过少,计算得到的相对数 偏差可能会很大,直接报告原始数据更为可取: 甲医院有效率40% 乙医院有效 2/5
3. 正确地合并估计 例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者90人,30人有效 如果两医院总体有效率的确相等, 合并估计: 40 30 有效率 36.8% 100 90 不可将两个频率相加除以2:
(一)人口死亡资料的来源
我国人口死亡资料主要由公安部门负责收集。 国家规定居民死亡后,必须及时报告并注销户口。 死于医院者,医师应负责填写死亡报告单 ----正确填写死因 死因依据:国际统计分类第十版(International classification of diseases, ICD-10)中的死因分类。 注意杜绝婴儿死亡的漏报。
实际工作中,有时近似地 平均人口数 ≈人口总数 理论上, 平均人口 = 各时点人口数相加再除以总时点数 实际中,
平均人口≈相邻两年年末人口数相加再除以2
(二)人口构成及其统计指标
第三章描述性统计分析
职 称 * 文 化 程 度 Crosstabulation 文 化程 度 专科 高中 1 1 33.3% 33.3% 25.0% 20.0% 6.3% 6.3% 3 0 75.0% .0% 75.0% .0% 18.8% .0% 0 1 .0% 16.7% .0% 20.0% .0% 6.3% 0 3 .0% 100.0% .0% 60.0% .0% 18.8% 4 5 25.0% 31.3% 100.0% 100.0% 25.0% 31.3%
描述性统计分析指标
统计量可分为两类
一类表示数据的中心位置,例如均值、中位数、众 数等 一类表示数据的离散程度,例如方差、标准差、极 差等用来衡量个体偏离中心的程度。
描述单变量分布的三种方式
用数字呈现一个变量的分布 用表格呈现一个变量的分布 用图形呈现一个变量的分布
Frequencies
峰度(Kurtosis)
峰度 >3,分布为高峰度,即 比正态分布的峰要陡峭; <3,分布为低峰度,即 比正态分布的峰要平坦 些;=0,分布为正态峰。
标准化Z分数
标准分数(stardard score)也叫z分数(zscore),是一个分数与平均数的差再除以标准 差的过程。用公式表示为: z=(x-μ)/σ。其中x为某一具体分数, μ为平均数,σ为标准差。 Z值的量代表着原始分数和母体平均值之间的 距离,是以标准差为单位计算。在原始分数低 于平均值时Z则为负数,反之则为正数。
3.4 分布的形状
偏度(Skewness)是描述数据分别形态的, 它是描述某变量取值分布对称性的统计量。 峰度(Kurtosis)是描述某变量所有取值分布 形态陡缓程度的统计量。
统计学数据的描述性分析解析
描述性统计学与推断统计学的关系
描述性统计学:对数据进行描述性 分析,揭示数据的分布特征和规律
描述性统计学是推断统计学的基础: 描述性统计学提供了推断统计学所 需的数据基础和信息
添加标题
添加标题
添加标题
描述性统计学 是统计学的一 个分支,主要 研究如何描述 和总结数据集 的特征和分布。
描述性统计学 包括数据的集 中趋势、离散 程度、分布形 状等统计量的 计算和描述。
描述性统计学 可以帮助我们 更好地理解数 据集,为后续 的统计分析和 决策提供基础。
描述性统计学 的应用广泛, 包括社会科学、 自然科学、商
统计学数据的描述 性分析解析
,
汇报人:
目录
CONTENTS
01 添加目录标题 02 描述性统计学的概念与意义 03 描述性统计学的常用指标 04 描述性统计学的分析方法 05 描述性统计学的应用场景
06 描述性统计学的局限性及注意事项
单击添加章节标题
第一章
描述性统计学的概念与意义
第二章
描述性统计学的定义
业等领域。
描述性统计学在数据分析中的作用
描述性统计学可以帮助我们理解数据的分布情况,包括数据的集中趋势、离散程度和分布形状 等。
描述性统计学可以帮助我们识别数据的异常值和缺失值,从而提高数据分析的准确性和可靠性。
描述性统计学可以帮助我们进行数据可视化,将复杂的数据转化为易于理解的图表和图形,从 而提高数据分析的可读性和可解释性。
描述性统计学的局限性及注 意事项
第六章
描述性统计学的局限性
描述性统计学不能预测 未来,只能描述过去和
统计数据描述性分析PPT课件
识别异常值
描述性统计可以帮助我们 识别异常值,即远离数据 集中心的值,这些值可能 会对数据分析产生影响。
提供决策依据
通过描述性统计,我们可 以了解数据的总体情况, 为进一步的数据分析提供 决策依据。
描述性统计的常用指标
01
02
03
04
均值
均值是数据集中所有数值的和 除以数值的数量,用于表示数
据的集中趋势。
通过实地观察记录数据, 适用于难以通过问卷等
方式获取的数据。
通过实验设计获取数据, 适用于需要控制变量的
实验研究。
通过查阅文献资料获取 数据,适用于历史数据 或无法直接获取的数据。
数据整理的步骤
数据清洗
去除重复、错误或不完整的数 据,确保数据质量。
数据分类
将数据按照一定的标准进行分 类,便于后续分析。
散点图
总结词
用于展示两个变量之间的关系,体现变量之间的关联程度
详细描述
散点图通过将数据点在坐标系上标出并连接成线来展示两个 变量之间的关系,能够反映变量之间的关联程度和趋势。适 用于展示两个变量之间的相关性分析。
05 数据的数值描述
数据的集中趋势描述
平均数
表示数据的集中趋势,计算所有数值的和除以数 值的数量。
样本代表性
在选择样本时,要确保样本具有代表性,能 够反映总体情况。
结论的可信度
在分析过程中,要注意排除偶然因素和误差 的影响,确保结论的可信度。
07 案例分析
案例一:销售数据描述性分析
总结词
通过销售数据的描述性分析,了解销 售情况,发现潜在问题,为决策提供 依据。
01
02
收集销售数据
收集一定时间段内的销售数据,包括 销售额、销售量、销售渠道、客户信 息等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图3-1 某商场家用电器销售情况
图3-2 家用电器销售量平均数
图3-3 家用电器销售量中位数
图3-4 家用电器销售量众数
返回本节
3.2 离中趋势的测定与分析
3.2.1 离中趋势的测定内容 3.2.2 用Excel函数计算标准差 3.2.3 四分位数与四分位距
返回本节
3.3 分布形态的测定与分析
3.3.1 分布形态的测定内容 3.3.2 用Excel工作表函数描述分布形态
返回首页
3.3.1 分布形态的测定内容
只用集中趋势和离中趋势来表示所有数据,难免不够准 确。分析总体次数的分布形态有助于识别整个总体的数量 特征。总体的分布形态可以从两个角度考虑,一是分布的 对称程度,另一个是分布的高低。前者的测定参数称为偏 度或偏斜度,后者的测定参数称为峰度。
2.总体标准差
总体标准差函数返回以参数形式给出的整个样本 总体的标准偏差,反映相对于平均值(mean)的 离散程度。计算总体标准差使用整个总体的变量, 通常采用偏性估计式(亦即自由度为n),其计算 公式为
n x2x2 n2
语法:STDEVP(number1,number2,...)
例3-2 使用例3-1资料,计算各家电销售量的总 体标准差,如图3-5所示。
3.1 集中趋势的测定与分析
3.1.1 集中趋势的测定内容 3.1.2 用Excel工作表函数描述集中趋势 3.1.3 三种平均数的特点
返回首页
3.1.1 集中趋势的测定内容
在统计研究中,需要搜集大量数据并对其进行加 工整理,对这些数据进行整理之后发现:大多数 情况下数据都会呈现出一种钟形分布,即各个变 量值与中间位置的距离越近,出现的次数越多; 与中间位置距离越远,出现的次数越少,从而形 成了一种以中间值为中心的集中趋势。这个集中 趋势是现象共性的特征,是现象规律性的数量表 现。
返回首页
3.2.1 离中趋势的测定内容
在研究现象总体标志的一般水平时,不仅要研究 总体标志的集中趋势,还要研究总体标志的离中 趋势,如研究价格背离价值的平均程度。研究离 中趋势可以通过计算标志变异指标来进行。标志 变异指标是同统计平均数相联系的一种综合指标, 用于度量随机变量在取值区间内的分布情况,主 要有平均差、标准差、方差、四分位数、百分位 数等。在一般计算中,这些指标计算是比较复杂 的,但在Excel中都有相应的函数,因而使计算变 得很简单。
返回本节
3.2.2 用Excel函数计算标准差
1.样本标准差 2.总体标准差
1.样本标准差
样本标准差函数用来估算样本的标准偏差,反映 相对于平均值(mean)的离散程度,Excel计算样 本标准差采用不偏估计式(亦即自由度=n-1), 其计算公式为
n x2 x2
s
nn1
语法:STDEV(number1,number2,...)
MIN(number1,number2, ...) 如果参数不包含数字,函数MAX(MIN)返回0。
返回本节பைடு நூலகம்
3.1.3 三种平均数的特点
众数是一组数据中出现次数最多的变量值,它用 于对分类数据的概括性度量,其特点是不受极端 值的影响,但它没有利用全部数据信息,而且还 具有不惟一性。一组数据可能有众数,也可能没 有众数;可能有一个众数,也可能有多个众数。
返回本节
3.1.2 用Excel工作表函数描述集中趋势
1.均值函数 (1)算术平均数。 (2)调和平均数。 (3)几何平均数。
2.中位数(中位次数)函数 中位数是指全体数值按大小排列后位于中间的数 值。
语法:MEDIAN(number1,number2, ...)
如果参数集合中包含有偶数个数字,函数 MEDIAN()将返回位于中间的两个数的平均值。
3.众数函数
众数是一组数列中出现次数最多的数值,众数函 数MODE()返回某一数组或数据区域中出现频率 最多的数值。与MEDIAN相同,MODE也是一个 位置测量函数。
语法:MODE(number1,number2, ...)
如果数据集合中不含有重复的数据,则MODE() 函数返回错误值N/A。
4.最大(小)值函数 最大(小)值函数可以返回数据集中的最大(小) 数值。 语法:MAX(number1,number2,...)
第3章 数据描述统计分析
3.1 集中趋势的测定与分析 3.2 离中趋势的测定与分析 3.3 分布形态的测定与分析 3.4 描述统计工具
本章学习目标
Excel描述数据集中趋势的工作表函数及其应用 Excel描述数据离中趋势的工作表函数及其应用 Excel描述数据分布形态的工作表函数及其应用 Excel描述统计工具的内容及其应用
表3-1 Quart值与QUARTILE返回值的对应关系
quart值
函数QUARTILE返回值
0
最小数值
1
第一个四分位数(第25个百分排位)
2
中分位数(第50个百分排位)
3
第三个四分位数(第75个百分排位)
4
最大数值
例3-4 使用例3-1资料,计算四分位数和四分位 距,如图3-10所示。
图3-10 计算四分位数和四分位距
图3-5 计算总体标准差
例3-3 两组工人生产某种零件的产量如图3-6所 示。
图3-6 两组工人产量
图3-7 计算产量平均数
图3-8 计算两组工人产量标准差
图3-9 计算两组工人产量标准差系数
返回本节
3.2.3 四分位数与四分位距
四分位数是将中值的前后两部分数值再等分为二,以数值 小的一端算起,前半部的分区点称为第1四分位数,后半 部的分区点称为第3四分位数,而中值即为第2四分位数。 四分位数通常用于在销售额和测量值数据集中对总体进行 分组。 语法:QUARTILE(array,quart) array:需要求四分位数值的数组或数字型单元格区域。 quart:决定返回哪一个四分位值。 Quart值与QUARTILE返回值的对应关系见表3-1所示。
中位数是一组数据按大小顺序排序后处于中间位 置上的变量,它主要用于对顺序数据的概括性度 量。
均值是一组数据的算术平均,它利用了全部数据 信息,是概括一组数据最常用的一个值。
例3-1 某商场家用电器销售情况如图3-1所示。
(1)计算各种电器的全年平均销售量,如图3-2 所示。
(2)计算各种电器销售量的中位数,如图3-3所 示。