西安交通大学--应用统计学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四、累计频数分布数列 1、各组频数向上、向下累计形成的数列。 2、在经济学中的应用。 ———洛伦茨曲线 ———基尼系数=A/(A+B)
第三节 数据显示—统计表和统计图 一、统计表 1、表的格式: 横行标题:对象(总体(常以年份形式表示)、总体 分组、总体各单位) 纵栏标题:统计指标 交叉部分:指标值 2、注意事项: ——数据居中,小数点对齐 ——左右不封口; ——表下面注明资料来源。
二、极差 1、极差也称为全距,是一组变量中最大值与最 小值的离差,表明变量值变动的范围。用R表 示极差,其计算公式是: R x x 2、缺点:易受极端值的影响。
max min
三、四分位差 1、四分位差用数列中第3/4位次与1/4位次的变量值之 差除以2来表示。
Q Q1 Q 3 2 第75百分位数 第25百分位数 2 2、意义:
S M e 1 fM e
d Me
40 28 1 0 7 4.8 25
f
2
Me UMe 80
S M e 1 fM e
d Me
40 27 1 0 7 4.8 25
2、百分位数 ——把数据按从小到大的顺序排列后,第P百分 位数是指有P%的值小于或等于它,而有 (100-P)%的值大于或等于它。 ——确定方法。i=(P/100)n就是第P百分位数的 位置。 其中最常用的是四分位数。即把数据分成四个 部分,每个部分包括1/4数值。
二、统计图
组别
20
支付方式
信用卡
现金
10
Fr equency
0 27~30 30~33 33~36 36~39 39~42 42~45 45~48
组别
个人支票
第三章 统计数据的描述分析
第一节 集中趋势分析 集中趋势是数据分布的中心,描述集中趋势的 指标有算术平均数、中位数、众数等。
某单位80个工人生产的零 单位:个 65 78 88 65 58 76 69 66 80 64 77 78 60 65 85 74 73 65 66 79 74 85 59 69 60 87 85 86 64 93 76 62 91 49 74 78 75 79 86 68 87 97 92 82 66 94 75 56 85 77 67 89 78 79 88 83 73 69 84 95 55 79 77 58 80 68 77 87 70 78 79 61 47 69 89 96 66 76 81 99 Min=47 max=99
③跟踪所有产品的使用去向,再核算其价值是 不可能的。部门增加值核算方法(计算方法) 棉花—纱—布— 印染—衣服 300—350—460—580— 880 部门增加值 300—50—110—120— 300 最终产品的总价值=880 部门增加值合计=300+50+110+120+300=880 ④时间、空间、计量单位
第二节 数据的整理 一、统计分组 1、统计分组是将统计总体按照一定标志区分成 若干个组成部分的一种统计分析方法。 2、两点注意: ——有时不易确定组与组之间的界限; ——穷尽原则、互斥原则。
钢材抗张 力 27-30 30-33 33-36 36-39 39-42 42-45 45-48 合计
频数 7 10 13 16 15 10 5 76
二、标志和指标 1、标志是说明总体单位特征和属性的名称,分 为数量标志ห้องสมุดไป่ตู้品质标志。 2、指标是说明总体现象数量特征的概念和数值。 www.3722.cn中国最大的资料库下载 按其反映数量特点的不同,分为数量指标和质 量指标。
三、统计指标 1、从总体的一个特征到具体数值,中间有很多 步要走。 2、以GDP的核算为例来说明 ①想看一国一年内生产活动的总量,定义GDP是 一国在一定时期内最终产品的总价值。(内 涵) ②最终产品是本期生产本期不再投入生产使用 的产品, 消费、投资、出口产品。(外延)
——剔除了极端值,说明50%数据分布的范围; ——与中位数配合说明数据分布是否对称。若分布对 称,则Q2-Q1=Q3-Q2=(Q3-Q1)/2 若不相等,则是非对称的。
k
i fi
f
i
例、某单位80工人一周生产零件数。 1、简单算术平均数
X i 1 n
x
n
i

65 80 ... 61 99 75.49(个) 80
2、加权算术平均数
工人一周 工人数fi 生产零件 数 7 60以下
60-70 70-80 80-90 21 25 19
组中值xi
应用统计学
西安交通大学经济与金融学院统计系
赵春艳
www.3722.cn中国最大的资料库下载
本课程的内容 第一章 绪论 第二章 统计数据的搜集、整理和 显示 第三章 统计数据的描述分析 第四章 参数估计 第五章 参数假设检验 第六章 方差分析 第七章 非参数统计方法 第八章 时间序列分析 第九章 相关与回归分析 第十章 统计指数
xifi
向上累计 向下累计 频数 频数
7 28 53 72 80 73 52 27
55 65 75 85
385 1365 1875 1615
90以上 合计
8 80
95 ---
760 6000
80 ---
8 ---
x f x2 f 2 xk f k X 11 i 1 k f1 f 2 f k
第二节 离中趋势分析 一、离中趋势 1、离中趋势是数据分布的又一特征,它表明变量值的 差异或离散程度。 2、意义:首先,可以衡量算术平均数的代表性。 例:均值都为150的两组数 50,100,150,200,250 100,125,150,175,200 其次,进行产品质量管理和决策。 3、离中趋势测度经常用到的指标有:极差、方差和标 准差、四分位差等,它们也被称为变异指标。
教材: 吴诣民 赵春艳《应用统计学》 陕西人民教育出版社, 2006年。 参考书目: 1、李心愉· 应用经济统计学· 北京:北京大学出版社, 2003年。 2、耿修林· 商务经济统计学· 北京:科学出版社,2003 年 3、[美]戴维· R· 安德森等· 商务与经济统计· 北京:中信 出版社,2003。 4、肖筱南· 新编概率论与数理统计· 北京:北京大学出 版社,2002年。
一、算术平均数(均值) 1、将一批数累加起来,除以数据的个数,即为算术平 均数。 x
n i
X i 1 n
2、分为简单算术平均数和加权算术平均数
X i 1 n
x
n
i
X
x1 f 1 x 2 f 2 x k f k f1 f 2 f k
x
i 1 k i 1
三、中位数及分位数 1、中位数 ①把一批数按照从小到大的顺序排列,处于数列中点 的变量值就是Me ②确定方法 ——未分组资料:(n+1)/2中位数的位置。 前例Me=77 ———分组资料:根据向上或向下累计频数分布数列, 按照 确定中位数所在的组,然后确定。
f 2
M e LM e
f S
3、分类: 按分组标志的不同,分为: 品质数列 单项数列:一个变量值是一个组 变量数列 组距数列:两个变量值构成的区间是一个组
三、组距分布数列的编制方法 第一步,排序后,极差=max-min 第二步,确定组数、组距。 组数 k=1+3.32lgn(参考) 组距=(max-min)/组数 第三步,组中值。 组中值=(下限+上限)/2

E( X )


Xf ( X )dX
4、算术平均数的缺陷 10 15 20 25 70
X 28
去掉70后,
X 17.5
二、众数(M0) 1、众数是指一组变量值中出现次数最多的变量 值。 2、众数的确定 ①未分组资料,M0就是出现次数最多的变量值。 上例中,78、79各出现5次,都是M0 数据分布是双峰的。
M0 M0
例、上例中众数组是第3组,
f M 0 25, f M 0 1 21, f M 0 1 19, d M 0 10, LM 0 70, U M 0 80 f M 0 f M 0 1 M 0 LM 0 dM 0 ( f M 0 f M 0 1 ) ( f M 0 f M 0 1 ) 25 21 70 10 74 ( 25 21 ) ( 25 19) f M 0 f M 0 1 M0 UM0 dM 0 ( f M 0 f M 0 1 ) ( f M 0 f M 0 1 ) 80 25 19 10 74 ( 25 21 ) ( 25 19)
频率% 9.2 13.2 17.1 21.1 19.7 13.2 6.6 100
组中值 28.5 31.5 34.5 37.5 40.5 43.5 46.5 ----
向上累计 向下累计 频数 频数 7 76 17 30 46 61 71 76 ---69 59 46 30 15 5 ----
二、频数分布数列 1、统计分组后,每个组分配的总体单位数称为 频数或次数,频数/总体单位总数=频率。 2、意义 整理了杂乱无章的数据,同时显示出一批数的 分布情况,是数理统计学中随机变量及其概 论分布概念在实际中的应用。
第一章 绪论
第一节 统计学的学科性质 一、统计学的学科性质 1、争论:“方法论学科” “实质性学科” 2、统计处理数据的过程: 搜集数据——整理数据——分析数据——解释 数据
二、统计学的分类 1、描述统计学和推断统计学 2、理论统计学和应用统计学
第二节 统计学的几个基本概念 一、总体和总体单位 1、总体是由具有某种共同性质的许多个体组成 的整体,构成总体的个体称为总体单位。 2、两层含义: ①统计学研究的是大量现象的数量特征,总体 包含了大量现象; ②统计单位具有某一共同性质,但其他的性质、 特征是不同的,便于在差异中寻找规律。
x f f
i 1 i
k
i i

6000 75 80
E( X )
X P( X )
i i i
3、算术平均数与数学期望 对于离散型随机变量X,设它的概率密度函数P(Xi)为, 则的数学期望为
E( X )
X P
i
i i
对于连续型随机变量X,设其概率密度函数为f(X), 则的数学期望为
第二章 统计数据的搜集、整理和 显示
第一节 统计数据的搜集 一、统计调查方式 统计报表制度、普查、抽样调查、典型调查、 重点调查
例2.1、一批钢材,抽样测试其抗张力,随机抽取76个 样本观察值如下:(单位:kg /cm2) 41.0 37.0 33.0 44.2 30.5 27.0 45.0 28.5 40.6 34.8 31.2 33.5 38.5 41.5 43.0 45.5 42.5 39.0 36.2 27.5 38.8 35.5 32.5 29.5 32.6 34.5 37.5 39.5 35.8 29.1 42.8 45.1 42.8 45.8 39.8 37.2 33.8 31.2 31.5 29.5 29.0 35.2 37.8 41.2 43.8 48.0 43.6 41.8 44.5 36.5 36.6 34.8 31.0 32.0 33.5 37.4 40.8 44.7 40.0 41.5 40.2 41.3 38.8 34.1 31.8 34.6 38.3 41.3 44.2 37.1 30.0 35.2 37.5 40.5 38.1 37.3
2 fM e 2
M e 1
d Me
Me UMe
f S
fM e
M e 1
d Me
80 4 0, LM e 7 0, U M e 8 0, 2 2 S M e 1 2 8, S M e 1 2 7, d Me 1 0, f M e 2 5
f
f
2
M e LM e 70
②分组资料: 在等距分组的情况下,频数最多的组是众数组,在该 组内确定众数。
f M 0 f M 0 1 LM 0 dM 0 ( f M 0 f M 0 1) ( f M 0 f M 0 1 ) f M 0 f M 0 1 UM0 dM 0 ( f M 0 f M 0 1) ( f M 0 f M 0 1 )
相关文档
最新文档