江西财经大学统计学第二章-描述统计:图表法
描述统计第二章PPT课件
特点
典型单位的选择具有主观性。因此只能作为 全面调查的补充
种类
划类选典式和解剖麻雀式
数据的收集方法
数据收集方法
询问调查
观察
访问调查
邮寄调查
电话调查
电脑辅助
座谈会
个别深访
实验
访问调查
(personal interview)
1. 调查者与被调查者通过 面对面地交谈而获得资料
2. 有标准式访问和非标准 式访问
5. 从互联网或图书馆查阅到的相关资料
Internet
http//WWW.
中 国中 人国 口市 统场 计统 年计 鉴年
鉴
中国商品交易市场统计年鉴 中国连锁餐饮企业统计年鉴中国连锁零售业统计年鉴 中国能源统计年鉴 全国农产品成本收益资料汇编 国际统计年鉴 中国对外经济贸易统计年鉴 中国基本单位统计年鉴 中国民政统计年鉴 中国高技术产业统计年鉴 中国农村统计年鉴 中国农村住户调查年鉴 中国农村住户调查年鉴中国乡镇统计资料 中国县(市)社会经济调查年鉴 中国西部农村统计资料 中国建制镇统计资料
2.1 数据来源(data sources)
2.1.1 数据的间接来源 2.1.2 数据的直接来源
二手数据的来源
1. 统计部门和政府部门公布的有关资料, 如各类统计年鉴
2. 各类经济信息中心、信息咨询机构、专 业调查机构等提供的数据
3. 各类专业期刊、报纸、书籍所提供的资 料
4. 各种会议,如博览会、展销会、交易会 及专业性、学术性研讨会上交流的有关 资料
电话调查
(telephone survey)
1. 调查者利用电话与被调查者 进行语言交流以获得信息
2. 时效快、成本低 3. 问题的数量不宜过多
统计学试卷五参考答案
江西财经大学13-14第二学期期末考试参考答案与评分标准试卷代码:06003A 授课对象:挂牌班课程名称:统计学(主干课程) 适用对象:一、单项选择题(每小题1分,共10分。
)1. B.2. A.3. B.4. C.5. D.6. C.7. B.8.A.9.A. 10. D.二、判断题(每小题1分,共10分。
全选“√”或“×”,本题计0分)1.×2.√3.√4.√5.×6.×7.√8.√9.√ 10.×三、简答题(回答要点,并简明扼要作解释。
每小题5分,共10分)1.(1)大量观察法(1分);(2)统计描述法(统计分组法、综合指标法、统计模型法)(3分);(3)统计推断法(1分)。
2.(1)确定调查目的(1分);(2)确定调查对象和调查单位(1分);(3)确定调查项目和调查表(1分);(4)确定调查时间(1分);(5)确定调查工作的组织实施计划(1分)。
四、统计数据描述计算题(15分)甲x =8.5 (2分)乙x =11.75 (2分)σ甲=2.22 (3分)σ乙=2,74 (3分)V σ甲=26.12% (2分)V σ乙=23.32% (2分)V σ乙<V σ甲∴乙组的平均数代表性大。
(1分)五、指数计算题(15分)(1)360×12%=43.2(亿元) (2分)(2)2.193842.40338405.12.403%1052.43360%,105101111101011=-=-⇒==+==⇒==∑∑∑∑∑∑q p q p k q p q p qp q p k p p 因为所以,由于农副产品收购价格提高了5%,农民因此增加了19.2亿元的收入;(5分)(3)==÷=∑∑q p q p k k k p pq q 0010因为112%÷105%=106.67%;所以农副产品收购量增加了6.67%243603840010=-=-∑∑q p q p 又因为,因此农民又增加了24亿元的收入;(5分) (4)112%=106.67%×105%;43.2(亿元)=24(亿元)+19.2(亿元)(3分)六、抽样推断计算题(10分)(1)抽样平均误差(抽样标准差):5.1495.10===n x σσ (3分) (2)抽样极限误差:94.25.196.12/=⨯=⨯=x x Z E σα (2分)(3)置信区间:=+-),(E x E x (32.56 , 38.44) (2分)(4)需抽查: (位)1962/47.15.1096.1)(2222,22=⨯=⨯=x n E Z σα (3分)七、相关回归计算题(15分)(1)r =-0.91, (3分)高度负相关 (2分)(2)b =-1.818, (2分) a =77.363 (2分)y ∧=77.363-1.818x (2分)产量每增加1千件,单位成本下降1.818元(2分)(3)Sy =0.98(元/件) (2分)八、案例分析题(15分)(1) H 0:μ≤ 1200, H 1:μ> 1200 (3分)(2) 5.110030012001245=-=-=n x Z σμ 取α=0.05时,Z α=1,645。
江西财经大学统计学院《432统计学》[专业硕士]历年考研真题(含部分答案)专业课考试试题
2011年江西财经大学统计学院432 统计学[专业硕士]考研真题
2012年江西财经大学统计学院432 统计学[专业硕士]考研真题
2013年江西财经大学统计学院432 统计学[专业硕士]考研真题
2014年江西财经大学统计学院432 统计学[专业硕士]考研真题
2014年江西财经大学统计学院432 统计学[专业硕士]考研真题及详解
时,在数学上运用的是不确定的概率估计法; ③ 抽样推断的误差可以事先计算,并能加以控制。在随机原则下,
可以描述出抽样误差的分布,因而可根据总体标志值的差异程度,通过 增加样本单位数或改进抽样方法等途径把抽样误差控制在一定范围内。
5 简述指数因素分析法的步骤。 答:因素分析法是利用统计指数体系分析现象总变动中各个因素影 响程度的一种统计分析方法,指数因素分析法的步骤如下: (1)从研究的目的、任务出发,在定性分析的基础上,依据有关科 学理论和知识确定分析的对象和影响因素; (2)确定分析对象指标和影响因素指标,并列出其关系式; (3)建立分析指数体系及绝对增减量关系式; (4)分析各因素变动对对象变动的影响。
统计学--第二章统计数据的描述PPT课件
统计先是思维而后才是数学
.
41
例:组中值计算
按周加工零件数 分组
80以下 80—90 90—100 100—110 110—120 120—130 130以上 合计
组中值
75 85 95 105 115 125 135 ——
录取 未录取 报考人数
工程系
男生 女生
300
100
300
100
600
200
财经系
男生 女生
50
100
150
300
200
400
工程系:男女录取比率50%,财经系:男女录取比率25%。
说明的问题:对数据 1.要从不同的角度进行分析; 2.要注意结构或是权数的影响。
统计先是思维而后才是数学
.
5
2.1 统计数据的整理
按周加工零件数分组 80—90 90—100 100—110 110—120 120—130 合计
次数(频数) 3
7 13 5 2
30
频率(%) 10
23.33 43.33 16.67 6.67 100
统计先是思维而后才是数学
重合组限、闭口组限
.
31
对于重合组限的形式,为解决“不重”的 问题,统计分组时习惯上规定“上组限不 在内”,即当相邻两组的上下限重叠时, 恰好等于其一组上限的变量值不算在本组 内,而计算在下一组内。
1. 按一定顺序将数据排列,以发现一些明显的特征或趋 势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新归类或分组 等提供依据
3. 在某些场合,排序本身就是分析的目的之一 4. 排序可借助于计算机完成
ch02统计学 江西财大
Slide 15
Frequency Distribution
The three steps 1. Determine the number of nonoverlapping classes. 2. Determine the width of each class 3. Determine the class limits Guidelines for Selecting Number of Classes • Use between 5 and 20 classes. • Data sets with a larger number of elements usually require a larger number of classes. • Smaller data sets usually require fewer classes.
© 2003 Thomson/South-Western
Slide 1
2.1 Summarizing Qualitative Data
Frequency Distribution Relative Frequency Distribution Percent Frequency Distribution Bar Graph Pie Chart
© 2003 Thomson/South-Western
Slide 16
Frequency Distribution
© 2003 Thomson/South-Western
Slide 11
Example: Marada Inn
Pie Chart
Exc. Poor 5% 10% Above Average 45% Below Average 15% Average 25%
《统计学(第二版)》电子课件 第2章 数据的描述
《统计学》第2章数据的描述
2-19
抽样调查
抽样调查(sampling survey):是从研究对 象的总体中随机抽取一部分个体作为样 本进行调查,并根据调查结果来推断总 体数量特征的一种非全面调查方法。
抽样调查的特点:经济性好、实效性强、 适应面广、准确性高。
2021/8/7
《统计学》第2章数据的描述
2021/8/7
《统计学》第2章数据的描述
2-30
【例2.2】
——条形图的绘制
图2.1 30名教师职称分布条形图
2021/8/7
《统计学》第2章数据的描述
2-31
【例2.3】
——饼图的绘制
(数据文件为)根据表资料, 用SPSS绘制 饼图。
解:打开数据文件example2.1.sav;
选择→“图形”→点击“旧对话框 (L)”→“饼图(E)”→在“图表中的 数据为”中选“个案组摘要(G)→点击 “定义”→ 在“分区的表征”中选中“个 案数(N)”→将“职称”选入“定义分区 (B)”→点击“确定”,可得图。
100.00
2021/8/7
《统计学》第2章数据的描述
2-36
组距分组中的几个基本概念
组限:每个组两端的数值。分为上限和 下限。
组距:一个组的上限与下限两端的距 离。
全距:所有变量值中最大值与最小值 之差 。
组中值:每个组的上限与下限的中点 值。
2021/8/7
《统计学》第2章数据的描述
2-37
数据的计量尺度 数据的类型
2021/8/7
《统计学》第2章数据的描述
2-4
数据的计量尺度
按照对现象计量程度的不同,可以将数据 计量尺度分为四种,即:定类尺度、定序 尺度、定距尺度、定比尺度。
江西财经大学统计学第二章描述统计:图表法
STAT
表头 列 标 题 数 字 资 料
单位
户 人 人 % 元 元 元 元
1999年
40044 3.14 1.77 56.43 1.77 5888.77 5854.02 4615.91
2000年
4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00
行 标 题
思考:居民收入呈什么分布?
第二章 描述统计:图表法
六、统计图
人数f 1.直方图。 又 称 “桅杆、大梁”图; 15 宽i;高f 12
30 名儿童身高分布 身高 人数 80—90 3 90—100 7 100—110 13 110—120 5 120—130 2 30
STAT
9 6
3
80 90 100 110 120 130
7. 线图
STAT
第二章 描述统计:图表法
8. 散点图
STAT
40 35 30 25 20 15 10 5 0 0 5 10 15
第二章 描述统计:图表法
附:统计表的编制
(一)基本结构
1999~2000年城镇居民家庭抽样调查资料
项目
调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业率 平均一就业者负担人数 平均每人全部年收入 #可支配收入 平均每人消费性支出
STAT
表三:5 组 身高(cm) 人数(人) 80—90 3 90—100 7 100—110 13 110—120 5 120—130 2 合计 30
第二章 描述统计:图表法
STAT
5. 组中值 =(U+L)/2 身高(cm) 人数(人) 90 以下 3 “本组平均水平” 。将组距缩小 90—100 7 或组数增多,则两者之间的误差将 100—110 13 缩小,尤其当组数趋于无限大时, 110—120 5 两者非常接近。 组中值的假定条件: 第四组均匀分布时:111,113,115,117,119; 对称分布时:112,114,115,116,118。 ■闭口组和开口组 开口组首组组中值=U-邻组i/2 开口组末组组中值=L+邻组i/2
第二章-统计图表ppt课件
示例:小教本011教育统计学单元考试学生成绩频数分布直
方图
16
14
12
50-
10
60-
8
70-
6
80-
90-
4
2
0
.
多边图
多边图表示连续性随机变量次数分布的线性图。 绘制多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐 标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐 标标点,连接各点,就成为一条折线。 多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布,但 多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。 如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。 这样就能够对于总体的理论次数分布的分析提供很多有用的信息
.
其他常用的统计图的类型
(2)圆形图 圆形图主要用于描述间断性资料,目的为显示各部分在整体中所占
的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如 百分数)为主。
.
其他常用的统计图的类型
(3)线形图 线形图更多地用于连续资料,凡欲表示两个变量之间的函数关系,
或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的 情形,用线性图表示是较好的方法。
.
示例:小教本011教育统计学单元考试学生成绩频数分
布多边图
.
累加频数分布图
它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上 限或下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点 即可画成累加曲线,也叫S型曲线
示例:小教本011教育统计学单元考试学生成绩频
数分布多边图
.
累加频数分布表
江西财经大学 统计学课后习题汇总(2013统计学复习)
第二章习题(平均指标)PPT :1-5 1.[习题集P21第2题]某纺织局所属各企业按工人数分组资料如下:企业按工人数分组(人)各组企业占企业总数的%50-99 100-249 250-499 500-749 750-999 1000-1499 1500-2000 2 8 15 20 25 20 10合计100试计算该局企业平均职工人数以及第20百分位数。
2.[习题集P21第3题]某乡播种2800亩早稻,其中35%的稻田使用良种,平均亩产750斤,其余的稻田平均亩产仅480斤。
试问:(1)全部耕地早稻平均亩产是多少?(2)早稻的全部产量是多少?3.[习题集P21第4题]某产品分为四个等级,有关资料如下:产品等级出厂价格(元/吨)产量(吨)计划实际特级品一级品二级品三级品460420370330300012001200600400013001400500合计—6000 7200试计算产品计划与实际的平均等级和平均出厂价格,指出两者间的经济联系(可对产品等级进行赋值后计算)4.某地区粮食生产资料如下:按亩产分组(公斤)耕地面积(万亩)375以下375-400 400-425 425-450 450-475 475-500 500以上4.2 8.3 10.7 31.5 10.8 10.0 4.5合计80.0根据该资料计算亩产的中位数和众数,并判断其分布态势。
第二章习题(离散程度指标)PPT :6-10 1.[习题集P23第9题]某车间有两个小组,每组都是7人,每人日产量数如下:第一组:20、40、60、70、80、100、120;第二组:67、68、69、70、71、72、73。
已知两组工人每人平均日产量件数为70件。
试计算:(1)R;(2)A.D;(3)S.D,并比较哪个组的平均数代表性大?要求:如计算过程有小数,请保留至小数点后两位,余均同。
2.[习题集P23第10题]有两班各20名工人的日产量分组资料如下:甲组乙组日产量(件)工人数(人)日产量(件)工人数(人)5 7 9 10 13 3564281214151667331合计20 合计20试据此分别计算其平均日产量,并说明哪个班的平均日产量代表性大?3.两种不同的水稻品种分别在五块田块上试种,其产量资料如下:甲品种乙品种播种面积(亩)产量(斤)播种面积(亩)产量(斤)1.2 1.1 1.0 0.9 0.8 1200104511008108401.51.31.31.00.916801300117012206305.0 49956.0 6000假定生产条件相同,试计算这两个品种的收获率(产量/播种面积),确定哪一品种具有较大的稳定性和推广价值。
统计学(第四版)课件第2篇章统计数据的描述
在经济学中的应用
宏观经济分析
01
通过统计数据了解经济增长、就业、物价等指标,为政策制定
提供依据。
微观经济研究
02
利用统计方法研究个体经济行为,如消费、投资等。
市场调研
03
通过统计分析了解市场需求、竞争状况,为企业决策提供支持。
THANKS FOR WATCHING
感谢您的观看
标准化的方法
包括最小-最大标准化、Z分数标 准化和百分位数标准化等,应根
据研究需求选择合适的方法。
标准化的步骤
包括确定标准化方法和计算标准 化值等步骤,需注意确保标准化
的准确性和合理性。
03 统计数据的描述
描述集中趋势的指标
中位数
将数据按大小顺序排列后,位 于中间位置的数值。
几何平均数
适用于比较非对称分布的数据 集,计算方式为将数据相乘后 取算术平均数的算术平均数。
社会调查
通过统计方法了解社会现象,如教育水平、就业 情况、家庭关系等。
犯罪研究
利用统计数据对犯罪行为进行定量分析,为预防 和打击犯罪提供支持。
在医学中的应用
临床试验
通过统计分析,评估新药或治疗方法的疗效和安全性。
流行病学
利用统计方法研究疾病分布、传播和影响因素,为防控提供依据。
诊断与预后
通过统计分析,评估患者的诊断和预后情况,制定个性化治疗方案。
变异系数
标准差与平均数的比值,用于 比较不同量纲或不同平均数的 数据的离散程度。
四分位差
表示一组数据中间50%的离散 程度,计算方式为第三四分位
数与第一四分位数的差值。
描述数据分布形态的指标
偏态系数
描述数据分布的不对称性,大于0表 示右偏态,小于0表示左偏态。
《统计学第二章》课件
THANKS
感谢观看
多元线性回归分析
总结词
多元线性回归分析是研究多个因变量与 多个自变量之间的线性关系的统计方法 。
VS
详细描述
多元线性回归分析通过建立多元线性回归 方程来描述多个因变量与多个自变量之间 的平均变化关系。这种方法可以同时考虑 多个自变量对因变量的影响,并通过对回 归方程的参数进行估计和检验来评估关系 的强度和方向。多元线性回归分析在经济 学、社会学和生物医学等领域有广泛应用 。
离散型随机变量的概率分布
1 2
离散型随机变量
随机变量只取有限个或可数个值。
离散型随机变量的概率分布
描述离散型随机变量取各个可能值的概率。
3
离散型随机变量的期望值和方差
描述离散型随机变量的数学期望和离散程度的量 。
连续型随机变量的概率分布
连续型随机变量
01
随机变量可以取任何实数值。
连续型随机变量的概率分布
提出原假设和备择假设、构造检验统计量、确定临界值、做出决 策。
单样本假设检验的示例
检验某班级学生的平均成绩是否达到预期水平。
单样本假设检验的适用场景
只有一个总体需要检验的情况。
双样本假设检验
双样本假设检验的基本步骤
提出原假设和备择假设、构造检验统计量、确定临界值、 做出决策。
双样本假设检验的示例
比较两个不同班级学生的平均成绩是否存在显著差异。
双样本假设检验的适用场景
需要对两个总体进行比较的情况。
06
CATALOGUE
回归分析与方差分析
一元线性回归分析
总结词
一元线性回归分析是研究一个因变量与一个自变量之间的线性关系的统计方法。
详细描述
江西财经大学 统计学课后习题汇总(2013统计学复习)
第二章习题(平均指标)PPT :1-5 1.[习题集P21第2题]某纺织局所属各企业按工人数分组资料如下:企业按工人数分组(人)各组企业占企业总数的%50-99 100-249 250-499 500-749 750-999 1000-1499 1500-2000 2 8 15 20 25 20 10合计100试计算该局企业平均职工人数以及第20百分位数。
2.[习题集P21第3题]某乡播种2800亩早稻,其中35%的稻田使用良种,平均亩产750斤,其余的稻田平均亩产仅480斤。
试问:(1)全部耕地早稻平均亩产是多少?(2)早稻的全部产量是多少?3.[习题集P21第4题]某产品分为四个等级,有关资料如下:产品等级出厂价格(元/吨)产量(吨)计划实际特级品一级品二级品三级品460420370330300012001200600400013001400500合计—6000 7200试计算产品计划与实际的平均等级和平均出厂价格,指出两者间的经济联系(可对产品等级进行赋值后计算)4.某地区粮食生产资料如下:按亩产分组(公斤)耕地面积(万亩)375以下375-400 400-425 425-450 450-475 475-500 500以上4.2 8.3 10.7 31.5 10.8 10.0 4.5合计80.0根据该资料计算亩产的中位数和众数,并判断其分布态势。
第二章习题(离散程度指标)PPT :6-10 1.[习题集P23第9题]某车间有两个小组,每组都是7人,每人日产量数如下:第一组:20、40、60、70、80、100、120;第二组:67、68、69、70、71、72、73。
已知两组工人每人平均日产量件数为70件。
试计算:(1)R;(2)A.D;(3)S.D,并比较哪个组的平均数代表性大?要求:如计算过程有小数,请保留至小数点后两位,余均同。
2.[习题集P23第10题]有两班各20名工人的日产量分组资料如下:甲组乙组日产量(件)工人数(人)日产量(件)工人数(人)5 7 9 10 13 3564281214151667331合计20 合计20试据此分别计算其平均日产量,并说明哪个班的平均日产量代表性大?3.两种不同的水稻品种分别在五块田块上试种,其产量资料如下:甲品种乙品种播种面积(亩)产量(斤)播种面积(亩)产量(斤)1.2 1.1 1.0 0.9 0.8 1200104511008108401.51.31.31.00.916801300117012206305.0 49956.0 6000假定生产条件相同,试计算这两个品种的收获率(产量/播种面积),确定哪一品种具有较大的稳定性和推广价值。
江西财经大学统计学考点汇总
江西财经大学统计学考点汇总1(总10页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--统计学知识点汇总一、统计学统计学是一门关于数据资料的收集、整理、分析和推断的科学。
二、统计学的产生与发展(1)政治算术学派最早的统计学源于17世纪英国。
其代表人物是威廉·配第,代表作《政治算术》。
政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。
其被称为“无统计学之名,有统计学之实”。
(2)记述学派亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。
因此被称为“有统计学之名,无统计学之实”。
(3)社会统计学派创始人和代表人物,德国恩格尔和梅尔。
该学派主张统计是实质性的研究社会现象的社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和相互关系。
(4)数理统计学派创始人是比利时统计学家凯特勒,他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。
从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。
到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。
三、统计的特点(1)数量性:社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。
(2)总体性:社会经济统计的认识对象是社会经济现象的总体的数量方面。
例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。
(3)具体性:社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。
这是统计与数学的区别。
(4)社会性:社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。
应用统计学描述统计.ppt
合计
职工人数(人)f
60 110 270 220 180 120 28 12 1000
组中值(元)x
150 250 350 450 550 650 750 850
工资总额(元)xf
9000 27500 94500 99000 99000 78000 21000 10200 438200
x
xf f
438200 1000
3、频数分布构成要素
成绩 60以下
各组的分组界限
60-70
每组中的次数或频率 70-80
80-90
90以上
合计
人数
频率
3
7.14%
8
19.05%
12 28.57%
15 35.71%
4
9.52%
42 100.00%
第2章 描述统计 2.1 统计数据的整理
2.1.3 统计数据分组与频数分布
4、 频数分布的种类 类别频数分布:经过类别变量分组后形成的频
加不等于总计。
第2章 描述统计 2.1 统计数据的整理 2.1.3 统计数据分组与频数分布——列联表举例
市场营销专业的男生有10人。
市场营销专业 统计学专业
男生
10
20
女生
30
15
合计
40
35
合计
30 45 75
XX大学统计学课件-第2章
表格描述:便于分析
表格描述:便于分析
表格描述:便于分析
数值描述:概括但掩盖了差异
2009年度分行业城镇单位从业人员平均工资排名
行业
年平均工资(元)
1金融业
60398
2信息传输、计算机服务 和软件业
58154
3科学研究、技术服务和 地质勘察业
50143
17水利、环境和公共设施 管理业
23159
据。
第一节 图表描述的特点
• 图形方法很直观,但通常无法显示精确数值; • 表格方法方便观察和进一步分析; • 数值方法具有概括性,但往往掩盖了差异。
第二节 一些统计图表的主要用途
一、频数表(Frequency table)
• 频数表用来对同一时间上的一个变量汇总数 据和描述分布情况;
• 频数和累计频数用于说明不同的内容,可以选 择不同的频数和累计频数方法;
第二节 一些统计图表的主要用途
八、散点图(Scatter diagram) • 散点图用来描述两个变量间的数量关系; • 依据散点图可以比较直观地看出两个变量间
是否存在数量关系和关系的类型; • 依据散点图可以大致判断变量的关联强度。
第二节 一些统计图表的主要用途
九、帕累托图( Pareto charts ) • 帕累托图也称排列图或主次因素图; • 依据帕累托图可以找出“关键的少数”和
18住宿和餐饮业
20860
19农、林、牧、渔业
14356
数值描述:概括但掩盖了差异
中国民生指数课题组完成的《2010年中国城市 居民幸福感调查》显示,七成半的受访人感到幸福。
具体分析被调查者的所属行业和职业后发现, 国家机关党群组织、企事业单位负责人回答“非常 幸福”的比例最高;回答“非常幸福”比例最低的 是生产运输设备操作人员和农林牧渔水产生产人员。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 描述统计:图表法
本章重点
1. 频数分布 2. 统计表 3. 统计图
STAT
本章难点
1. 频数分布
A 班学生年龄分布表 年龄 人数 频率 17 6 0.12 18 14 0.28 19 18 0.36 20 9 0.18 21 3 0.06 合计 50 1.00 均值=18.78 标准差=1.07
第二章 描述统计:图表法
(4)编制变量数列。 (按身高对儿童分组) 2006年某地30名同龄儿童身高分布统计表
STAT
表二 身高(cm) 人数(人) 90 以下 3 90—100 7 100—110 13 110—120 5 120 以上 2 合计 30
表一 身高(cm) 人数(人)
80~90 90~100 100~110 110~120 120~130 3 7 13 5 2
STAT
组中值的假定条件: 第四组均匀分布时:111,113,115,117,119; 对称分布时:112,114,115,116,118。 ■闭口组和开口组 开口组首组组中值=U-邻组i/2 开口组末组组中值=L+邻组i/2
身高(cm) 人数(人) 90 以下 3 90—100 7 100—110 13 110—120 5 120 以上 2 合计 30
生猪饲养数 5 以下 6—10 11—15 16—20 21—25 26—30 31 以上 合计
STAT
农户比重% 8 10 19 37 13 8 5 100
第二章 描述统计:图表法
STAT
7. 变量数列编制的步骤 [例]已知30名同龄儿童的身高资料(cm): 106,99,85,121,84,94,106,105,110,119,101, 95,91,87,105,106,109,118, 96 ,128,91,97, 105,111,111,107,103,101,107,106。 (1)将变量值按大小次序排列; (2)计算全距:R=128–84=44(cm); (3)确定组数与组距; 令i=10cm, 组数n=44/10=4.4,取5组。
STAT
第二章
描述统计:图表法
第二章 描述统计:图表法
统计实例
STAT
[年终审计时间] 桑德逊· 克利夫德会计师事务所对20个客户样本的年终审计所 花费的时间天数如下表所示。 请您:1. 采用适当的统计方法对该数据进行处理; 2. 您从这些数据中发现了何种统计规律? 年终审计时间(天)
12 18 22 16
思考:居民收入呈什么分布?
第二章 描述统计:图表法
六、统计图
人数f 1.直方图。 又 称 “桅杆、大梁”图; 15 宽i;高f 12
30 名儿童身高分布 身高 人数 80—90 3 90—100 7 100—110 13 110—120 5 120—130 2 30
STAT
9 6
3
80 90 100 110 120 130
年龄 供 给 ( 需 求 ) 价格
第二章 描述统计:图表法
五、累积分布
1. 向上累积:……以下; 2. 累积频数图
审计时间 10~15 15~20 20~25 25~30 30~35 合计 客户数 4 8 5 2 1 20 向上累积 4 12 17 19 20
STAT
向下累积:……以上。
向下累积 20 16 8 3 1
STAT
表头 列 标 题 数 字 资 料
单位
户 人 人 % 元 元 元 元
1999年
40044 3.14 1.77 56.43 1.77 5888.77 5854.02 4615.91
2000年
4222.0 3.13 1.68 53.67 1.86 6316.81 6279.98 4998.00
行 标 题
STAT
表三:5 组 身高(cm) 人数(人) 80—90 3 90—100 7 100—110 13 110—120 5 120—130 2 合计 30
第二章 描述统计:图表法
5. 组中值 =(U+L)/2 “本组平均水平” 。将组距缩小 或组数增多,则两者之间的误差将 缩小,尤其当组数趋于无限大时, 两者非常接近。
人数 f 20 30 50
人数 f 6 率 0.12 0.28 0.36 0.18 0.06 1.00
第二章 描述统计:图表法
,会损失一些信息,如同足球比赛被简化为最后得分。
表现形式:表、图
STAT
频数分布是一种数据概括和简化。简化是为了消除“嗓音”
4. 组数:n=R/i
[经验] i 5、10或其倍数;
n 5~7组。
第二章 描述统计:图表法
表一:21 组 身高(cm) 人数(人) 84 1 85 1 87 1 91 2 94 1 95 1 96 1 97 1 99 1 101 2 合计 30
表二:2 组 身高(cm) 人数(人) 80—105 13 105—130 17 合计 30
7. 线图
STAT
第二章 描述统计:图表法
8. 散点图
STAT
40 35 30 25 20 15 10 5 0 0 5 10 15
第二章 描述统计:图表法
附:统计表的编制
(一)基本结构
1999~2000年城镇居民家庭抽样调查资料
项目
调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业率 平均一就业者负担人数 平均每人全部年收入 #可支配收入 平均每人消费性支出
成绩 [例]某班某门课的考试成绩最高为98分, 40—50 50—60 最低为45分R=53分。 60—70 (1)i=10分,n=R/i=53/10= 5.3; 70—80 (2) i=20分,n=R/i=53/20=2.65。 80—90 90—100
STAT
人数 首组 第二组 第三组 第四组 第五组 末组
合计
30
第二章 描述统计:图表法
四、次数分布类型
(一)钟形分布 特征:中间大、两头小。 身高、体重、智商、纤维长度、细纱强度等。 1. 对称分布:正态分布及t分布。
STAT
2. 偏态分布(不对称分布)
(1)右(正)偏有极大值; (2)左(负)偏有极小值。
第二章 描述统计:图表法
人数
年龄 17 18 19 20 21 32 33 合计 人数 5 10 15 10 5 3 1 49 年龄 3 4 17 18 19 20 21 合计 人数 1 3 5 10 15 10 5 49
第二章 描述统计:图表法
STAT
6.次数密度= 次数/组距。 第三组:13人/10厘米=1.3人/厘米。 注意: ■对连续变量,只可编制组距式数 列,且相邻组限必须重叠。 ■对重叠组限,组限值单位数遵 循“上组限不在内”的原则。 [例 ] 第二组的取值范围[90、100); 第三组的取值范围[100、110)。 ■离散变量不受此限制。
第二章 描述统计:图表法
思考
STAT
某公司加工一批钢珠,标准直径10.0mm,今随机抽取56个检 测,直径(mm)为: 10.1,10.3,10.4,9.9, 9.9,10.1, 10.2,9.8, 10.4,10.1, 9.9,10.5,10.1,10.0,10.0, 9.9, 10.2,10.4,10.1,9.9, 10.0,10.6, 10.7,10.0,10.1,10.0,10.0,9.8,10.2, 10.3, 9.8, 10.0,9.9, 10.2,10.1,10.0, 10.0,10.3, 10.1,10.0,9.8, 9.8, 10.0, 10.5,10.6,9.8, 10.3, 10.5,9.9, 9.8, 10.0,10.2,10.0,10.2, 9.9, 10.1 其生产的这批钢珠存在问题吗?为什么?
2. 类型 (1)属性(品质)次数分布
(2)变量数列※
变量x;次数f;频率。
第二章 描述统计:图表法
二、变量数列的种类
STAT
1.单项式数列:一个(种)变量值代表一组。 2.组距式数列:依组距分组等距、异距数列。 不足:丧失了原始信息;所得:减少了组数,反映了规律。
某地人口分布表 年 龄 人数(万人) 0—10 7 10—20 11 20—30 24 30—40 8 40—50 2 合 计 52
ñ È Ð Õ ý É ± ù ² è 22%
» Í ² ¬ Æ ·Å Æ Ò û Á Ï µ Ä ¹ ³ É
第二章 描述统计:图表法
6. 环形图
13%
STAT
7%
8% 非常不满意 33% 不满意 一般
10%
15% 21%
36%
31% 26% 甲乙两城市家庭对住房状况的评价
满意 非常满意
第二章 描述统计:图表法
STAT
年龄 17 18 19 20 21 合计
人数 5 10 15 10 5 45
年龄
第二章 描述统计:图表法
死 (二)U形(浴盆)分布 亡 分布特征:两头大、中间小 率 人和动物分年龄段的死亡 率;产品按使用时间的故障率。
STAT
(三)J形分布
分布特征:一边大、一边小 1. 正J分布:右大左小 供给曲线。 2. 反J分布:左大右小 需求曲线、按结婚次数 分组的人口数。
身高 人数 次数密度 70—90 3 0. 15 90—100 7 0. 7 100—110 13 1. 3 110—120 5 0. 5 120—130 2 0. 2 合计 30 0. 5
第二章 描述统计:图表法
[例]按每户人数对家庭进行分组; 按生猪饲养头数对养猪专业户进行分组。
每户人数 1 2 3 4 5 6 7 以上 合计 家庭户数 8 10 19 37 13 8 5 100
STAT
2009年神州公司三个子公司利润额对比