统计学基础课件(第一章)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本统计量通常用小写英文字母来表示
38
39
总体参数一般是不知道的
统计学抽样研究的目的就是:
样本统计量
总体参数
40
三、变量
1. 说明现象某种特征的概念
如性别、民族、身高、体重、成绩、合格率等 变量的具体表现称为变量值,女、苗族、1.68米、50公斤、
优等即为变量值也称为数据
2. 变量可以分为
1ห้องสมุดไป่ตู้3.7
100 0
16.5 14.731.639.353.525.357.61.461.460.457.163.780.583.982.983 84.7964.98
1978 1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005 2007 2009
2017年9月
1
第一章 统计和数据
1.1 统计及其应用领域 1.2 统计数据及其类型 1.3 统计中的基本概念
2
1.1统计及其应用领域 什么是统计
从不同的角度理解可以有三种含义: 1.统计工作——对社会经济现象的数量方面进行
搜集、整理、分析研究所做的工作。如:“你是 不是搞统计的?” 2.统计资料——指反映社会经济现象的数量方面 的数字及文字资料。如:“据统计”。 3.统计学——系统论述统计工作原理和方法的科 学。如:“我正在学统计”。
32
33
练习
34
练习
35
36
37
二、参数和统计量
1. 参数(parameter) 用来描述总体特征的概括性数字度量 参数主要有总体均值()、标准差()、总体 比例()等 总体参数通常用希腊字母表示
2. 统计量(statistic) 用来描述样本特征的概括性数字度量
样本统计量有样本均值(x)、样本标准差(s)、 样本比例(p)等
变量值
42
练习
1.某大学有1000名男教师和500名女教师,为了了解教 师的生活状况,从1000名男教师中随机抽取了100名, 500名女教师中随机抽取了50名。 (1)指出这一研究的总体、个体、样本; (2)指出这一研究的参数; (3)指出这一研究的统计量; (4)这一研究涉及的是截面数据还是时间序列数据。 2.要调查某家电商场洗衣机的销售情况,试指出总体、 个体是什么?并举出至少一个分类变量、顺序变量、 数值型变量。
15
三、统计的误用与滥用
问:统计资料表明,大多数汽车事故发生在中等 速度的行驶中,极少数的事故是发生在大于150 公里/小时的行驶速度上。这是否就意味着高速 行驶比较安全?
答:绝不是这样。统计关系往往不能表明因果关 系。由于多数人是以中等速度开车,所以多数事 故是发生在中等速度的行驶中
16
分类标准:计量尺度
分类数据 (categorical data)
人口按性别分为男;女。职业分为国家机关、党 群组织工作人员、企事业单位管理人员;各类专业、 技术人员;办事人员和有关人员;商业与服务业人员; 农林牧渔业生产人员;生产人员,运顺输序人数员据和(r有an关k 人data) 员;军队;不便分类的其他劳动者8类。
分类变量:说明事物类别的一个名称 顺序变量:说明事物有序类别的一个名称 数值型变量:说明事物数字特征的一个名称
离散变量:取有限个整数值 连续变量:可以取无穷多个小数值
41
例如
人数 20人、50人、82人、123人等
离散型变量
变量值
身高1.60米、1.61米、1.62米等
连续型变量
总体
全班所有的学生
个体
每一个学生
广州市的工业生产情况
总体
所有的工业企业
个体
每一个工业企业
广州的工业生产设备情况
总体 个体
所有的工业生产设备 每一台工业生产设备
30
2.样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本量
31
总体和样本
总体
样 本
个体 个体 个体 个体
数据分析
Data Analysis
为什么?
做出决策
DecisionMaking
?1984-1994 T/Maker Co.
统计学分类
6
7
描述统计示例
8
描述统计示例
我国高等学校历年毕业生人数(万人)
700
631
600
610
559
500
495
400
413
338
300
239.1
200
103.63 187.7
3
1.1统计及其应用领域 一、什么是统计学
统计学是收集、处理、分析、解释数据 并从中得出结论的科学
1. 数据收集:取得数据 2. 数据处理:图表展示数
据 3. 数据分析:分析数据 4. 数据解释:结果的说明
4
什么是统计学?
1.收集数据Collecting Data 例:问卷调查Survey 2.表示数据Presenting Data 例:图表Charts & Tables 3.描述数据Characterizing Data 例:平均值Average
1.这两个变量之间是否有关系? 2.如果有关系,它们的关系是否显著? 3.二者是什么关系?是否可以用数学模型来描述?
12
二、统计学的应用领域
经济学
医学
管理学
统计学
工程学
社会学
食品科学
13
统计学的应用领域
14
文学也用到统计学
1981年,首届国际《红楼梦》研讨会在美国召开 ,威斯康星大学讲师陈炳藻独树一帜,宣读了题 为《从词汇上的统计论红楼梦作者的问题》的论 文。他从字、词出现频率入手,通过计算机进行 统计、处理、分析,对《红楼梦》后40回系高鹗 所作这一流行看法提出异议,认为120回均系曹雪 芹所作。
一、总体和样本 二、参数和统计量 三、变量
28
一、总体和样本
1. 总体(population)
总体是所研究的全部元素的集合 ,其中的每 一个元素称为个体
分为有限总体和无限总体
有限总体的范围能够明确确定,且元素的数目是有 限的
无限总体所包括的元素是无限的,不可数的
29
研究食品3学生的学习情况
43
分类标准:收集方法
观测数据 (observational
data)
在没有对事物人为控制的条件下而得到的数据。
实验数据 (experimental data)
在实验中控制实验对象而收集到的数据。
23
1.2 数据的类型
分类标准:时间状况
截面数据(crosssectional data)
2009年中国GDP达到33.53万亿元,城镇居民人
产品质量分为一等品;二等品;三等品。评价分数为优; 良;差。劳动效率分为高;中;低。 数值型数据
人的身高分为168cm;175cm;183cm。销(m售et利ric润d为at3a0)万元; 50万元;80万元。年薪为20万元;35万元;50万元。
20
21
对课本第6页的解释
22
1.2 数据的类型
问:统计数字还表明,在亚利桑那州死于肺结核 的人比其他州死于肺结核的人多。这是否就意味 着亚利桑那州的气候容易生肺病?
答:正好相反。亚利桑那的气候对生肺病的人有 好处,所以肺病患者纷纷前来,自然就使这个州 死于肺结核的平均数升高了。
17
1.2 统计数据及其类型
18
19
1.2 数据的类型
9
10
推断统计示例
饲养场规定,肉鸡平均体重超过3千克时方可屠宰 ,现随机抽取20只,测得平均体重为2.95千克, 方差为0.2千克,请问,该批鸡是否达到屠宰标准 ?
11
推断统计示例
某产品广告投入和销售额数据(单位:万元)
广告 1.0 3.2 3.2 5.5 5.9 7.1 7.3 9.2 10.8 12.1 销售额 9.4 31.8 33.2 52.4 53.5 56.0 56.9 59.2 60.1 63.5
均可支配收入17175元,农村居民人均纯收入5153
元。
时间序列数据(time
series data)
第三产业对国民经济的拉动作用,1990年为
0.6,1995年为2.9,2000年为2.9,2005年为
4.2,2006年为4.9,2007年为5.1。
24
25
对课本第7页的解释
26
27
§1.3 统计中的基本概念
38
39
总体参数一般是不知道的
统计学抽样研究的目的就是:
样本统计量
总体参数
40
三、变量
1. 说明现象某种特征的概念
如性别、民族、身高、体重、成绩、合格率等 变量的具体表现称为变量值,女、苗族、1.68米、50公斤、
优等即为变量值也称为数据
2. 变量可以分为
1ห้องสมุดไป่ตู้3.7
100 0
16.5 14.731.639.353.525.357.61.461.460.457.163.780.583.982.983 84.7964.98
1978 1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005 2007 2009
2017年9月
1
第一章 统计和数据
1.1 统计及其应用领域 1.2 统计数据及其类型 1.3 统计中的基本概念
2
1.1统计及其应用领域 什么是统计
从不同的角度理解可以有三种含义: 1.统计工作——对社会经济现象的数量方面进行
搜集、整理、分析研究所做的工作。如:“你是 不是搞统计的?” 2.统计资料——指反映社会经济现象的数量方面 的数字及文字资料。如:“据统计”。 3.统计学——系统论述统计工作原理和方法的科 学。如:“我正在学统计”。
32
33
练习
34
练习
35
36
37
二、参数和统计量
1. 参数(parameter) 用来描述总体特征的概括性数字度量 参数主要有总体均值()、标准差()、总体 比例()等 总体参数通常用希腊字母表示
2. 统计量(statistic) 用来描述样本特征的概括性数字度量
样本统计量有样本均值(x)、样本标准差(s)、 样本比例(p)等
变量值
42
练习
1.某大学有1000名男教师和500名女教师,为了了解教 师的生活状况,从1000名男教师中随机抽取了100名, 500名女教师中随机抽取了50名。 (1)指出这一研究的总体、个体、样本; (2)指出这一研究的参数; (3)指出这一研究的统计量; (4)这一研究涉及的是截面数据还是时间序列数据。 2.要调查某家电商场洗衣机的销售情况,试指出总体、 个体是什么?并举出至少一个分类变量、顺序变量、 数值型变量。
15
三、统计的误用与滥用
问:统计资料表明,大多数汽车事故发生在中等 速度的行驶中,极少数的事故是发生在大于150 公里/小时的行驶速度上。这是否就意味着高速 行驶比较安全?
答:绝不是这样。统计关系往往不能表明因果关 系。由于多数人是以中等速度开车,所以多数事 故是发生在中等速度的行驶中
16
分类标准:计量尺度
分类数据 (categorical data)
人口按性别分为男;女。职业分为国家机关、党 群组织工作人员、企事业单位管理人员;各类专业、 技术人员;办事人员和有关人员;商业与服务业人员; 农林牧渔业生产人员;生产人员,运顺输序人数员据和(r有an关k 人data) 员;军队;不便分类的其他劳动者8类。
分类变量:说明事物类别的一个名称 顺序变量:说明事物有序类别的一个名称 数值型变量:说明事物数字特征的一个名称
离散变量:取有限个整数值 连续变量:可以取无穷多个小数值
41
例如
人数 20人、50人、82人、123人等
离散型变量
变量值
身高1.60米、1.61米、1.62米等
连续型变量
总体
全班所有的学生
个体
每一个学生
广州市的工业生产情况
总体
所有的工业企业
个体
每一个工业企业
广州的工业生产设备情况
总体 个体
所有的工业生产设备 每一台工业生产设备
30
2.样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本量
31
总体和样本
总体
样 本
个体 个体 个体 个体
数据分析
Data Analysis
为什么?
做出决策
DecisionMaking
?1984-1994 T/Maker Co.
统计学分类
6
7
描述统计示例
8
描述统计示例
我国高等学校历年毕业生人数(万人)
700
631
600
610
559
500
495
400
413
338
300
239.1
200
103.63 187.7
3
1.1统计及其应用领域 一、什么是统计学
统计学是收集、处理、分析、解释数据 并从中得出结论的科学
1. 数据收集:取得数据 2. 数据处理:图表展示数
据 3. 数据分析:分析数据 4. 数据解释:结果的说明
4
什么是统计学?
1.收集数据Collecting Data 例:问卷调查Survey 2.表示数据Presenting Data 例:图表Charts & Tables 3.描述数据Characterizing Data 例:平均值Average
1.这两个变量之间是否有关系? 2.如果有关系,它们的关系是否显著? 3.二者是什么关系?是否可以用数学模型来描述?
12
二、统计学的应用领域
经济学
医学
管理学
统计学
工程学
社会学
食品科学
13
统计学的应用领域
14
文学也用到统计学
1981年,首届国际《红楼梦》研讨会在美国召开 ,威斯康星大学讲师陈炳藻独树一帜,宣读了题 为《从词汇上的统计论红楼梦作者的问题》的论 文。他从字、词出现频率入手,通过计算机进行 统计、处理、分析,对《红楼梦》后40回系高鹗 所作这一流行看法提出异议,认为120回均系曹雪 芹所作。
一、总体和样本 二、参数和统计量 三、变量
28
一、总体和样本
1. 总体(population)
总体是所研究的全部元素的集合 ,其中的每 一个元素称为个体
分为有限总体和无限总体
有限总体的范围能够明确确定,且元素的数目是有 限的
无限总体所包括的元素是无限的,不可数的
29
研究食品3学生的学习情况
43
分类标准:收集方法
观测数据 (observational
data)
在没有对事物人为控制的条件下而得到的数据。
实验数据 (experimental data)
在实验中控制实验对象而收集到的数据。
23
1.2 数据的类型
分类标准:时间状况
截面数据(crosssectional data)
2009年中国GDP达到33.53万亿元,城镇居民人
产品质量分为一等品;二等品;三等品。评价分数为优; 良;差。劳动效率分为高;中;低。 数值型数据
人的身高分为168cm;175cm;183cm。销(m售et利ric润d为at3a0)万元; 50万元;80万元。年薪为20万元;35万元;50万元。
20
21
对课本第6页的解释
22
1.2 数据的类型
问:统计数字还表明,在亚利桑那州死于肺结核 的人比其他州死于肺结核的人多。这是否就意味 着亚利桑那州的气候容易生肺病?
答:正好相反。亚利桑那的气候对生肺病的人有 好处,所以肺病患者纷纷前来,自然就使这个州 死于肺结核的平均数升高了。
17
1.2 统计数据及其类型
18
19
1.2 数据的类型
9
10
推断统计示例
饲养场规定,肉鸡平均体重超过3千克时方可屠宰 ,现随机抽取20只,测得平均体重为2.95千克, 方差为0.2千克,请问,该批鸡是否达到屠宰标准 ?
11
推断统计示例
某产品广告投入和销售额数据(单位:万元)
广告 1.0 3.2 3.2 5.5 5.9 7.1 7.3 9.2 10.8 12.1 销售额 9.4 31.8 33.2 52.4 53.5 56.0 56.9 59.2 60.1 63.5
均可支配收入17175元,农村居民人均纯收入5153
元。
时间序列数据(time
series data)
第三产业对国民经济的拉动作用,1990年为
0.6,1995年为2.9,2000年为2.9,2005年为
4.2,2006年为4.9,2007年为5.1。
24
25
对课本第7页的解释
26
27
§1.3 统计中的基本概念