《统计基础知识》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2) 应用统计:统计原理在某个行业的 具体应用。如社会统计学、教育统 计学等。
3. 社会统计
社会统计是运用数理统计原理和方 法,研究社会问题的一门应用科学。主要 包括: 描述统计;(例如:体育消费的现状)
推断统计;(例如:体育消费与家庭收入之间的关系)
4. 测量
测量是根据法则给事物赋予数量。
300047 481198 350346 343410 246820 62861
48.50 荔湾 521708 50.00 芳村 184723 42.00 海珠 830436 40.0 越秀 426698 41.25 东山 627892 30.0 从化 533153
186511 35.75 81564 44.88 432080 52.03 168546 39.50 279412 44.50 129290 24.25
0 1 2 3 4 5 6 7 8 9 10 11 做对题数
4. 频数颁布直方图
图2.4中考化学统计成绩直方图
5. 累积频数图
累积频数
图2.5 2004年中考化学抽样得分情况累积频数图
2004年中考化学抽样得分累积频数分布曲线
350
300
283 287287
250
256
200
206
168 150
128
变量一般包含一个以上的亚概念或者取值。比如, 性别,是一个概念,但包含男或女两个取值。年龄、 态度等等都可以作为变量。
自变量和应变量
自变量:又称自变项、独立变项,通常用X表 示。一般是指在社会关系中引起现象发生变化 的因素。
自变量:又称因变项、依变量,通常用Y表示, 一般是指在社会关系中随着一种因素发生作用 而其变化的结果。
质为=或者≠,等级最低。
例如:性别,要么=男性,要么≠男性=女性 (2)定序变量(序次变量)Ordinal Measurement
是指研究的变项值具有大小之或高低之分。数学
性质为〉或〈,包含了=或者≠,测量层次高于定类。
例如:文化程度:博士;硕士;学士,既体现了 文化程度的分类,同时也是一种层次的排列。
45
12.23.45
46
12.23.46
47
12.24.47
48
12.24.48
表3广州市各区/县社会体育人口本区比例统计表
区县 本区总人口 体育人口 比例% 区县 本区总人口 体育人口 比例%
花都 618654 番禺 962395 增城 834156 白云 858526 天河 598353 黄埔 209535
编 码
居委名
1
鳌洲
3
兆龙里
1
海印
4
远安
1
张家里
5
法政
1
德坭新村社区
6
嘉和苑社区
1
暨南大学
7
华南师大
1
加拿大花园
8
天安
1
竹丝岗一路
9
东园新村
2
大马路
0
麓湖路
2
笔岗
1
仓联
2
四航局
2
黄埔电厂
2
团星村
3
城内居委
2
桃园居委
4
中田村
编 码
总编码
25
7.13.25
26
7.13.26
27
7.14.27
28
7.14.28
(3)定距变量(间距变量)Interval Measurement 是指能确定取值得距离,即变项之值的距离可知。具有
+或-的数学性质,包含了前两种测量的性质。 例如:甲、乙、丙三人的工资为380、950、2000。 思考:定类和定距变量的差别和转换。
(4)定比变量(比率变量)Ratio Measurement 是指变量的取值之间有某种成比例的关系。据有×或÷
29
8.15.29
30
8.15.30
31
9.16.31
32
9.16.32
33
9.17.33
34
9.17.34
35
9.18.35
36
9.18.36
37
10.19.37
38
10.19.38
39
10.20.39
40
10.20.40
41
11.21.41
42
11.21.42
43
11.22.43
44
11.22.44
的数学性质,是最高测量层次的变量。
例如:甲、乙工资分别为600、900,则乙是甲的2倍。 思考:定距与定比变量的区别
变量分类的实际意义
测度等级关系到数据分析时采取何种方法。
关系到信息使用的效率。
二、统计表
• 构成:统计表一般由标题、表号、 标目、表注等构成。
• 编制基本原则:结构简明,一目 了然。
三. 统计图 统计图由标题、图号标目、图注等项构成。
1. 直条图
人数
图2.1 某年级操行评语评定结果
60 50 40 30 20 10
0
甲
乙
丙
丁
等级
2. 圆形图
图 2.2 某年级操行评语评定结果
丁甲 9% 13%
丙
35%
乙
43%
频数
3. 线条图
图 2.310题正误题做对不同题 数概率分布
300 200 100
100
86
50
1 11 44
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1
得分率
累积频数
图2.6:高一语文
140
120
1112979
100
举例:体育态度Y与哪些因素有关 X1: 年龄 X2:文化程度 X3:性别
6. 变量的测度等级(变量分类)
在实际研究中,不同概念的变量能够被测量,即,量化的程度 不同,所以,变量的类型有一定的层次:
(1)定类变量(名义变量)Nominal Measurement
是指变量的值只能把研究对象进行分类,数学性
统计表基本格式
表的标题 ? ? ?
横标目的总标目 (亦可空白)
横标目
注脚:说明资料来源等 X X X
(顶线)
纵标目 (一般设谓语)
数字
(底线)
表1-2 研究样本分布
区名
编 码
海
珠
7
越
秀
8
天
河
9
东
山
10
黄
埔
11
从
化
12
镇(街)名 南华西街
滨江街 洪桥街 东风街 石牌街 棠下街 农林街 建设街 荔联街 南岗街 街口镇 桃园镇
测量的三要素:
– 第一,事物的属性; – 第二,数字; – 第三,规则。
5.变量的概念
科学研究中,用变量来描述概念。
变量,也称变项,变数,是说明总体各个案 所具有的某正特征或者属性的名称,且被说明 的特征或属性对于总体各个案来说是具有变ຫໍສະໝຸດ Baidu 性的。
例如:在一个地区体育人口当中,每个人的性别、 年龄等都是变量。
统计学基础
一、统计与测量概述
1. 什么是统计学
统计学是研究统计原理和方法的 科学。具体地说,它是如何搜集、整理、 分析反映事物总体信息的数字资料,并 以此为依据,对总体特征进行推断的原 理和方法。
2.统计学分类
(1) 数理统计:以概率论为基础,对统 计数据数量关系的模式加以解释, 对统计原理和方法给予数学的证明。
3. 社会统计
社会统计是运用数理统计原理和方 法,研究社会问题的一门应用科学。主要 包括: 描述统计;(例如:体育消费的现状)
推断统计;(例如:体育消费与家庭收入之间的关系)
4. 测量
测量是根据法则给事物赋予数量。
300047 481198 350346 343410 246820 62861
48.50 荔湾 521708 50.00 芳村 184723 42.00 海珠 830436 40.0 越秀 426698 41.25 东山 627892 30.0 从化 533153
186511 35.75 81564 44.88 432080 52.03 168546 39.50 279412 44.50 129290 24.25
0 1 2 3 4 5 6 7 8 9 10 11 做对题数
4. 频数颁布直方图
图2.4中考化学统计成绩直方图
5. 累积频数图
累积频数
图2.5 2004年中考化学抽样得分情况累积频数图
2004年中考化学抽样得分累积频数分布曲线
350
300
283 287287
250
256
200
206
168 150
128
变量一般包含一个以上的亚概念或者取值。比如, 性别,是一个概念,但包含男或女两个取值。年龄、 态度等等都可以作为变量。
自变量和应变量
自变量:又称自变项、独立变项,通常用X表 示。一般是指在社会关系中引起现象发生变化 的因素。
自变量:又称因变项、依变量,通常用Y表示, 一般是指在社会关系中随着一种因素发生作用 而其变化的结果。
质为=或者≠,等级最低。
例如:性别,要么=男性,要么≠男性=女性 (2)定序变量(序次变量)Ordinal Measurement
是指研究的变项值具有大小之或高低之分。数学
性质为〉或〈,包含了=或者≠,测量层次高于定类。
例如:文化程度:博士;硕士;学士,既体现了 文化程度的分类,同时也是一种层次的排列。
45
12.23.45
46
12.23.46
47
12.24.47
48
12.24.48
表3广州市各区/县社会体育人口本区比例统计表
区县 本区总人口 体育人口 比例% 区县 本区总人口 体育人口 比例%
花都 618654 番禺 962395 增城 834156 白云 858526 天河 598353 黄埔 209535
编 码
居委名
1
鳌洲
3
兆龙里
1
海印
4
远安
1
张家里
5
法政
1
德坭新村社区
6
嘉和苑社区
1
暨南大学
7
华南师大
1
加拿大花园
8
天安
1
竹丝岗一路
9
东园新村
2
大马路
0
麓湖路
2
笔岗
1
仓联
2
四航局
2
黄埔电厂
2
团星村
3
城内居委
2
桃园居委
4
中田村
编 码
总编码
25
7.13.25
26
7.13.26
27
7.14.27
28
7.14.28
(3)定距变量(间距变量)Interval Measurement 是指能确定取值得距离,即变项之值的距离可知。具有
+或-的数学性质,包含了前两种测量的性质。 例如:甲、乙、丙三人的工资为380、950、2000。 思考:定类和定距变量的差别和转换。
(4)定比变量(比率变量)Ratio Measurement 是指变量的取值之间有某种成比例的关系。据有×或÷
29
8.15.29
30
8.15.30
31
9.16.31
32
9.16.32
33
9.17.33
34
9.17.34
35
9.18.35
36
9.18.36
37
10.19.37
38
10.19.38
39
10.20.39
40
10.20.40
41
11.21.41
42
11.21.42
43
11.22.43
44
11.22.44
的数学性质,是最高测量层次的变量。
例如:甲、乙工资分别为600、900,则乙是甲的2倍。 思考:定距与定比变量的区别
变量分类的实际意义
测度等级关系到数据分析时采取何种方法。
关系到信息使用的效率。
二、统计表
• 构成:统计表一般由标题、表号、 标目、表注等构成。
• 编制基本原则:结构简明,一目 了然。
三. 统计图 统计图由标题、图号标目、图注等项构成。
1. 直条图
人数
图2.1 某年级操行评语评定结果
60 50 40 30 20 10
0
甲
乙
丙
丁
等级
2. 圆形图
图 2.2 某年级操行评语评定结果
丁甲 9% 13%
丙
35%
乙
43%
频数
3. 线条图
图 2.310题正误题做对不同题 数概率分布
300 200 100
100
86
50
1 11 44
0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1
得分率
累积频数
图2.6:高一语文
140
120
1112979
100
举例:体育态度Y与哪些因素有关 X1: 年龄 X2:文化程度 X3:性别
6. 变量的测度等级(变量分类)
在实际研究中,不同概念的变量能够被测量,即,量化的程度 不同,所以,变量的类型有一定的层次:
(1)定类变量(名义变量)Nominal Measurement
是指变量的值只能把研究对象进行分类,数学性
统计表基本格式
表的标题 ? ? ?
横标目的总标目 (亦可空白)
横标目
注脚:说明资料来源等 X X X
(顶线)
纵标目 (一般设谓语)
数字
(底线)
表1-2 研究样本分布
区名
编 码
海
珠
7
越
秀
8
天
河
9
东
山
10
黄
埔
11
从
化
12
镇(街)名 南华西街
滨江街 洪桥街 东风街 石牌街 棠下街 农林街 建设街 荔联街 南岗街 街口镇 桃园镇
测量的三要素:
– 第一,事物的属性; – 第二,数字; – 第三,规则。
5.变量的概念
科学研究中,用变量来描述概念。
变量,也称变项,变数,是说明总体各个案 所具有的某正特征或者属性的名称,且被说明 的特征或属性对于总体各个案来说是具有变ຫໍສະໝຸດ Baidu 性的。
例如:在一个地区体育人口当中,每个人的性别、 年龄等都是变量。
统计学基础
一、统计与测量概述
1. 什么是统计学
统计学是研究统计原理和方法的 科学。具体地说,它是如何搜集、整理、 分析反映事物总体信息的数字资料,并 以此为依据,对总体特征进行推断的原 理和方法。
2.统计学分类
(1) 数理统计:以概率论为基础,对统 计数据数量关系的模式加以解释, 对统计原理和方法给予数学的证明。