统计学基础培训
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 算术均数(arithmetic mean),简称均值(mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 众数(mode) 5. 调和均数(harmonic mean) 6. 截尾平均值(5% trimmed mean)
1. 均值(mean)
X X1 X 2 X n X
1. 均值(mean)
胖子和浩子都会修板子,下面是两人去年每月的修板数量 胖子: 77,78,82,81,81,80,81,79,79,81,83,79 浩子 86,87,65,90,85,96,47,86,86,92,55,85 请问可以用平均数来推测下一个月两人的休班量吗?
2. 中位数(median)
2. 中位数(median)
胖子和浩子都会修板子,下面是两人去年每月的修板数量 胖子: 77,78,82,81,81,80,81,79,79,81,83,79 浩子 86,87,65,90,85,96,47,86,86,92,55,85 请问可以用平均数来推测下一个月两人的休班量吗?
3. 众数(mode)
总体:根据研究目的确定的同质研究对象 的全体(集合)。如成年人的身高。 分有限总体与无限总体
样本:从总体中随机抽取的部分观察单位。如
某单位男士的身高
总1. C体VT与E 样& T本V事业部
2. TV事业部 & 技术支持部 3. 技术支持部 & BT1战队 4. 平台支持部 & 订单软件管理组
名从总词体解中释得到样本的方法:抽样。
中位数是将一批数据从小至大排列后位次居中的
数据值,符号为Md,反映一批观察值在位次上的平
均水平。
适用条件:适合各种类型的资料。尤其适合于
① 大样本偏态分布的资料;
② 参数有不确定数值;
③ 参数分布不明等。
2. 中位数(median)
先将观察值按从小到大顺序排列,再按以下 公式计算:
Md
x(n1) / 2 xn/ 2
(抽样方法与样本量)
从样本推论总体的方法:统计推断 (区间估计,假设检验等)
请问: 计算CVTE的男生的平均身高 推算CVTE的女生的平均体重 推算从14楼到食堂的平均时间
名词解释
变量与随机变量
Variable and random variable
变量——可以测量的任何特征或属性 Any characteristic or attribute that can be measured。 例如:热量值、蛋白质含量、碳水化合物含量。 随机变量——在概率论中称变量为随机变量
1.极差(Range)(全距)
出现次数(或频数)最多的观察值;在 频数分布图中对应于高峰所在位置的观察 值。
适用于大样本;较粗糙。
3. 众数(mode)
小A和小B是好战友,周日相约去靶场打靶 小A前10枪的成绩是: 10,10,10,0,10,10,0,10,10,10 小B前10枪的成绩是 8,7,7,9,8,9,7,8,8,9 请问第11枪小A小B的成绩会是多少?
统计学基础
基础统计的必要性
在测定阶段中收集材料以分析的方法使用。 把工程的Xs与 Ys特性化资料用数值显示。 用以前的工程和执行DATA推定未来时使用。 高级统计性问题解决方法的基础而使用。 基本统计概念不是根据直观而是创出根据事实的语言。
名1. 总词体解与释样本 Population and sample
3. 众数(mode)
胖子和浩子都会修板子,下面是两人去年每月的修板数量 胖子: 77,78,82,81,81,80,81,79,79,81,83,79 浩子 86,87,65,90,85,96,47,86,86,92,55,85 请问可以用平均数来推测下一个月两人的休班量吗?
均值、中位数、众数三者关系
有序变量(ordinal variable): 等级资料(优、良、中、差)
变量
胖子的体重 PQ组的出差天数 苹果5S手机的待机时间 刘畅每月发放订单软件软件个数 丽仪跑100米的时间 3553软件的编译时间 订单软件的重测次数 订单软件的重测率
名词解释
平均指标
总称为平均数(average)反映了资料的集中趋势(central tendency)
x1n / 2
பைடு நூலகம்
2
n为奇数 n为偶数
特点:仅仅利用了中间的1~2个数据
2. 中位数(median)
小A和小B是好战友,周日相约去靶场打靶 小A前10枪的成绩是: 10,10,10,0,10,10,0,10,10,10 小B前10枪的成绩是 8,7,7,9,8,9,7,8,8,9 请问第11枪小A小B的成绩会是多少?
n
n
X f1X1 f2 X 2 f3 X 3 fk X k fi X i
f1 f2 f3 fk
fi
适用条件:变量呈正态或近似正态分布的情况
1. 均值(mean)
小A和小B是好战友,周日相约去靶场打靶 小A前10枪的成绩是: 10,10,10,0,10,10,0,10,10,10 小B前10枪的成绩是 8,7,7,9,8,9,7,8,8,9 请问第11枪小A小B的成绩会是多少?
正态分布时: 均值=中位数=众数 正偏态分布时:均值>中位数>众数 负偏态分布时:均值<中位数<众数
名波动词(解v释ariation)指标
反映数据的离散度(Dispersion )。即个体观察值的波动程度。 常用的指标有:
1. 极差(Range) (全距) 2. 百分位数与四分位数间距
Percentile and Quartile range 3. 方差 Variance 4. 标准差 Standard Deviation 5. 变异系数 Coefficient of Variation
变变量量(随机变量)的分类
离散型变量(discrete variable):计数资料(15,17,24,…) 可能取到的值是有限个的随机变量 记数变量,只能通过记数的方法来获取,只能以整数为单位
连续性变量(continuous variable): 计量资料(1.65, 1.73, 1.77,…) 可能取到的值是无限个的随机变量 计量变量,能用量测手段直接测定
1. 均值(mean)
X X1 X 2 X n X
1. 均值(mean)
胖子和浩子都会修板子,下面是两人去年每月的修板数量 胖子: 77,78,82,81,81,80,81,79,79,81,83,79 浩子 86,87,65,90,85,96,47,86,86,92,55,85 请问可以用平均数来推测下一个月两人的休班量吗?
2. 中位数(median)
2. 中位数(median)
胖子和浩子都会修板子,下面是两人去年每月的修板数量 胖子: 77,78,82,81,81,80,81,79,79,81,83,79 浩子 86,87,65,90,85,96,47,86,86,92,55,85 请问可以用平均数来推测下一个月两人的休班量吗?
3. 众数(mode)
总体:根据研究目的确定的同质研究对象 的全体(集合)。如成年人的身高。 分有限总体与无限总体
样本:从总体中随机抽取的部分观察单位。如
某单位男士的身高
总1. C体VT与E 样& T本V事业部
2. TV事业部 & 技术支持部 3. 技术支持部 & BT1战队 4. 平台支持部 & 订单软件管理组
名从总词体解中释得到样本的方法:抽样。
中位数是将一批数据从小至大排列后位次居中的
数据值,符号为Md,反映一批观察值在位次上的平
均水平。
适用条件:适合各种类型的资料。尤其适合于
① 大样本偏态分布的资料;
② 参数有不确定数值;
③ 参数分布不明等。
2. 中位数(median)
先将观察值按从小到大顺序排列,再按以下 公式计算:
Md
x(n1) / 2 xn/ 2
(抽样方法与样本量)
从样本推论总体的方法:统计推断 (区间估计,假设检验等)
请问: 计算CVTE的男生的平均身高 推算CVTE的女生的平均体重 推算从14楼到食堂的平均时间
名词解释
变量与随机变量
Variable and random variable
变量——可以测量的任何特征或属性 Any characteristic or attribute that can be measured。 例如:热量值、蛋白质含量、碳水化合物含量。 随机变量——在概率论中称变量为随机变量
1.极差(Range)(全距)
出现次数(或频数)最多的观察值;在 频数分布图中对应于高峰所在位置的观察 值。
适用于大样本;较粗糙。
3. 众数(mode)
小A和小B是好战友,周日相约去靶场打靶 小A前10枪的成绩是: 10,10,10,0,10,10,0,10,10,10 小B前10枪的成绩是 8,7,7,9,8,9,7,8,8,9 请问第11枪小A小B的成绩会是多少?
统计学基础
基础统计的必要性
在测定阶段中收集材料以分析的方法使用。 把工程的Xs与 Ys特性化资料用数值显示。 用以前的工程和执行DATA推定未来时使用。 高级统计性问题解决方法的基础而使用。 基本统计概念不是根据直观而是创出根据事实的语言。
名1. 总词体解与释样本 Population and sample
3. 众数(mode)
胖子和浩子都会修板子,下面是两人去年每月的修板数量 胖子: 77,78,82,81,81,80,81,79,79,81,83,79 浩子 86,87,65,90,85,96,47,86,86,92,55,85 请问可以用平均数来推测下一个月两人的休班量吗?
均值、中位数、众数三者关系
有序变量(ordinal variable): 等级资料(优、良、中、差)
变量
胖子的体重 PQ组的出差天数 苹果5S手机的待机时间 刘畅每月发放订单软件软件个数 丽仪跑100米的时间 3553软件的编译时间 订单软件的重测次数 订单软件的重测率
名词解释
平均指标
总称为平均数(average)反映了资料的集中趋势(central tendency)
x1n / 2
பைடு நூலகம்
2
n为奇数 n为偶数
特点:仅仅利用了中间的1~2个数据
2. 中位数(median)
小A和小B是好战友,周日相约去靶场打靶 小A前10枪的成绩是: 10,10,10,0,10,10,0,10,10,10 小B前10枪的成绩是 8,7,7,9,8,9,7,8,8,9 请问第11枪小A小B的成绩会是多少?
n
n
X f1X1 f2 X 2 f3 X 3 fk X k fi X i
f1 f2 f3 fk
fi
适用条件:变量呈正态或近似正态分布的情况
1. 均值(mean)
小A和小B是好战友,周日相约去靶场打靶 小A前10枪的成绩是: 10,10,10,0,10,10,0,10,10,10 小B前10枪的成绩是 8,7,7,9,8,9,7,8,8,9 请问第11枪小A小B的成绩会是多少?
正态分布时: 均值=中位数=众数 正偏态分布时:均值>中位数>众数 负偏态分布时:均值<中位数<众数
名波动词(解v释ariation)指标
反映数据的离散度(Dispersion )。即个体观察值的波动程度。 常用的指标有:
1. 极差(Range) (全距) 2. 百分位数与四分位数间距
Percentile and Quartile range 3. 方差 Variance 4. 标准差 Standard Deviation 5. 变异系数 Coefficient of Variation
变变量量(随机变量)的分类
离散型变量(discrete variable):计数资料(15,17,24,…) 可能取到的值是有限个的随机变量 记数变量,只能通过记数的方法来获取,只能以整数为单位
连续性变量(continuous variable): 计量资料(1.65, 1.73, 1.77,…) 可能取到的值是无限个的随机变量 计量变量,能用量测手段直接测定