高三一轮复习—统计与概率ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.用样本的数字特征估计总体的数字特征 (1)众数、中位数 在一组数据中出现次数最多的数据叫做众数; 将一组数据按照从大到小(或从小到大)排列, 处在中间位置上的一个数据(或中间两位数据的 平均数)叫做这组数据的中位数;
(2)平均数与方差 x x1 x2 x3 L xn n
S 2 = ( x1 x)2 ( x2 x)2 ( x3 x)2 L ( xn x)2 n
y bx a,定过(x, y);
回归分析: x增加一个单位,y增加b个单位; x m时,y大约为bm a
相关性检验:|r|≤1,|r|→1,线性相关1越8 强
古典概型 几何概型
19
一、知识回顾
古典概型
1、古典概型的两个特征:(1)有限性(2)等可能性
2、古典概型的概率公式:
统计
1
统计的基本知识框架
1.收集数据——抽样方法
2.分析数据——统计表、数据的数
字特征及用样本估计总体
2
山东高考概率统计考查统计
年份 题号
考查内容
2007 8,12 频率分布直方图,古典概型 2008 9,18 数字特征,古典概型
2009 11,19 几何概型,分层抽样,古典概型
2010 6,19 数字特征,古典概型
(4)回归直线方程: y bx a ,
n
xi yi nx y
b i1
其中
nห้องสมุดไป่ตู้
xi2
2
nx
i 1
a y bx
,
x
1 n
n i 1
xi
。相应
的直线叫回归直线,对两个变量所进行的
上述统计叫做回归分析。
13
三、线性相关性与最小二乘法
求线性回归直线方程的步骤:
(1)画散点图观察相关性 (2)列出表格,求出某些数据
3.当k 3.841时,认为事件A与B是无关的。
17
抽样:简单随机抽样,系统抽样,分层抽样 P n N
统计图:频率分布直方图,折线图,茎叶图
数字特征:平均数、众数、中位数、
统
方差、标准差、极差
K 2 3.841,95%把握相关;
计 独立性检验: K 2 6.635,99%把握相关
2×2列联表
统计中有一个有用的(读做“卡方”)统计
量,它的表达式是:
2
K2
n(ad bc)
(a b)(c d )(a c)(b d )
经过对统计量分布的研究,
已经得到了两个临界值:3.841与6.635。
当根据具体的数据算出的k
1.当k>6.635时,有99%的把握说事件A与B有关;
2.当k>3.841时,有95%的把握说事件A与B有关;
分层抽样
将总体分成几层 ,分层进行抽取
4
一、抽样方法
三种抽样方法的比较
类别
相互联系
适用范围
简单随 机抽样
总体中的个数 较少
在起始部分抽 系统抽样 样时采用简单
随机抽样
总体中的个数 较多
各层抽样时采 总体由差异明
分层抽样 用简单随机抽 显的几部分组
样或系统抽样 成
5
二、数据的数字特征及用样本估计总体
频率分布直方图:具体做法如下: (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数;(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图
频率分布直方图中小长方形的面积
频率
=组距× 组距 =频率
8
二、样本估计总体
1.频率分布直方图、频率分布折线图、总体密度曲线
例2
(1)频率=纵坐标×组距= n
2011 8,13, 回归直线,分层抽样,古典概型
18 2012 4,14, 数字特征,频率分布直方图,古典概型
18 2013 10,18 茎叶图、方差,古典概型
3
一、抽样方法
三种抽样方法的比较
类别
共同点
各自特点
简单随 机抽样
从总体中逐个抽 取
系统抽样
抽样过程中 每个个体被 抽取的概率 相等
将总体均分成几 部分,按事先确 定的规则分别在 各部分中抽取
N
(2)频率之和为1
9
二、样本估计总体
2.茎叶图 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩 余分数的平均分为91,现场做的9个分数的茎叶图后来有一 个数据模糊,无法辨认,在图中以 表示:
则7个剩余分数的方差为_______
10
变量的相关性 与统计案例
11
三、线性相关性与最小二乘法
(3)代入公式求得a,b,进而得到直线方程。
14
三、两个变量的线性相关
1.正相关、负相关、回归直线
2.线性相关关系: yˆ bˆx aˆ
(i)过(x,y)
(ii)X每增加一个单位,y平均(约)增加(减少)b$ 个单位 (iii)当x=x0时,y约为bˆx0 aˆ
3.相关系数r (i)衡量两个变量间的线性相关关系
的平均值为x' (ax1 b) (ax2 b) L (axn b) a x b n
方差为S '2 = (ax1 b x' )2 (ax2 b x' )2 L (axn b x' )2 n
=a2 S 2
7
二、数据的数字特征及用样本估计总体
2.频率分布直方图、折线图与茎叶图 样本中所有数据(或数据组)的频率和样本容量 的比,就是该数据的频率。所有数据(或数据组) 的频率的分布变化规律叫做频率分布,可以用频 率分布直方图、折线图、茎叶图来表示。
6
二、数据的数字特征及用样本估计总体
常用结论:有一组数据xn : x1, x2, x3,L xn
的平均值为x x1 x2 x3 L xn n
方差为S 2 = ( x1 x)2 ( x2 x)2 ( x3 x)2 L ( xn x)2 n
构造新数据axn b: ax1 b,ax2 b,ax3 b,L axn b
线性回归:
(1)相关关系:自变量取值一定时,因变 量的取值带有一定随机性的两个变量之间 的关系。 注:与函数关系不同,相关关系是一种非 确定性关系。
(2)回归分析:对具有相关关系的两个变量进 行统计分析的方法。
12
三、线性相关性与最小二乘法
(3)散点图:表示具有相关关系的两个变
量的一组数据的图形。
(ii)r>0时,正相关,r<0时,负相关
(iii) |r|接近于1,线性相关性强,接近于0,线性相关性弱 15
四、独立性检验
1. 2×2列联表
2. 无关概率对照表
P K 2 k 0.050
k
3.841
两变量无关
0.010 0.001 6.635 10.828
16
四、统计案例—独立性检验——卡方检验( 2 2列联表 )
(2)平均数与方差 x x1 x2 x3 L xn n
S 2 = ( x1 x)2 ( x2 x)2 ( x3 x)2 L ( xn x)2 n
y bx a,定过(x, y);
回归分析: x增加一个单位,y增加b个单位; x m时,y大约为bm a
相关性检验:|r|≤1,|r|→1,线性相关1越8 强
古典概型 几何概型
19
一、知识回顾
古典概型
1、古典概型的两个特征:(1)有限性(2)等可能性
2、古典概型的概率公式:
统计
1
统计的基本知识框架
1.收集数据——抽样方法
2.分析数据——统计表、数据的数
字特征及用样本估计总体
2
山东高考概率统计考查统计
年份 题号
考查内容
2007 8,12 频率分布直方图,古典概型 2008 9,18 数字特征,古典概型
2009 11,19 几何概型,分层抽样,古典概型
2010 6,19 数字特征,古典概型
(4)回归直线方程: y bx a ,
n
xi yi nx y
b i1
其中
nห้องสมุดไป่ตู้
xi2
2
nx
i 1
a y bx
,
x
1 n
n i 1
xi
。相应
的直线叫回归直线,对两个变量所进行的
上述统计叫做回归分析。
13
三、线性相关性与最小二乘法
求线性回归直线方程的步骤:
(1)画散点图观察相关性 (2)列出表格,求出某些数据
3.当k 3.841时,认为事件A与B是无关的。
17
抽样:简单随机抽样,系统抽样,分层抽样 P n N
统计图:频率分布直方图,折线图,茎叶图
数字特征:平均数、众数、中位数、
统
方差、标准差、极差
K 2 3.841,95%把握相关;
计 独立性检验: K 2 6.635,99%把握相关
2×2列联表
统计中有一个有用的(读做“卡方”)统计
量,它的表达式是:
2
K2
n(ad bc)
(a b)(c d )(a c)(b d )
经过对统计量分布的研究,
已经得到了两个临界值:3.841与6.635。
当根据具体的数据算出的k
1.当k>6.635时,有99%的把握说事件A与B有关;
2.当k>3.841时,有95%的把握说事件A与B有关;
分层抽样
将总体分成几层 ,分层进行抽取
4
一、抽样方法
三种抽样方法的比较
类别
相互联系
适用范围
简单随 机抽样
总体中的个数 较少
在起始部分抽 系统抽样 样时采用简单
随机抽样
总体中的个数 较多
各层抽样时采 总体由差异明
分层抽样 用简单随机抽 显的几部分组
样或系统抽样 成
5
二、数据的数字特征及用样本估计总体
频率分布直方图:具体做法如下: (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数;(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图
频率分布直方图中小长方形的面积
频率
=组距× 组距 =频率
8
二、样本估计总体
1.频率分布直方图、频率分布折线图、总体密度曲线
例2
(1)频率=纵坐标×组距= n
2011 8,13, 回归直线,分层抽样,古典概型
18 2012 4,14, 数字特征,频率分布直方图,古典概型
18 2013 10,18 茎叶图、方差,古典概型
3
一、抽样方法
三种抽样方法的比较
类别
共同点
各自特点
简单随 机抽样
从总体中逐个抽 取
系统抽样
抽样过程中 每个个体被 抽取的概率 相等
将总体均分成几 部分,按事先确 定的规则分别在 各部分中抽取
N
(2)频率之和为1
9
二、样本估计总体
2.茎叶图 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩 余分数的平均分为91,现场做的9个分数的茎叶图后来有一 个数据模糊,无法辨认,在图中以 表示:
则7个剩余分数的方差为_______
10
变量的相关性 与统计案例
11
三、线性相关性与最小二乘法
(3)代入公式求得a,b,进而得到直线方程。
14
三、两个变量的线性相关
1.正相关、负相关、回归直线
2.线性相关关系: yˆ bˆx aˆ
(i)过(x,y)
(ii)X每增加一个单位,y平均(约)增加(减少)b$ 个单位 (iii)当x=x0时,y约为bˆx0 aˆ
3.相关系数r (i)衡量两个变量间的线性相关关系
的平均值为x' (ax1 b) (ax2 b) L (axn b) a x b n
方差为S '2 = (ax1 b x' )2 (ax2 b x' )2 L (axn b x' )2 n
=a2 S 2
7
二、数据的数字特征及用样本估计总体
2.频率分布直方图、折线图与茎叶图 样本中所有数据(或数据组)的频率和样本容量 的比,就是该数据的频率。所有数据(或数据组) 的频率的分布变化规律叫做频率分布,可以用频 率分布直方图、折线图、茎叶图来表示。
6
二、数据的数字特征及用样本估计总体
常用结论:有一组数据xn : x1, x2, x3,L xn
的平均值为x x1 x2 x3 L xn n
方差为S 2 = ( x1 x)2 ( x2 x)2 ( x3 x)2 L ( xn x)2 n
构造新数据axn b: ax1 b,ax2 b,ax3 b,L axn b
线性回归:
(1)相关关系:自变量取值一定时,因变 量的取值带有一定随机性的两个变量之间 的关系。 注:与函数关系不同,相关关系是一种非 确定性关系。
(2)回归分析:对具有相关关系的两个变量进 行统计分析的方法。
12
三、线性相关性与最小二乘法
(3)散点图:表示具有相关关系的两个变
量的一组数据的图形。
(ii)r>0时,正相关,r<0时,负相关
(iii) |r|接近于1,线性相关性强,接近于0,线性相关性弱 15
四、独立性检验
1. 2×2列联表
2. 无关概率对照表
P K 2 k 0.050
k
3.841
两变量无关
0.010 0.001 6.635 10.828
16
四、统计案例—独立性检验——卡方检验( 2 2列联表 )