高三一轮复习统计与概率
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
构造新数据?a?xn ??b : ax1 b, ax2 ? b, ax3 ? b,L axn ? b
的平均值为x' ? (ax1 ? b) ? (ax2 ? b) ? L ? (axn ? b) ? a x ? b n
方差为S '2 = (ax1 ? b ? x' )2 ? (ax2 ? b ? x' )2 ? L ? (axn ? b ? x' )2 n
分层抽样
将总体分成几层
,分层进行抽取
BG
4
一、抽样方法
三种抽样方法的比较
类别
相互联系
适用范围
简单随 机抽样
总体中的个数 较少
系统抽样
在起始部分抽 样时采用简单 随机抽样
总体中的个数 较多
各层抽样时采 总体由差异明
分层抽样 用简单随机抽 显的几部分组
样或系统BG抽样 成
5
二、数据的数字特征及用样本估计总体
1.用样本的数字特征估计总体的数字特征 (1)众数、中位数 在一组数据中出现次数最多的数据叫做众数;
将一组数据按照从大到小(或从小到大)排列, 处在中间位置上的一个数据(或中间两位数据的平
均数)叫做这组数据的中位数;
(2)平均数与方差 x ? x1 ? x2 ? x3 ? L ? xn n
S 2 = ( x1 ? x)2 ? ( xx2 ? )2 ??( xx3 n
(ii)X 每增加一个单位, y平均(约)增加(减少)b$个单位 (iii) 当x=x 0时,y约为b?x0 ? a?
3.相关系数 r
(i) 衡量两个变量间的线性相关关系
(ii)r>0 时,正相关, r<0时,负相关
(iii) |r| 接近于1,线性相关性强,接近于 0,线性相关性弱
BG
15
四、独立性检验
BG
12
三、线性相关性与最小二乘法
(3)散点图: 表示具有相关关系的两个变
量的一组数据的图形。
(4)回归直线方程: y? ? bx ? a ,
? ?
?
n
xi yi ? n x y
?b ? i?1
?
其中 ?
? ?
?n
xi2
?
2
nx
i?1
a ? y? bx
? ,
x?
1n n i?1 xi
。相应
的直线叫回归直线,对两个变量所进行的
BG
)2 ? L ? ( xxn ? )2
6
二、数据的数字特征及用样本估计总体
常用结论:有一组数据?xn ?: x1, x2 , x3,L xn
的平均值为x ? x1 ? x2 ? x3 ? L ? xn n
方差为S 2 = ( x1 ? x)2 ? ( x2 ? x)2 ? ( x3 ? x)2 ? L ? ( xn ? x)2 n
则7个剩余分数的方差为 _______
BG
10
变量的相关性 与统计案例
BG
11
三、线性相关性与最小二乘法
线性回归:
(1)相关关系:自变量取值一定时,因变 量的取值带有一定随机性的两个变量之间 的关系。 注:与函数关系不同,相关关系是一种非 确定性关系。
(2)回归分析:对具有相关关系的两个变量进
行统计分析的方法。
=aS2 2
BG
7
二、数据的数字特征及用样本估计总体
2.频率分布直方图、折线图与茎叶图 样本中所有数据(或数据组)的频率和样本容量的 比,就是该数据的频率。所有数据(或数据组)的 频率的分布变化规律叫做频率分布,可以用频率分 布直方图、折线图、茎叶图来表示。
频率分布直方图:具体做法如下: (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数;( 3)将数据分组; (4)列频率分布表; (5)画频率分布直方图
上述统计叫做回归分析。
BG
13
三、线性相关性与最小二乘法
求线性回归直线方程的步骤:
(1)画散点图观察相关性 (2)列出表格,求出某些数据
(3)代入公式求得a,b,进而得到直线方程。
BG
14
三、两个变量的线性相关
1.正相关、负相关、回归直线
2.线性相关关系: y? ? b?x ? a?
(i) 过(x,y)
统计图:频率分布直方图,折线图,茎叶图
数字特征:平均数、众数、中位数、
方差、标准差、极差
统
K 2 ? 3.841,9 5%把握相关;
计 独立性检验: K 2 ? 6.635,9 9%把握相关
经过对统计量分布的研究,
已经得到了两个临界值:3.841与6.635。
当根据具体的数据算出的k
1.当k>6.635时,有99%的把握说事件A与B有关;
2.当k>3.841时,有95%的把握说事件A与B有关;
3.当k ? 3.841时,认为事件BGA与B是无关的。
17
抽样:简单随机抽样,系统抽样,分层抽样 P ? n N
BG
1
统计的基本知识框架
1.收集数据——抽样方法
2.分析数据——统计表、数据的数
字特征及用样本估计总体
BG
2
山东高考概率统计考查统计
年份 题号
考查内容
2007 2008 2009 2010 2011
8,12 9,18 11,19 6,19 8,13,
频率分布直方图, 古典概型 数字特征, 古典概型 几何概型, 分层抽样,古典概型 数字特征, 古典概型 回归直线,分层抽样, 古典概型
18 2012 4,14, 数字特征,频率分布直方图, 古典概型
18 2013 10,18 茎叶图、方差 ,古典概型
BG
3
一、抽样方法
三种抽样方法的比较
类别
共同点
各自特点
简单随 机抽样
从总体中逐个抽 取
系统抽样
抽样过程中 每个个体被 抽取的概率 相等
将总体均分成几 部分,按事先确 定的规则分别在 各部分中抽取
频率分布直方图中小长方形的面积
频率
=组距×
=频率
组距
BG
8
二、样本估计总体
1.频率分布直方图、频率分布折线图、总体密度曲线
例2
(1)频率=纵坐标×组距 = n
N
(2)频率之和为 1 BG
9
二、样本估计总体
2.茎叶图 将某选手的 9个得分去掉 1个最高分,去掉1个最低分,7个剩 余分数的平均分为 91,现场做的9个分数的茎叶图后来有一 个数据模糊 ,无法辨认,在图中以 表示:
1. 2×2列联表
2. 无关概率对照表
? ? P K 2 ? k 0.050
k
3.841
两变量无关
0.010 0.001 6.635 10.828
BG
16
四、统计案例—独立性检验——卡方检验( 2 ? 2列联表)
统计中有一个有用的(读做“卡方”)统计
量,它的表达式是:
K2 ?
n(ad
?来自百度文库
2
bc)
(a ? b)(c ? d )(a ? c)(b ? d )
的平均值为x' ? (ax1 ? b) ? (ax2 ? b) ? L ? (axn ? b) ? a x ? b n
方差为S '2 = (ax1 ? b ? x' )2 ? (ax2 ? b ? x' )2 ? L ? (axn ? b ? x' )2 n
分层抽样
将总体分成几层
,分层进行抽取
BG
4
一、抽样方法
三种抽样方法的比较
类别
相互联系
适用范围
简单随 机抽样
总体中的个数 较少
系统抽样
在起始部分抽 样时采用简单 随机抽样
总体中的个数 较多
各层抽样时采 总体由差异明
分层抽样 用简单随机抽 显的几部分组
样或系统BG抽样 成
5
二、数据的数字特征及用样本估计总体
1.用样本的数字特征估计总体的数字特征 (1)众数、中位数 在一组数据中出现次数最多的数据叫做众数;
将一组数据按照从大到小(或从小到大)排列, 处在中间位置上的一个数据(或中间两位数据的平
均数)叫做这组数据的中位数;
(2)平均数与方差 x ? x1 ? x2 ? x3 ? L ? xn n
S 2 = ( x1 ? x)2 ? ( xx2 ? )2 ??( xx3 n
(ii)X 每增加一个单位, y平均(约)增加(减少)b$个单位 (iii) 当x=x 0时,y约为b?x0 ? a?
3.相关系数 r
(i) 衡量两个变量间的线性相关关系
(ii)r>0 时,正相关, r<0时,负相关
(iii) |r| 接近于1,线性相关性强,接近于 0,线性相关性弱
BG
15
四、独立性检验
BG
12
三、线性相关性与最小二乘法
(3)散点图: 表示具有相关关系的两个变
量的一组数据的图形。
(4)回归直线方程: y? ? bx ? a ,
? ?
?
n
xi yi ? n x y
?b ? i?1
?
其中 ?
? ?
?n
xi2
?
2
nx
i?1
a ? y? bx
? ,
x?
1n n i?1 xi
。相应
的直线叫回归直线,对两个变量所进行的
BG
)2 ? L ? ( xxn ? )2
6
二、数据的数字特征及用样本估计总体
常用结论:有一组数据?xn ?: x1, x2 , x3,L xn
的平均值为x ? x1 ? x2 ? x3 ? L ? xn n
方差为S 2 = ( x1 ? x)2 ? ( x2 ? x)2 ? ( x3 ? x)2 ? L ? ( xn ? x)2 n
则7个剩余分数的方差为 _______
BG
10
变量的相关性 与统计案例
BG
11
三、线性相关性与最小二乘法
线性回归:
(1)相关关系:自变量取值一定时,因变 量的取值带有一定随机性的两个变量之间 的关系。 注:与函数关系不同,相关关系是一种非 确定性关系。
(2)回归分析:对具有相关关系的两个变量进
行统计分析的方法。
=aS2 2
BG
7
二、数据的数字特征及用样本估计总体
2.频率分布直方图、折线图与茎叶图 样本中所有数据(或数据组)的频率和样本容量的 比,就是该数据的频率。所有数据(或数据组)的 频率的分布变化规律叫做频率分布,可以用频率分 布直方图、折线图、茎叶图来表示。
频率分布直方图:具体做法如下: (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数;( 3)将数据分组; (4)列频率分布表; (5)画频率分布直方图
上述统计叫做回归分析。
BG
13
三、线性相关性与最小二乘法
求线性回归直线方程的步骤:
(1)画散点图观察相关性 (2)列出表格,求出某些数据
(3)代入公式求得a,b,进而得到直线方程。
BG
14
三、两个变量的线性相关
1.正相关、负相关、回归直线
2.线性相关关系: y? ? b?x ? a?
(i) 过(x,y)
统计图:频率分布直方图,折线图,茎叶图
数字特征:平均数、众数、中位数、
方差、标准差、极差
统
K 2 ? 3.841,9 5%把握相关;
计 独立性检验: K 2 ? 6.635,9 9%把握相关
经过对统计量分布的研究,
已经得到了两个临界值:3.841与6.635。
当根据具体的数据算出的k
1.当k>6.635时,有99%的把握说事件A与B有关;
2.当k>3.841时,有95%的把握说事件A与B有关;
3.当k ? 3.841时,认为事件BGA与B是无关的。
17
抽样:简单随机抽样,系统抽样,分层抽样 P ? n N
BG
1
统计的基本知识框架
1.收集数据——抽样方法
2.分析数据——统计表、数据的数
字特征及用样本估计总体
BG
2
山东高考概率统计考查统计
年份 题号
考查内容
2007 2008 2009 2010 2011
8,12 9,18 11,19 6,19 8,13,
频率分布直方图, 古典概型 数字特征, 古典概型 几何概型, 分层抽样,古典概型 数字特征, 古典概型 回归直线,分层抽样, 古典概型
18 2012 4,14, 数字特征,频率分布直方图, 古典概型
18 2013 10,18 茎叶图、方差 ,古典概型
BG
3
一、抽样方法
三种抽样方法的比较
类别
共同点
各自特点
简单随 机抽样
从总体中逐个抽 取
系统抽样
抽样过程中 每个个体被 抽取的概率 相等
将总体均分成几 部分,按事先确 定的规则分别在 各部分中抽取
频率分布直方图中小长方形的面积
频率
=组距×
=频率
组距
BG
8
二、样本估计总体
1.频率分布直方图、频率分布折线图、总体密度曲线
例2
(1)频率=纵坐标×组距 = n
N
(2)频率之和为 1 BG
9
二、样本估计总体
2.茎叶图 将某选手的 9个得分去掉 1个最高分,去掉1个最低分,7个剩 余分数的平均分为 91,现场做的9个分数的茎叶图后来有一 个数据模糊 ,无法辨认,在图中以 表示:
1. 2×2列联表
2. 无关概率对照表
? ? P K 2 ? k 0.050
k
3.841
两变量无关
0.010 0.001 6.635 10.828
BG
16
四、统计案例—独立性检验——卡方检验( 2 ? 2列联表)
统计中有一个有用的(读做“卡方”)统计
量,它的表达式是:
K2 ?
n(ad
?来自百度文库
2
bc)
(a ? b)(c ? d )(a ? c)(b ? d )