高三一轮复习—统计与概率学习资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011 8,13, 回归直线,分层抽样,古典概型
18
2012 4,14, 数字特征,频率分布直方图,古典概型 18
2013 10,18 茎叶图、方差,古典概型
一、抽样方法
三种抽样方法的比较
类别
共同点
各自特点
简单随 机抽样
从总体中逐个抽 取
系统抽样
抽样过程中 每个个体被 抽取的概率 相等
将总体均分成几 部分,按事先确 定的规则分别在 各部分中抽取
(iii) |r|接近于1,线性相关性强,接近于0,线性相关性弱
四、独立性检验
1. 2×2列联表
2. 无关概率对照表
PK2k 0.050
k
3.841
两变量无关
0.010 0.001 6.635 10.828
四、统计案例—独立性检验——卡方检验( 22列联表)
统计中有一个有用的(读做“卡方”)统计
(1)相关关系:自变量取值一定时,因变 量的取值带有一定随机性的两个变量之间 的关系。 注:与函数关系不同,相关关系是一种非 确定性关系。
(2)回归分析:对具有相关关系的两个变量进 行统计分析的方法。
三、线性相关性与最小二乘法
(3)散点图:表示具有相关关系的两个变
量的一组数据的图形。
(4)回归直线方程: y b xa,
抽样:简单随机抽样,系统抽样,分层抽样 P n N
统计图:频率分布直方图,折线图,茎叶图
数字特征:平均数、众数、中位数、

方差、标准差、极差
K2 3.841,95%把握相关;
计 独立性检验: K2 6.635,99%把握相关
2×2列联表
y bxa,定过(x, y);
回归分析: x增加一个单位,y增加b个单位; x m时,y大约为bma
的 平 均 值 为x' (ax1b)(ax2b)L(axnb)axb n
方 差 为 S'2=(ax1bx')2(ax2bx')2L(axnbx')2 n
=a2S2
二、数据的数字特征及用样本估计总体
2.频率分布直方图、折线图与茎叶图 样本中所有数据(或数据组)的频率和样本容量 的比,就是该数据的频率。所有数据(或数据组) 的频率的分布变化规律叫做频率分布,可以用频 率分布直方图、折线图、茎叶图来表示。
统计
统计的基本知识框架
1.收集数据——抽样方法
2.分析数据——统计表、数据的数
字特征及用样本估计总体
山东高考概率统计考查统计
年份 题号
考查内容
2007 8,12 频率分布直方图,古典概型
2008 9,18 数字特征,古典概型
2009 11,19 几何概型,分层抽样,古典概型
2010 6,19 数字特征,古典概型
二、数据的数字特征及用样本估计总体
常用结论:有一组数据xn:x1,x2,x3,Lxn
的平均值为xx1x2x3Lxn n
方差为S2=(x1x)2(x2x)2(x3x)2L(xnx)2 n
构 造 新 数 据 a x n b : a x 1 b , a x 2 b , a x 3 b , L a x n b
1.用样本的数字特征估计总体的数字特征 (1)众数、中位数 在一组数据中出现次数最多的数据叫做众数; 将一组数据按照从大到小(或从小到大)排列, 处在中间位置上的一个数据(或中间两位数据的 平均数)叫做这组数据的中位数;
(2)平均数与方差 xx1x2x3Lxn n
S 2 = (x 1 x )2 (x 2 x )2 (x 3 x )2 L (x n x )2 n
分层抽样
将总体分成几层 ,分层进行抽取
一、抽样方法
三种抽样方法的比较
类别
相互联系
适用范围
简单随 机抽样
总体中的个数 较少
在起始部分抽 系统抽样 样时采用简单
随机抽样
总体中的个数 较多
各层抽样时采 总体由差异明 分层抽样 用简单随机抽 显的几部分组
样或系统抽样 成
二、数据的数字特征及用样本估计总体
n
xiyi nx y
b i1
其中
Biblioteka Baidu
n
x
2 i
2
nx
i1
a y bx

x
1 n
n i 1
xi
。相应
的直线叫回归直线,对两个变量所进行的
上述统计叫做回归分析。
三、线性相关性与最小二乘法
求线性回归直线方程的步骤:
(1)画散点图观察相关性 (2)列出表格,求出某些数据
(3)代入公式求得a,b,进而得到直线方程。
频率分布直方图:具体做法如下: (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数;(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图
频率分布直方图中小长方形的面积
频率 =组距× 组距 =频率
二、样本估计总体
1.频率分布直方图、频率分布折线图、总体密度曲线 例2
(1)频率=纵坐标×组距= n N
三、两个变量的线性相关
1.正相关、负相关、回归直线
2.线性相关关系: yˆ bˆxaˆ
(i)过( x , y )
(ii)X每增加一个单位,y平均(约)增加(减少)b$ 个单位
(iii)当x=x0时,y约为bˆ x 0 aˆ
3.相关系数r (i)衡量两个变量间的线性相关关系
(ii)r>0时,正相关,r<0时,负相关
相关性检验:|r|≤1,|r|→1,线性相关越强
古典概型 几何概型
一、知识回顾
古典概型 1、古典概型的两个特征:(1)有限性(2)等可能性
2、古典概型的概率公式: PA m n事 件 试 A 验 包 的 含 基 的 本 基 事 本 件 事 数 件 数 注:(1)关键是分清试验和事件(2)计算n 和 m 几何概型 1、几何概型的两个特征:(1)无限性(2)等可能性
2、几何概型的概率公式: PA A子 区 区 域 域 A 的 的 几 几 何 何 度 度 量 量
(2)频率之和为1
二、样本估计总体
2.茎叶图 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩 余分数的平均分为91,现场做的9个分数的茎叶图后来有一 个数据模糊,无法辨认,在图中以 表示:
则7个剩余分数的方差为_______
变量的相关性 与统计案例
三、线性相关性与最小二乘法
线性回归:
量,它的表达式是:
2
K2
n(a db)c
(ab)c(d)a (c)b (d)
经过对统计量分布的研究,
已经得到了两个临界值:3.841与6.635。
当根据具体的数据算出的k
1.当k>6.635时,有99%的把握说事件A与B有关; 2.当k>3.841时,有95%的把握说事件A与B有关;
3.当k 3.841时,认为事件A与B是无关的。
相关文档
最新文档