高中数学统计与统计案例概率知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计与统计案例概率(文科)
知识点
1.抽样调查
(1)抽样调查
通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查.
(2)总体和样本
调查对象的称为总______体,被抽取的称为样______本.
(3)抽样调查与普查相比有很多优点,最突出的有两点:
①______
②节约人力、物力和财力.
2.简单随机抽样
(1)简单随机抽样时,要保证每个个体被抽到的概率.
(2)通常采用的简单随机抽样的方法:_____
3.分层抽样
(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
4.系统抽样
系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.
5.统计图表
统计图表是______数据的重要工具,常用的统计图表有______
6.数据的数字特征
(1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.
中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
平均数:样本数据的算术平均数,即x=1
n
(x1+x2+…
+x n).
在频率分布直方图中,中位数左边和右边的直方图的
面积应该______
(2)样本方差
标准差s=
1
n
[x1-x2+x2-x2+…+x n-x2],其中x n是样本数据的第n项,n是,______x是______标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差.
7.用样本估计总体
(1)通常我们对总体作出的估计一般分成两种,一种是
______,另一种______.
(2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______
(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.
8.相关性
(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的______ (2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为
____________
(3)在两个变量x和y的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是______,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是______的.如果所有的点在散点图中没有关系,则称变量间是______的.
9.线性回归方程
(1)最小二乘法
如果有n个点(x1,y1),(x2,y2),…,(x n,y n),可以用[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2来刻画这些点与直线y=a+bx的接近程度,使得上式达到最小值的直线y=a+bx就是所要求的直线,这种方法称为最小二乘法.
(2)线性回归方程
方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的线性回归方程,其中a,b是待定参数.
⎩⎪⎨⎪⎧ b =∑n i =1 x i -x y i -y ∑n i =1 x i -x 2=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .
10.回归分析
(1)定义:对______的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,(x ,y )称为样本点的中心.
(3)相关系数
①r =∑n
i =1
x i -x y i -y ∑n i =1 x i -x
2∑n i =1 y i -y 2 =∑n
i =1x i y i -n x y
∑n i =1x 2i -n x 2∑n i =1y 2i -n y 2;
②当r >0时,表明两个变量正相关;
当r <0时,表明两个变量负相关;
当r =0时,表明两个变量线性不相关.
r的绝对值越接近于1,表明两个变量之间的线性相关程度越高.r的绝对值越接近于0,表明两个变量之间的线性相关程度越低.
11.独立性检验
设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1;
2×2列联表:
B
A B1B2总计
A1a b a+b
A2c d c+d
总计a+
c
b+
d
n=a+b
+c+d
构造一个随机变量
χ2=
n ad-bc2
a+b c+d a+c b+d
.