高中数学统计与统计案例概率知识点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计与统计案例概率(文科)

知识点

1.抽样调查

(1)抽样调查

通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查.

(2)总体和样本

调查对象的称为总______体,被抽取的称为样______本.

(3)抽样调查与普查相比有很多优点,最突出的有两点:

①______

②节约人力、物力和财力.

2.简单随机抽样

(1)简单随机抽样时,要保证每个个体被抽到的概率.

(2)通常采用的简单随机抽样的方法:_____

3.分层抽样

(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.

(2)分层抽样的应用范围:

当总体是由差异明显的几个部分组成时,往往选用分层抽样.

4.系统抽样

系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.

5.统计图表

统计图表是______数据的重要工具,常用的统计图表有______

6.数据的数字特征

(1)众数、中位数、平均数

众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.

中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.

平均数:样本数据的算术平均数,即x=1

n

(x1+x2+…

+x n).

在频率分布直方图中,中位数左边和右边的直方图的

面积应该______

(2)样本方差

标准差s=

1

n

[x1-x2+x2-x2+…+x n-x2],其中x n是样本数据的第n项,n是,______x是______标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差.

7.用样本估计总体

(1)通常我们对总体作出的估计一般分成两种,一种是

______,另一种______.

(2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______

(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.

(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

8.相关性

(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的______ (2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为

____________

(3)在两个变量x和y的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是______,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是______的.如果所有的点在散点图中没有关系,则称变量间是______的.

9.线性回归方程

(1)最小二乘法

如果有n个点(x1,y1),(x2,y2),…,(x n,y n),可以用[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[y n-(a+bx n)]2来刻画这些点与直线y=a+bx的接近程度,使得上式达到最小值的直线y=a+bx就是所要求的直线,这种方法称为最小二乘法.

(2)线性回归方程

方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的线性回归方程,其中a,b是待定参数.

⎩⎪⎨⎪⎧ b =∑n i =1 x i -x y i -y ∑n i =1 x i -x 2=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .

10.回归分析

(1)定义:对______的两个变量进行统计分析的一种常用方法.

(2)样本点的中心

对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,(x ,y )称为样本点的中心.

(3)相关系数

①r =∑n

i =1

x i -x y i -y ∑n i =1 x i -x

2∑n i =1 y i -y 2 =∑n

i =1x i y i -n x y

∑n i =1x 2i -n x 2∑n i =1y 2i -n y 2;

②当r >0时,表明两个变量正相关;

当r <0时,表明两个变量负相关;

当r =0时,表明两个变量线性不相关.

r的绝对值越接近于1,表明两个变量之间的线性相关程度越高.r的绝对值越接近于0,表明两个变量之间的线性相关程度越低.

11.独立性检验

设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1;

2×2列联表:

B

A B1B2总计

A1a b a+b

A2c d c+d

总计a+

c

b+

d

n=a+b

+c+d

构造一个随机变量

χ2=

n ad-bc2

a+b c+d a+c b+d

.

相关文档
最新文档