(最全)高中数学概率统计知识点总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率与统计
一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。
2、平均数:①、常规平均数:12n
x x x x n
++⋅⋅⋅+=
②、加权平均数:112212n n n x x x x ωωωωωω++⋅⋅⋅+=++⋅⋅⋅+
3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。
4、方差:2222121
[()()()]n s x x x x x x n
=
-+-+⋅⋅⋅+- 二、频率直方分布图下的频率
1、频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数
2、频率之和:121n f f f ++⋅⋅⋅+=;同时 121n S S S ++⋅⋅⋅+=;
三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。
2、平均数: 112233n n
x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+⋅⋅⋅+-
四、线性回归直线方程:ˆˆˆy
bx a =+ 其中:1
1
2
22
1
1
()()
ˆ()
n
n
i i i i i i n
n
i i i i x x y y x y nxy
b
x x x nx ====---∑∑==
--∑∑ , ˆˆa
y bx =- 1、线性回归直线方程必过样本中心(,)x y ;
2、ˆ0:b
>正相关;ˆ0:b <负相关。 3、线性回归直线方程:ˆˆˆy bx a =+的斜率ˆb 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析
1、残差:ˆˆi i i e
y y =-(残差=真实值—预报值)。分析:ˆi e 越小越好; 2、残差平方和:21ˆ()n
i i i y y
=-∑, 分析:①意义:越小越好; ②计算:222211221
ˆˆˆˆ()()()()n
i i n n i y y
y y y y y y =-=-+-+⋅⋅⋅+-∑ 3、拟合度(相关指数):221
2
1
ˆ()1()
n
i i i n
i i y y
R y y ==-∑=-
-∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高;
4、相关系数
:()()
n
n
i i i i x x y y x y nx y
r ---⋅∑∑=
=
分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关
③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2
2()
()()()()
n ad bc k a b c d a c b d -=
++++
②.犯错误上界P 对照表
3、独立性检验步骤
①.计算观察值k :2
()()()()()
n ad bc k a b c d a c b d -=++++;
②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k ;
③.下结论:0k k ≥:即犯错误概率不超过P 的前提下认为: ,有1-P 以上的把握认为: ; 0k k <:即犯错误概率超过P 的前提认为: ,没有1-P 以上的把握认为: ;
【经典例题】
题型1 与茎叶图的应用
例1(2014全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50位市民。根据这50位市民 (1)分别估计该市的市民对甲、乙部门评分的中位数;
(2)分别估计该市的市民对甲、乙部门的评分做于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙学科网两部门的评价。
题型2 频率直方分布图的应用
例2(2015广东)某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,
[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图2,
(1)求直方图中x 的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[)220,240,[)240,260,[)260,280,
[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?
练习2 (2014全国1)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125)
频数 6 26 38 22 8
(1)在答题卡上作出这些数据的频率分布直方图: (2)估计这种产品质量指标值的平均数及方差
(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
题型3 计算线性回归方程
例3(2015重庆)随着我国经济的发展,居民
年份 2010 2011 2012 2013 2014
时间代号t 1 2 3 4 5 储蓄存款y (千亿元) 5 6 7 8
10
(1)求y 关于t 的回归方程ˆˆˆy
bt a =+ (2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.
年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (y t (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
题型4 线性回归分析
例4(2016全国3)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1–7分别对应年份2008–2014.
(1).由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;
(2).求出y 关于t 的回归方程ˆˆˆy
bt a =+(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
参考数据:
7
1
9.32i
i y
==∑,7
1
40.17i i i t y ==∑,
7
2
1
()
0.55i
i y y =-=∑,≈2.646.