03概率统计四大解题策略(理科原卷版)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
03 概率统计四大解题策略
一.【学习目标】
1.会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系; 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 4.了解回归的基本思想、方法及简单应用.
二.【知识要点】 1.相关关系的分类
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称之为 ;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为 . 2.线性相关
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫 . 3.回归方程
(1)最小二乘法:使得样本数据的点到回归直线的__ 最小的方法叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则⎩⎪⎨⎪⎧b ^=∑n
i =1
(x i
-x -)(y i
-y -
)∑n
i =1
(x i
-x -
)2
=∑n
i =1
x i y i -nx -y -
∑n
i =1
x 2i
-nx -
2
,
a ^=y -
-bx -
.
其中b ^是回归方程的 ____ ,a ^
是在y 轴上的截距.
4.样本相关系数
r =
∑n
i =1 (x i -x -)(y i -y -
)
∑n
i =1
(x i -x -
)2∑n
i =1
(y i -y -
)2
,用来衡量两个变量间的线性相关关系.
(1)当r>0时,表示两个变量 ; (2)当r<0时,表示两个变量 ;
(3)r 的绝对值越接近1,表明两个变量的线性相关性 ____ ;r 的绝对值越接近于0,表示两个变量之间几乎不存在相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系. 5.线性回归模型
(1)y =bx +a +e 中,a ,b 称为模型的未知参数,e 称为随机误差. (2)相关指数
用相关指数R 2来刻画回归的效果,其计算公式是:R 2=1-∑n
^ i =1 (y i -y ^
)2
∑n ^ i =1 (y i -y -)2,R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果 ____ .在线性回归模型中,R 2表示解释变量对预报变化的贡献率,R 2越接近于1,表示回归效果越好. 6.独立性检验
(1)用变量的不同“值”表示个体所需的不同类别,这种变量称为分类变量. (2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:
K 2
=n (ad -bc )2
(a +b )(a +c )(c +d )(b +d )(其中n =a +b +c +d 为样本容量),可利用独立性检验判断表来判
断“X 与Y 的关系”.这种利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 三.【类型汇总】
(一)文字关 ——抓关键语句,破干扰信息 (二)图表关——转换信息建模型 (三)计算关——重视计算防失分 (四)概率模块内交汇 (五)概率统计交汇 (六)概率统计与数列交汇 (七)概率统计与函数不等式交汇 (八)概率统计与其它知识的综合 四【题型方法规律总结】
(一)文字关 ——抓关键语句,破干扰信息
例1.山东省2020年高考将实施新的高考改革方案.考生的高考总成绩将由3门统一高考科目成绩和自主选择的3门普通高中学业水平等级考试科目成绩组成,总分为750分.其中,统一高考科目为语文、数学、外语,
自主选择的3门普通高中学业水平等级考试科目是从物理、化学、生物、历史、政治、地理6科中选择3门作为选考科目,语、数、外三科各占150分,选考科目成绩采用“赋分制”,即原始分数不直接用,而是按照学生分数在本科目考试的排名来划分等级并以此打分得到最后得分.根据高考综合改革方案,将每门等级考试科目中考生的原始成绩从高到低分为、、、、、、、共8个等级。参照正态分布原则,确定各等级人数所占比例分别为、、、、、、、.等级考试科目成绩计入考生总成绩时,将至等级内的考生原始成绩,依照等比例转换法则,分别转换到91-100、81-90、71-80,61-70、51-60、41-50、31-40、21-30八个分数区间,得到考生的等级成绩.
举例说明.
某同学化学学科原始分为65分,该学科等级的原始分分布区间为58~69,则该同学化学学科的原始成绩属等级.而等级的转换分区间为61~70,那么该同学化学学科的转换分为:
设该同学化学科的转换等级分为,,求得.
四舍五入后该同学化学学科赋分成绩为67.
(1)某校高一年级共2000人,为给高一学生合理选科提供依据,对六个选考科目进行测试,其中物理考试原始成绩基本服从正态分布.
(i)若小明同学在这次考试中物理原始分为84分,等级为,其所在原始分分布区间为82~93,求小明转换后的物理成绩;
(ii)求物理原始分在区间的人数;
(2)按高考改革方案,若从全省考生中随机抽取4人,记表示这4人中等级成绩在区间的人数,求的分布列和数学期望.
(附:若随机变量,则,,
)
(二)图表关——转换信息建模型
例2.随着国内电商的不断发展,快递业也进入了高速发展时期,按照国务院的发展战略布局,以及国家邮政管理总局对快递业的宏观调控,SF快递收取快递费的标准是:重量不超过1kg的包裹收费10元;重量超过1kg的包裹,在收费10元的基础上,每超过1kg(不足1kg,按1kg计算)需再收5元.某县SF分代