概率与统计(理科)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.(2013·江西高考)总体由编号为 01,02,…,19,20 的 20 个个体组成.利
用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的
第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的
第 5 个个体的编号为
()
7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481
角度二:与概率相结合问题
2.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如
下表:
学历
35 岁以下
35~50 岁
50 岁以上
本科
80
30
20
研究生
x
20
y
(1)用分层抽样的方法在 35~50 岁年龄段的专业技术人员中抽取一个容量为 5 的样本,将该样本看 成一个总体,从中任取 2 人,求至少有 1 人学历为研究生的概率;
2.(2012 年杭州一检)从 1,2,3,4,5,6 这 6 个数字中,任取 2 个数字相加,其和为偶数的概率是________.
解析:从6个数中任取2个数的可能情况有:(1,2), (1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4), (3,5),(3,6),(4,5),(4,6),(5,6),共15种,其中和为偶数的情 况有:(1,3),(1,5),(2,4),(2,6),(3,5),(4,6),共6种,所以 所求的概率是25.
A.08
B.07 C.02
D.01
解析:从随机数表第 1 行的第 5 列和第 6 列数字开始 由左到右依次选取两个数字,则选出的数字为 08,02,14,07,01,…,故选出的第 5 个个体的编号为 01.
答案:D
考点二 系统抽样 (重点保分型考点——师生共研)
系统抽样的步骤
[必备知识]
假设要从容量为 N 的总体中抽取容量为 n 的样本. (1)先将总体的 N 个个体编号; (2)确定分段间隔 k,对编号进行分段.当Nn(n 是样本容量)
3.众数、平均数、中位数是描述数据的 集中趋势 的量,方差、 标准差则是描述数据的 波动大小 .其中,方差的计算公式为
1
s2= n [(x1- x )2+(x2- x )2+…+(xn- x )2] .
4.茎叶图通常用来记录两位数的数据,把两位数的 十位数字 作 为茎, 个位数字 作为叶,如数据为三位数,则把十位和百位数字 合在一起作为茎,个位数字作为叶.
12.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,
像这类变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为列联表.假设
有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},
其样本频数列联表(称为 2×2 列联表)为
2×2 列联表
y1
y2
总计
[典题例析]
(2014·广东高考)为了解 1 000 名学生的学习情况,采用系统抽
样的方法,从中抽取容量为 40 的样本,则分段的间隔为( )
A.50
B.40
C.25
D.20
解析:由1 40000=25,可得分段的间隔为 25.故选 C.
2.(人教 B 版教材习题改编)某工厂平均每天生产某种机器零件 大约 10 000 件,要求产品检验员每天抽取 50 件零件,检查 其质量状况,采用系统抽样方法抽取,若抽取的第一组中的 号码为 0010,则第三组抽取的号码为___0_4_1_0__.
二、概率
A包含的基本事件的个数
1.在古典概型中,事件A的概率公式P(A)=
基本事件的总数
.
2.在几何概型中,事件A的概率公式P(A)=
μA μΩ
,其中μΩ表示区域Ω
的几何度量,μA表示区域A的几何度量. 3.不可能同时发生的事件叫做互斥事件,若事件A和B为互斥事件,
则P(A∪B)= P(A)+P(B) ,这个公式推广到n个互斥事件时也成
3 个黑球.从袋中任取两球,两球颜色为一白一黑的概率等于
()
1
2
A.5
B.5
3
4
C.5
D.5
解析:将同色小球编号.从袋中任取两球,所有基本事件为:(红,白 1),(红,白 2),(红, 黑 1),(红,黑 2),(红,黑 3),(白 1,白 2),(白 1,黑 1),(白 1,黑 2),(白 1,黑 3),(白 2, 黑 1),(白 2,黑 2),(白 2,黑 3),(黑 1,黑 2),(黑 1,黑 3),(黑 2,黑 3),共有 15 个基本事件, 而一白一黑的共有 6 个基本事件,P=165=25.故选 B.
是整数时,取 k=Nn;
(3)在第 1 段用简单随机抽样确定第一个个体编号 l(l≤k);
(4)按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到 第 2 个个体编号 l+k,再加 k 得到第 3 个个体编号 l+2k,依 次进行下去,直到获取整个样本.
[提醒] 系统抽样中,易忽视抽取的样本数也就是分段的 段数,当Nn 不是整数时,注意剔除,剔除的个体是随机的,各 段入样的个体编号成等差数列.
x1
a
b
a+b
x2
c
d
c+d
总计 a+c b+d a+b+c+d
K2=(a+b)(an+(ca)d-(bbc+)d2 )(c+d)
(其中 n= a+b+c+d 为样本容量),则利用独立性检验判断表
来判断“X 与 Y 的关系”.
第一讲 随机抽样
考点一 简单随机抽样 (基础送分型考点——自主练透) [必备知识]
,^a=y-b^x,其中b^是回归方程的 斜率 ,
(4)样本相关系数
,用它来衡量两个变量间的线性相关关 系的强弱.
①当 r>0 时,表明两个变量 正相关 ; ②当 r<0 时,表明两个变量 负相关 ; ③r 的绝对值越接近 1,表明两个变量的线性相关性 越强 ;r 的绝 对值越接近 0,表明两个变量的线性相关性 越弱 .通常当|r|>0.75 时, 认为两个变量有很强的线性相关关系.
2.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如 下表:
学历
35 岁以下
35~50 岁
50 岁以上
本科
80
30
20
研究生
x
20
y
(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其中 35 岁以下 48 人,50 岁以 上 10 人,再从这 N 个人中随机抽取 1 人,此人的年龄为 50 岁以上的概率为359,求 x,y 的值. 抽取的样本中有研究生 2 人,本科生 3 人,分别记作 S1,S2;B1,B2,B3. 从中任取 2 人的所有等可能基本事件共有 10 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2, B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3), 其中至少有 1 人的学历为研究生的基本事件有 7 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2, B3),(S1,S2). ∴(从2)由中题任意取,2 得人1,N0=至3少59,有解1 得人学N=历7为8.研∴究35生~的50概岁率中为被17抽0. 取的人数为 78-48-10=20, ∴804+8 x=2500=201+0 y,解得 x=40,y=5.即 x,y 的值分别为 40,5.
几何概型来解决.
古典概型
基础梳理
1. 基本事件
(1) 基本事件的定义:
一次试验中可能出现的 试验结称果为一个基本事件.所有的基本事件都有有 限个,而且是试验中不能再分的最简单的随机事件.
(2) 基本事件的特点:
① 任何两个基本事件是 互斥; 的
② 任何事件都可以表示成 基本的事和件.
2. 古典概型
(1)抽取方式:逐个不放回抽取; (2)每个个体被抽到的概率相等; (3)常用方法:抽签法和随机数法. [提醒] 简单随机抽样中易忽视样本是从总体中逐个抽取,是 不放回抽样,且每个个体被抽到的概率相等.
1.(2015·广东七校联考)假设要考察某公司生产的 500 克袋装牛奶
的三聚氰胺是否超标,现从 800 袋牛奶中抽取 60 袋进行检验, 利用随机数表抽取样本时,先将 800 袋牛奶按 000,001,…, 799 进行编号,如果从随机数表第 7 行第 8 列的数开始向右读, 则得到的第 4 个样本个体的编号是__0_6_8__.(下面摘取了随机数 表第 7 行至第 9 行) 87 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76,63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86
73 58 07 44 39 52 38 79,33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 解析:由随机数表,可以看出前 4 个样本的个体的编号是 331,572,455,068.于是,第 4 个样本个体的编号是 068.
概率与统计
重点知识回顾 第一讲 随机抽样 第二讲 概率计算——古典与几何概型 第三讲 统计——用样本估计总体 第四讲 统计案例——回归分析与独立性检验 第五讲 新课标高考真题选讲
一、统计 1.抽样方法包括: 简单随机抽样 、 系统抽样 、 分层抽样
三种方法.
2.频率分布直方图中,纵轴表示 频率/组距 ,数据落在各个小组 内的频率用 小矩形的面积 表示,各小矩形的面积和等于 1 .
如果某类概率模型具有以下两个特点: (1)试验中所有可能出现的基本事件 只有有. 限个 (2) 每个基本事件出现的 可能.性相等
3. 古典概型的概率公式 A 包含的基本事件的个数
对于任何事件A, P(A)=
基本事件的总数
古典概型
1.(2012 年安徽)袋中共有 6 个除了颜色外完全相同的球,其中有 1 个红球、2 个白球和
(3)回归方程 ①最小二乘法:使得样本数据的点到回归直线的 距离的平方和 最 小的方法叫最小二乘法. ②回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,
y2) , … , (xn , yn) , 其 回 归 方 程 为 y^ = ^b x + ^a , 则 b^ =
a^是在 y 轴上的 截距 .
角度一:与频率分布相结合问题
1.(2014·广东高考)已知某地区中小学生人数和近视情况分别如图
1 和图 2 所示.为了解该地区中小学生的近视形成原因,用分
层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的
高中生近视人数分别为
(D)
Baidu Nhomakorabea
A.100,10 B.200,10 C.100,20 D.200,20
考点三 分层抽样的交汇命题 (常考常新型考点——多角探明) [必备知识]
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定 的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合 在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. [提醒] 分层抽样中,易忽视每层抽取的个体的比例是相同 的,即总样体本个容数量Nn .
立.(P(A∪B)也可记为P(A+B))
11.相关关系与回归方程
(1)相关关系的分类 ①正相关:从散点图上看,点散布在从左下角 内;②负相关:从散点图上看,点散布在从左上角
到右上角 的区域 到 右下角 的区域
内.
(2)线性相关关系
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,
则称这两个变量之间具有线性相关关系,这条直线叫 回归直线 .
第二讲 概率——古典概型与几何概型
概率知识的考查是近几年新课改后高考命题的一大热点,高 考每年在选择、填空或解答题中都有所体现,由于文科数学后续 课程不再学习概率,文科数学将重点考查概率的意义、古典概型 与几何概型的掌握和运用.在处理概率问题时主要有两种思路:正 向思路和逆向思路.正向思考可对复杂问题进行分解;逆向思考常 使一些复杂问题得到简化.要学会将实际问题转化为古典概型和
解:(1)用分层抽样的方法在 35~50 岁年龄段的专业技术人员中抽取一个容量为 5 的样本, 设抽取学历为本科的人数为 m,∴3500=m5 ,解得 m=3. (2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其中 35 岁以下 48 人,50 岁以 上 10 人,再从这 N 个人中随机抽取 1 人,此人的年龄为 50 岁以上的概率为359,求 x,y 的值.