高中数学精选--概率与统计-资料.ppt
高中数学概率知识点全面解析PPT
乘法公式和全概率公式
乘法公式的应用 乘法公式在概率论中的应用广泛,例如计算两个事件同时发生的概 率,其计算公式为P(A并B)=P(A)*P(B)。根据统计数据,这种方法 的准确率高达90%以上。 全概率公式的价值 全概率公式可以解决复杂问题中的概率计算问题,如在多个互斥事 件中寻找某个事件发生的原因。根据一项研究,使用全概率公式解 决问题的效率比传统方法提高了约30%。
连续型随机变量
连续型随机变量定义 连续型随机变量是一个可能取无限多个值的随机变量。 概率密度函数 连续型随机变量的概率密度函数用于描述该随机变量在某一区 间内取值的概率。 期望与方差 连续型随机变量的期望和方差是其重要特性,它们描述了该随 机变量的平均水平和离散程度。 实际应用 连续型随机变量广泛应用于金融、工程等实际问题中,如期权 定价模型。
Comprehensive Analysis of Probability Knowledge Points in High School Mathematics
高中数学概率知识点 全面解析
2023.11.03
目录
Content
01 概率的基本概念 02 条件概率与独立性 03 随机变量及其分布 04 多维随机变量及其联合分布 05 大数定律与中心极限定理
THANK YOU
2023.11.03
中心极限定理的内容和应用
中心极限定理概念 中心极限定理是概率论中的一个重要定理,描述了大量随机变量和的分布趋近于正态分布的现象 大数定律与中心极限定理 大数定律揭示了样本数量增加时,样本平均值趋近于期望值,而中心极限定理则描述了这一过程的概率分布 正态分布在实际应用中的重要性 由于中心极限定理的作用,许多实际问题中的随机变量都可以近似为正态分布,方便进行统计分析 中心极限定理在高中数学教学中的地位 作为概率论的核心内容之一,中心极限定理对于培养学生的数学思维、解决实际问题具有重要意义
高二数学--概率与统计-(1)
高二数学 概率与统计考试要求1.统计(1)随机抽样① 理解随机抽样的必要性和重要性.② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. (2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.② 理解样本数据标准差的意义和作用,会计算数据标准差. ③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释. ④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. (3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. ② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 不要求记忆线性回归方程系数公式()()()1122211,nniiiii i nniii i x ynx y xxyyb a y bxxnxxx-------===---∑∑∑∑用最小二乘法求线性回归方程系数公式:7.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.② 了解两个互斥事件的概率加法公式. (2)古典概型①理解古典概型及其概率计算公式.②会计算一些随机事件所含的基本事件数及事件发生的概率. (3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率. ②了解几何概型的意义.1.课本概念与定理详解(1)随机抽样①简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体数较少. ②系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.③分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.(2)众数、中位数、平均数①众数:在样本数据中,出现次数最多的那个数据.②中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.在直方图中取频率为0.5处的频数。
人教B版高中数学必修二课件 《概率》统计与概率PPT(古典概型)
解:样本空间为{(红,白),(红,黄),(白,红),(白,黄),(黄,红),(黄,白)},第 一次摸出红球,第二次摸出白球,只包含(红,白)一个基本事件,所以 所求概率是.
探究一
探究二
探究三
思维辨析 当堂检测
课堂篇探究学习
探究一
探究二
探究三
思维辨析 当堂检测
古典概型的概率计算
例2将一枚质地均匀的正方体骰子先后抛掷两次观察朝上的面
的点数.
(1)一共有多少种不同的结果?
(2)点数之和为5的结果有多少种?
(3)点数之和为5的概率是多少?
解:(1)将一枚质地均匀的正方体骰子抛掷一次,朝上的面的点数
有1,2,3,4,5,6,共6种结果,故先后将这枚骰子抛掷两次,一共有
所选两个国家都是亚洲国家包含的基本事件有
(A1,A2),(A1,A3),(A2,A3),共3个. 故所求事件的概率
(2)从亚洲国家和欧洲国家中各任选一个,所有的基本事件有
(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3), 共9个,包含A1但不包括B1的基本事件有(A1,B2),(A1,B3),共2个.
3.做一做:下列对古典概型的说法,正确的是( )
①试验中所有可能出现的基本事件只有有限个;②每个事件出现
的可能性相等;③每个基本事件出现的可能性相等;④求从含有3件
次品7件正品的10件产品中任取一件为正品的概率为古典概型问题.
A.②④
B.①③④ C.仅①④ D.仅③④
答案:B
高中数学第五章统计与概率51统计514用样本估计总体教学课件新人教B版必修第二册
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
14
解
因为
x甲
=
8+11+14+15+22 5
=14,
x乙
=
6+7+10+23+24 5
=14.
x甲 x乙.
s
2 甲
=
62 +32 +02 +12 +82 5
=22,
s
2 乙
=
82 +72 +42 +92 +102 5
(2)已知抽取的样本中,男生20人,女生15人,怎样估计总体平均数与 方差?
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
8
问题3.如何分析频率分布直方图,用样本的分布估计总体的分布 通过整理某中学1257名高一学生期中考试数学成绩,得到如下数据,并 作出了频率分布直方图和折线图.
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
16
2021/4/17
高中数学第五章统计与概率51统计514用样本估计总体教学 课件新人教B版必修第二册
17
解 (1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)x20=1,得x=0.0075. (2)众数为[220,240)区间的中点230. 因为(0.002+0.0095+0.011)x20=0.45<0.5,所以中位数在[220,240)
高中数学概率与统计知识点
高中数学概率与统计知识点1、概率的定义随机事件A的概率是频率的稳定值;频率是概率的近似值。
2、等可能事件的概率如果一次试验中可能出现的结果有n个,且所有结果出现的可能性都相等,那么,每一个基本事件的概率都是1/n,如果某个事件A包含的结果有m个,那么事件A的概率为P(A)=m/n。
3、互斥事件不可能同时发生的两个事件叫互斥事件。
如果事件A、B互斥,那么事件A+B发生(A、B中有一个发生)的概率,等于事件A、B 分别发生的概率和,即P(A+B)=P(A)+P(B)。
4、对立事件对立事件是指两个事件必有一个发生的互斥事件。
例如:从1~52张扑克牌中任取一张抽到“红桃”与抽到“黑桃”互为互斥事件,因为其中一个不可能同时发生,但又不能保证其中一个必然发生,故不是对立事件。
而抽到“红色牌”与抽到“黑色牌”互为对立事件,因为其中一个必发生。
对立事件的性质:1)对立事件的概率和等于1:P(A)+P(Ä)=P(A+A)=1。
2)互为对立的两个事件一定互斥,但互斥不一定是对立事件。
5、相互独立事件事件A(或B)是否发生对事件B(或A)发生的概率没有影响,这样的两个事件叫做相互独立事件。
两个相互独立事件同时发生的概率,等于每个事件发生的概率的积,即P(A·B)=P(A)·P(B)。
相互独立事件的性质:1)如果事件A与B相互独立,那么A与B,A与B,A与B也都相互独立。
2)必然事件与任何事件都是相互独立的。
3)独立事件是对任意多个事件来讲,而互斥事件是对同一实验来讲的多个事件,且这多个事件不能同时发生,故这些事件相互之间必然影响,因此互斥事件一定不是独立事件。
6、独立重复试验若n次重复试验中,每次试验结果的概率都不依赖于其他各次试验的结果,则称这n次试验是独立的。
如果在一次试验中某事件发生的概率为P,那么在n次独立重复试验中这个事件恰好发生k 次的概率:P…(k)=CP*(1-P)"-*7、两个事件之间的关系对任何两个事件都有P(A+B)=P(A)+P(B)-P(A·B)。
第十章 统计与概率10-6排列与组合(理
重点难点 重点:1.两个计数原理的理解和应用. 2.排列与组合的定义、计算公式,组合数 的两个性质. 难点:1.如何区分实际问题中的“类”与 “步”. 2.组合数的性质和有限制条件的排列组合 问题.
知识归纳 1.分类加法计数原理 做一件事,完成它有n类办法,在第1类办法 中有m1种不同的方法,在第2类办法中有m2 种不同的方法,„„,在第n类办法中有mn 种不同的方法,那么完成这件事共有N=m1 +m2+„+mn种不同的方法. 2.分步乘法计数原理 做一件事,完成它需要分成n个步骤,做第 一步有m1种不同的方法,做第二步有m2种 不同的方法,„„,做第n步有mn种不同的 方法,那么完成这件事共有N= m ×m ׄ×m 种不同的方法.
4.组合 从 n 个不同元素中,取出 m(m≤n)个元素并成一组,叫 做从 n 个不同元素中取出 m 个元素的一个组合,所有组合的 个数为组合数. (1)组合数公式 „· Anm nn-1n-2· n-m+1 m Cn =A m= m! m n! = . m!n-m! 规定:Cn0=1.
解析:若甲在第一位有A44=24种方法;若 甲在第二位有C31A33=18种方法,故共有18 +24=42种方法. 答案:B (5)至多、至少间接法.含“至多”、“至 少”的排列组合问题,是需要分类问题.可 用间接法,即排除法,但仅适用于反面情况 明确且易于计算的情况.
[例5] (09·湖南)从10名大学毕业生中选3人 担任村长助理,则甲、乙至少有1人入选, 而丙没有入选的不同选法的种数为( ) A.85 B.56 C.49 D.28 解析:甲、乙、丙都没入选有C73=35种, 丙没有入选的有C93=84种, 故甲、乙至少有1人入选而丙没有入选的不 同选法种数有84-35=49(种). 答案:C
新教材高中数学第4章概率与统计4-1-1条件概率课件新人教B版选择性必修第二册
1.(对接教材 P43 例 3)设某动物由出生算起活到 20 岁的概 率为 0.8,活到 25 岁的概率为 0.4,现有一个 20 岁的这种动物,则它 活到 25 岁的概率是________.
2 3
3 5
[由公式 P(A|B)=PPA∩BB=23,P(B|A)=PPA∩AB=53.]
类型 2 利用基本事件个数求条件概率
在一个坛子中装有 10 个除颜色外完全相同的玻璃球,其中有 2 个红球,8 个黄球.现从中任取一球后(不放回),再取一球,则已知 第一个球为红色的情况下第二个球为黄色的概率为多少?
[解] 设第 1 次抽到舞蹈节目为事件 A,第 2 次抽到舞蹈节目为事 件 B,则第 1 次和第 2 次都抽到舞蹈节目为事件 A∩B.
(1)从 6 个节目中不放回地依次抽取 2 个的事件数为 n(Ω)=A26=30, 根据分步乘法计数原理 n(A)=A14A15=20,于是 P(A)=nnΩA=2300=23. (2)因为 n(A∩B)=A24=12,于是 P(A∩B)=nnA∩ΩB=1320=25.
[由公式 P(A|B)=PPA∩BB=23,P(B|A)=PPA∩AB=53.]
[跟进训练]
1.甲、乙两市都位于长江下游,根据一百多年来的气象记录, 知道一年中下雨天的比例甲市占 20%,乙市占 18%,两地同时下雨 占 12%,记 P(A)=0.2,P(B)=0.18,P(A∩B)=0.12,则 P(A|B)= ________,P(B|A)=________.
[解] 由古典概型的概率公式可知
高中数学统计学 PPT课件 图文
• 对于负的 x ,可由 (-x)1 x得到
• 对于标准正态分布,即X~N(0,1),有
• P (a X b) b a • P (|X| a) 2 a 1
• 对于一般正态分布,即X~N( , ),有
• 方差为 D ( X ) = npq
【例】某农庄饲养100只家禽,其中有5只鹅,现 从中任取一只,有放回地抽样3次。求在所抽取 的3只家禽中恰好有2只鹅的概率
解:设 X 为所抽取的3只家禽中鹅的数目,则 X~B ( 3 , 0.05),根据二项分布公式有
P X 2 C 3 2 (0 .0)2 5 (0 .9)3 5 2 0 .0071
x!
— 给定的时间间隔、长度、面积、 体积内事件出现的平均数
e = 2.71828 x —给定的时间间隔、长度、面积、体
积内事件出现的次数
泊松概率分布的期望和方差
• 泊松分布的数学期望为 E(X)=
• 方差为 D(X)=
泊松分布
——实例3.2.6
【例】假定某人饲养了一群鸡,母鸡在周一产蛋的 个数X服从泊松分布,假设周一产蛋的平均数为2.5 个。试求
• f(x)不是概率
请多加注意啊!
概率密度函数
密度函数 f(x)表示X 的所有取值 x 及其频数f(x)
频数
f(x)
(值, 频数)
x
a
b
值
概率密度函数
在平面直角坐标系中画出f(x)的图形,则对于任何实数
x1 < x2,P(x1< X x2)是该曲线下从x1 到 x2的面积
概率是曲线下的面积, 哈哈!
方差为:D(X) 6 xi E(X)2pi i1
高中数学概率和统计知识点
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m; 等可能事件概率的计算步骤:计算一次试验的基本事件总数n ;设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式()mP A n =求值;答,即给问题一个明确的答复.(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=kn k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4)解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:第一步,确定事件性质⎧⎪⎪⎨⎪⎪⎩等可能事件互斥事件 独立事件 n 次独立重复试验即所给的问题归结为四类事件中的某一种.第二步,判断事件的运算⎧⎨⎩和事件积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.第三步,运用公式()()()()()()()()(1)kk n k n n m P A nP A B P A P B P A B P A P B P k C p p -⎧=⎪⎪⎪+=+⎨⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解第四步,答,即给提出的问题有一个明确的答复.例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).[解答过程]0.3提示:1335C 33.54C 102P ===⨯例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 .[解答过程]1.20提示:51.10020P == 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发热反应的概率为__________.(精确到0.01)[考查目的] 本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以及推理和运算能力.[解答提示]至少有3人出现发热反应的概率为33244555550.800.200.800.200.800.94C C C ⋅⋅+⋅⋅+⋅=.故填0.94.离散型随机变量的分布列 1.随机变量及相关概念①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列①离散型随机变量的分布列的概念和性质一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.为随机变量ξ的概率分布,简称ξ的分布列.由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,1,2,…n ,并且kn k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:),;(p n k b q p C kn k k n =- .(2) 几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生. 随机变量ξ的概率分布为:例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(Ⅱ)若厂家发给商家20件产品中,其中有3件不合格,按合同规定该商家从中任取2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数ξ的分布列及期望ξE ,并求出该商家拒收这批产品的概率.[解答过程](Ⅰ)记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A 用对立事件A 来算,有()()4110.20.9984P A P A =-=-=(Ⅱ)ξ可能的取值为0,1,2.()2172201360190C P C ξ===, ()11317220511190C C P C ξ===,()2322032190C P C ξ===136513301219019019010E ξ=⨯+⨯+⨯=.记“商家任取2件产品检验,都合格”为事件B ,则商家拒收这批产品的概率()136271119095P P B =-=-=.所以商家拒收这批产品的概率为2795.例12.某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰. 已知某选手能正确回答第一、二、三轮的问题的概率分别为54、53、52,且各轮问题能否正确回答互不影响.(Ⅰ)求该选手被淘汰的概率;(Ⅱ)该选手在选拔中回答问题的个数记为ξ,求随机变量ξ的分布列与数学期望. (注:本小题结果可用分数表示)[解答过程]解法一:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =,∴该选手被淘汰的概率112223112123()()()()()()()P P A A A A A A P A P A P A P A P A P A =++=++142433101555555125=+⨯+⨯⨯=.(Ⅱ)ξ的可能值为123,,,11(1)()5P P A ξ===,1212428(2)()()()5525P P A A P A P A ξ====⨯=, 12124312(3)()()()5525P P A A P A P A ξ====⨯=.ξ∴的分布列为11235252525E ξ∴=⨯+⨯+⨯=.解法二:(Ⅰ)记“该选手能正确回答第i 轮的问题”的事件为(123)i A i =,,,则14()5P A =,23()5P A =,32()5P A =.∴该选手被淘汰的概率1231231()1()()()P P A A A P A P A P A =-=-4321011555125=-⨯⨯=. (Ⅱ)同解法一.离散型随机变量的期望与方差随机变量的数学期望和方差 (1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平.⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…;方差反映随机变量取值的稳定与波动,集中与离散的程度.⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p E 1=ξ,D ξ =2p q 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等,所得次品数分别为ε、η,ε和η的分布列如下:则比较两名工人的技术水平的高低为 .思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值,即期望;二是要看出次品数的波动情况,即方差值的大小.解答过程:工人甲生产出次品数ε的期望和方差分别为:7.0103210111060=⨯+⨯+⨯=εE ,891.0103)7.02(101)7.01(106)7.00(222=⨯-+⨯-+⨯-=εD ;工人乙生产出次品数η的期望和方差分别为:7.0102210311050=⨯+⨯+⨯=ηE ,664.0102)7.02(103)7.01(105)7.00(222=⨯-+⨯-+⨯-=ηD由E ε=E η知,两人出次品的平均数相同,技术水平相当,但D ε>D η,可见乙的技术比较稳定.小结:期望反映随机变量取值的平均水平;方差反映随机变量取值的稳定与波动,集中与离散的程度. 例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数ξ的分布列为商场经销一件该商品,采用1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为300元.η表示经销一件该商品的利润.(Ⅰ)求事件A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率()P A ;(Ⅱ)求η的分布列及期望E η.[解答过程](Ⅰ)由A 表示事件“购买该商品的3位顾客中至少有1位采用1期付款”. 知A 表示事件“购买该商品的3位顾客中无人采用1期付款”2()(10.4)0.216P A =-=, ()1()10.2160.784P A P A =-=-=.(Ⅱ)η的可能取值为200元,250元,300元.(200)(1)0.4P P ηξ====,(250)(2)(3)0.20.20.4P P P ηξξ===+==+=,(300)1(200)(250)10.40.40.2P P P ηηη==-=-==--=.η的分布列为2000.42500.43000.2E η=⨯+⨯+⨯240=(元).抽样方法与总体分布的估计 抽样方法1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.总体分布:总体取值的概率分布规律通常称为总体分布.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布.总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 典型例题例1.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2:3:5.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件.那么此样本的容量n= .解答过程:A 种型号的总体是210,则样本容量n=1016802⨯=.例2.一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m k +的个位数字相同,若6m =,则在第7组中抽取的号码是 .解答过程:第K 组的号码为(1)10k - ,(1)101k -+,…,(1)109k -+,当m=6时,第k 组抽取的号的个位数字为m+k 的个位数字,所以第7组中抽取的号码的个位数字为3 ,所以抽取号码为63.正态分布与线性回归 1.正态分布的概念及主要性质(1)正态分布的概念如果连续型随机变量ξ 的概率密度函数为 222)(21)(σμπσ--=x ex f ,x R ∈ 其中σ、μ为常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).(2)期望E ξ =μ,方差2σξ=D .(3)正态分布的性质 正态曲线具有下列性质:①曲线在x 轴上方,并且关于直线x =μ对称.②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.三σ原则即为数值分布在(μ—σ,μ+σ)中的概率为0.6526 数值分布在(μ—2σ,μ+2σ)中的概率为0.9544 数值分布在(μ—3σ,μ+3σ)中的概率为0.9974 (4)标准正态分布当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.(6)2(,)N μσ与(0,1)N 二者联系.若2~(,)N ξμσ,则~(0,1)N ξμησ-=;②若2~(,)N ξμσ,则()()()b a P a b μμξφφσσ--<<=-.2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y+=ˆ.其中,,)(1221x b y a x n xyx n yx b ni ini ii⋅-=--=∑∑==,其中y x ,分别为|i x |、|i y |的平均数.例1.如果随机变量ξ~N (μ,σ2),且E ξ=3,D ξ=1,则P (-1<ξ≤1=等于( ) A.2Φ(1)-1 B.Φ(4)-Φ(2) C.Φ(2)-Φ(4) D.Φ(-4)-Φ(-2)解答过程:对正态分布,μ=E ξ=3,σ2=D ξ=1,故P (-1<ξ≤1)=Φ(1-3)-Φ(-1-3)=Φ(-2)-Φ(-4)=Φ(4)-Φ(2). 答案:B例2. 将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ℃,液体的温度ξ(单位:℃)是一个随机变量,且ξ~N (d ,0.52). (1)若d=90°,则ξ<89的概率为 ; (2)若要保持液体的温度至少为80 ℃的概率不低于0.99,则d 至少是 ?(其中若η~N (0,1),则Φ(2)=P (η<2)=0.9772,Φ(-2.327)=P (η<-2.327)=0.01).解答过程:(1)P (ξ<89)=F (89)=Φ(5.09089-)=Φ(-2)=1-Φ(2)=1-0.9772=0.0228.(2)由已知d 满足0.99≤P (ξ≥80),即1-P (ξ<80)≥1-0.01,∴P (ξ<80)≤0.01.∴Φ(5.080d-)≤0.01=Φ(-2.327).∴5.080d -≤-2.327.∴d ≤81.1635.故d 至少为81.1635.小结:(1)若ξ~N (0,1),则η=σμξ-~N (0,1).(2)标准正态分布的密度函数f (x )是偶函数,x<0时,f (x )为增函数,x>0时,f (x )为减函数.。
《概率》统计与概率PPT(频率与概率)
第五章 统计与概率
5.3 概率
5.3.4
频率与概率
- .
-1-
课标阐释
思维脉络
1.在具体情境中,了
解随机事件发生的
不确定性和频率的
稳定性.
2.正确理解概率的
意义,利用概率知
识正确理解现实生
活中的实际问题.
3.理解概率的意义
以及频率与概率的
区别.
4.通过该内容的学
习,培养逻辑推
700÷0.95≈1 789.
课堂篇探究学习
探究一
探究二
思维辨析
当堂检测
概率的应用——数学建模
典例为了估计水库中鱼的尾数,可以使用以下的方法:先从水库
中捕出2 000尾鱼,给每尾鱼做上记号,不影响其存活,然后放回水库.
经过适当的时间,让其和水库中的其他鱼充分混合,再从水库中捕
出500尾,查看其中有记号的鱼,有40尾,试根据上述数据,估计水库
194
500
470
(1)在上表中填上优等品出现的频率;
(2)估计该批乒乓球优等品的概率.
1 000
954
2 000
1 902
课堂篇探究学习
探究一
探究二
思维辨析
当堂检测
解:
抽取球数
优等品数
优等品出
现的频率
50
45
100
92
200
194
500
470
1 000
954
2 000
1 902
0.9
0.92
0.97
A.事件 C 发生的概率为
1
10
1
B.此次检查事件 C 发生的频率为10
高中数学知识点第十二章-概率与统计
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布. ②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm=,则k 的范围可以写为k=0,1,…,n.〕 ⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系. 设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n =+-+=+==--,即η~)(b a a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样.二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为n n 2211.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p +q = 1)⑷二项分布:∑=⋅-⋅=-np q pk n k n k E k n k)!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =(如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).S 阴=0.5S a =0.5+S。
人教A版高中数学必修三课件高一第三章概率.pptx
“甲、乙都抽到选择题”的情况有:(x1,x2),(x1,x3), (x2,x1),(x2,x3),(x3,x1),(x3,x2),共6种;“甲、乙都抽 到判断题”的情况有:(p1,p2),(p1,p1),共2种.
专题4 几何概型问题
若试验同时具有基本事件的无限性和每个事件发生的等
可能性两个特征,则此试验为几何概型,由于基本事件的个
数和结果的无限性,其概率就不能应用P(A)=
m n
求解,因此
需转化为几何度量(如长度、面积、体积等)的比值求解.
几何概型是新增内容,在高考中很少考查随机模拟,主 要涉及几何概型的概率求解问题,难度不会太大,题型可能 较灵活,涉及面可能较广.几何概型的三种类型分别为长度 型、面积型和体积型,在解题时要准确把握,要把实际问题 作合理的转化;要注意古典概型和几何概型的区别,正确地 选用几何概型解题.
(2)设身高为176 cm的同学被抽中为事件A. 从乙班10名同学中抽中两名身高不低于173cm的同学 有: (181,173),(181,176),(181,178),(181,179), (179,173),(179,176),(179,178),(178,173),(178,176), (176,173)共10个基本事件. 而事件A含有4个基本事件:(181,176),(179,176), (178,176),(176,173),所以P(A)=140=25.
[解析] (1)第二组的频率为1-(0.04+0.04+0.03+0.02 +0.01)×5=0.3,所以高为05.3=0.06.频率直方图如下:
高中数学 第5章 统计与概率 5.4 统计与概率的应用课件 b高一必修第二册数学课件
层
释 疑
就应该派小明参加.]
作 业
难
·
返 首 页
12/12/2021
第八页,共五十页。
情
课
境
2.从某批零件中随机抽出 40 个检查,发现合格产品有 36 个, 堂
导
小
学 则该批产品的合格率为( )
探
·
结 提
新 知
A.36%
B.72%
素 养
·
合
C.90%
D.25%
课
作 探 究
C
[
用
样
本
的
合
格率近
似
代
课
境
堂
导
2.如图所示,A 地到火车站共有两条
小
学
结
·
探 新
路径 L1 和 L2,现随机抽取 100 位从 A 地到
提 素
知
养
达火车站的人进行调查,调查结果如下:
·
合 作
所用时间(分钟) 10~20 20~30 30~40 40~50 50~60
课 时
探
究
选择 L1 的人数 6
12
18
12
12
分 层
释
导
小
学
结
·
探 新
提
某市准备实行阶梯电价,要求约 75%的居民用电量在第一阶梯 素
知
养
内,约 20%的居民用电量在第二阶梯内,约 5%的居民用电量在第三
合
作 阶梯内.
课 时
探
究
分
层
释
作
疑
业
难
·
返 首 页
12/12/2021
高考数学:专题九 第四讲 概率与统计课件
题型突破
第四讲
题型三
本 讲 栏 目 开 关
概率与统计的综合问题
解决概率与统计综合题的关键是要善于从文字语言或图形语言 中捕捉有用的信息,并将其转化为符号语言,因此,在复习时要留意概 率与统计综合题的新背景,夯实基础知识与方法,注重阅读理解能力 的培养,提高应用数学知识与方法分析问题、解决问题的能力.
本 讲 栏 目 开 关
统计结果的频率分布条形图如图所示,其中 120~130(包括 120 分但 不包括 130 分)的频率为 0.05,此分数段的人数为 5 人.
题型突破
(1)问各班被抽取的学生人数各为多少人? (2)求平均成绩;
第四讲
本 讲 栏 目 开 关
(3)在抽取的所有学生中,任取一名学生,求分数不低于 90 分的概率. 5 解 (1)由频率分布条形图知,抽取的学生总数为0.05=100 人.
题型突破
第四讲
例 1
一个袋中装有四个形状大小完全相同的球,球的编号分别为
1,2,3,4. (1)从袋中随机取两个球,求取出的球的编号之和不大于 4 的概率;
本 讲 栏 目 开 关
(2)先从袋中随机取一个球,该球的编号为 m,将球放回袋中,然后再 从袋中随机取一个球,该球的编号为 n,求 n<m+2 的概率.
X 每增加 10,Y 增加 5, X-70 X 故 Y=460+5× 10 = 2 +425. P(“发电量低于 490 万千瓦时或超过 530 万千瓦时”)
=P(Y<490 或 Y>530)=P(X<130 或 X>210) =P(X=70)+P(X=110)+P(X=220) 1 3 2 3 =20+20+20=10.
题型突破
解
精品高中数学专题:概率与统计
专题七 概率与统计第一讲 统计与统计案例1. 随机抽样抽样方法主要有简单随机抽样、系统抽样、分层抽样三种,这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值. 2. 总体分布的估计在研究总体时,常用样本的频率分布去估计总体分布.一般地,样本容量越大,这种估计就越精确. 3. 线性回归方程(1)对n 个样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其线性回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y ∑i =1nx 2i -n x2,a ^ =y -b ^x ,x 、y 分别是{}x i 、{}y i 的平均数.(2)相关系数r >0,表明两个变量正相关;r <0,表明两个变量负相关;|r |越接近于1,表明两个变量的线性相关性越强;|r |越接近于0,表明两个变量之间几乎不存在线性相关关系;|r |>0.75时,认为两变量有很强的线性相关关系. 4. 独立性检测的一般步骤(1)根据样本数据列出2×2列联表,假设两个变量无关系;(2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)比较K 2与临界值的大小关系作统计推断.1. (2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11B .12C .13D .14答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12(人). 2. (2013·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120答案 B解析 少于60分的学生人数600×(0.05+0.15)=120(人), ∴不少于60分的学生人数为480人.3. (2013·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组 乙组 9 0 9 x 2 1 5 y 8 7424已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8答案 C解析 由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10+x =15,x =5.又因9+15+10+y +18+245=16.8,所以y =8,故选C.4. (2012·湖南)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg答案 D解析 由于线性回归方程中x 的系数为0.85, 因此y 与x 具有正的线性相关关系,故A 正确.又线性回归方程必过样本点中心(x ,y ),因此B 正确.由线性回归方程中系数的意义知,x 每增加1 cm ,其体重约增加0.85 kg ,故C 正确. 当某女生的身高为170 cm 时,其体重估计值是58.79 kg ,而不是具体值,因此D 不正确. 5.运动员 第1次 第2次 第3次 第4次 第5次 甲 87 91 90 89 93 乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 答案 2 解析 x 甲=15(87+91+90+89+93)=90, x乙=15(89+90+91+88+92)=90, s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4, s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.题型一 抽样方法例1 (1)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15(2)某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )A .8B .11C .16D .10审题破题 系统抽样的特点是“等距”,分层抽样最重要的是“比例”. 答案 (1)C (2)A解析 (1)由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.(2)若设高三学生数为x ,则高一学生数为x 2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500, 解得x =1 600,故高一学生数为800,因此应抽取高一学生数为800100=8.反思归纳 (1)在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为Nn (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.(2)在分层抽样中,要求各层在样本中和总体中所占比例相同.变式训练1 (1)要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( )A .①简单随机抽样法,②系统抽样法B .①分层抽样法,②简单随机抽样法C .①系统抽样法,②分层抽样法D .①②都用分层抽样法 答案 B(2)防疫站对学生进行身体健康调查,采用分层抽样法抽取,某中学高三有学生1 600人,抽取一个容量为200的样本,已知女生比男生少抽10人,则该校的女生人数应该有________. 答案 760解析 设该校的女生为x 人,男生为(1 600-x )人,则按照分层抽样,各层的比例为2001 600=18,所以女生抽取x 8,男生抽取1 600-x 8,所以x8+10=1 600-x 8,解得x =760. 题型二 用样本估计总体例2 (2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比审题破题 (1)根据样本频率之和为1,求出参数a 的值;(2)根据频率分布直方图和平均值的计算公式,求出样本平均值;(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在[50,90)之间的人数,进而求解.解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为 100-(5+20+40+25)=10(人).反思归纳 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.方差较大的波动较大,方差较小的波动较小.变式训练2 (1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙答案 B解析由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x 甲<x乙,甲的中位数为20,乙的中位数为29,即m甲<m乙.(2)某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100)后,画出如图所示的频率分布直方图.观察图形的信息,回答下列问题:估计这次考试的及格率(60分及以上为及格)为________;平均分为________.答案75%71解析及格的各组的频率是(0.015+0.03+0.025+0.005)×10=0.75,即及格率约为75%;样本的均值为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,以这个分数估计总体的分数即得总体的平均分数约为71.题型三统计案例例3(1)根据上表可得线性回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为() A.63.6万元B.65.5万元C.67.7万元D.72.0万元(2)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20附:参考公式及数据①卡方统计量:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d);则下列说法正确的是( )A .有99%的把握认为环保知识测试成绩与专业有关B .有99%的把握认为环保知识测试成绩与专业无关C .有95%的把握认为环保知识测试成绩与专业有关D .有95%的把握认为环保知识测试成绩与专业无关审题破题 (1)可以通过回归直线过(x ,y )求出a ^,然后进行预报;(2)计算K 2,然后和临界值比较. 答案 (1)B (2)C解析 (1)∵x =4+2+3+54=72,y =49+26+39+544=42,又y ^=b ^x +a ^必过(x ,y ),∴42=72×9.4+a ^ ,∴a ^=9.1.∴线性回归方程为y ^=9.4x +9.1.∴当x =6时,y ^=9.4×6+9.1=65.5(万元). (2)K 2=40×(14×13-7×6)220×20×21×19≈4.912,3.841<K 2<6.635,所以有95%的把握认为环保知识测试成绩与专业有关.反思归纳 (1)线性回归分析中,回归直线过(x ,y )是解决问题的核心;(2)独立性检验问题要计算卡方值,和临界值比较,说明有多大把握认为两者有关系.变式训练3 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进(1)求线性回归方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解 (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y =16(90+84+83+80+75+68)=80,又b ^=-20,所以a ^=y -b ^x =80+20×8.5=250,从而线性回归方程为y ^=-20x +250. (2)设工厂获得的利润为L 元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.典例(12分)为调查某市学生百米运动成绩,从该市学生中按照男女生比例随机抽取50名学生进行百米测试,学习成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[13,14),第二组[14,15),…,第五组[17,18],如图是按上述分组方法得到的频率分布直方图.(1)设m,n表示样本中两个学生的百米测试成绩,已知m,n∈[13,14)∪[17,18],求事件“|m-n|>2”的概率;(2)根据有关规定,成绩小于16秒为达标.根据上表数据,能否在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?附:规范解答解(1)从频率分布直方图中可以看出,成绩在[13,14)的人数为50×0.04=2(人),设为a,b;成绩在[17,18]的人数为50×(1-0.38-0.34-0.18-0.04)=3(人),设为A,B,C.[2分] m,n∈[13,14)有ab一种情况;m,n∈[17,18]时有AB,AC,BC三种情况;m,n分别在[13,14)和[17,18]时有aA ,aB ,aC ,bA ,bB ,bC 六种情况,所有基本事件总数为10.[4分] 而事件“|m -n |>2”由6个基本事件即aA ,aB ,aC ,bA ,bB ,bC 组成.所以P (|m -n |>2)=610=35.[6分](2)依题意得到相应的2×2列联表如下:[9分]K 2=50×(24×12-6×8)232×18×30×20≈8.333.由于8.333>6.635,故在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”.故可以根据男女生性别划分达标的标准.[12分]评分细则 (1)计算出成绩在两个区间[13,14),[17,18]内的人数给1分,标记给1分;(2)列举基本事件不全扣1分;(3)卡方值计算正确得1分,和临界值比较得1分,写最后结论得1分.阅卷老师提醒 (1)频率分布直方图和概率的结合是高考考查的热点,解题时要审清题意,把握频率分布直方图所体现的频率分布或数字特征;(2)解决独立性检验问题,要先得到列联表,准确代入公式计算.1. 某校共有学生2 000名,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在( )A.24B .18C .16D .12答案 C解析 由2 000×0.19=380知二年级的学生人数为380+370=750,由于一年级的学生人数为373+377=750,于是三年级的学生人数为2 000-750-750=500,那么三年级应抽取的人数为500×642 000=16(人).2. (2012·山东)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是 ( )A .众数B .平均数C .中位数D .标准差答案 D解析 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.3. 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,设回归方程为y =b x +a ,则点(a ,b )在直线x +45y -10=0的( )A .左上方B .左下方C .右上方D .右下方答案 C解析 依题意得,x =18×(10+20+30+40+50+60+70+80)=45,y =18×(62+68+75+81+89+95+102+108)=85.注意到题中的每一组点(x ,y )均位于直线x +45y -10=0的右上方,因此点(a ^,b ^)必位于直线x +45y -10=0的右上方,故选C.4. 高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本.已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为________. 答案 20解析 由题意可知,可将学号依次为1,2,3,…,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为6+14=20.5. (2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)直方图中x 的值为 __________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.答案 (1)0.004 4 (2)70解析 (1)(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1, ∴x =0.004 4.(2)(0.003 6+0.004 4+0.006 0)×50×100=70.6. (2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5, 则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x -7|=3可得x =10或x =4. 由|x -7|=1可得x =8或x =6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.专题限时规范训练一、选择题1. (2013·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是 ( )A .这种抽样方法是一种分层抽样B .这种抽样方法是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数 答案 C 解析 x男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91, s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8, s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6. 2. (2013·湖南)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法答案 D解析 总体(100名学生)中的个体(男、女学生)有明显差异,应采用分层抽样. 3. 为了解一片大约10 000株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm 的树木大约有( )A .3 000株B .6 000株C .7 000株D .8 000株答案 C解析 底部周长小于110 cm 的频率为(0.01+0.02+0.04)×10=0.7,所以底部周长小于110 cm 的树木大约有10 000×0.7=7 000株,故选C.4. 如图是2013年歌手大奖赛中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1、a 2,则一定有( )A.a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2大小与m 的值有关答案 B解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.5. 假设学生初一和初二数学成绩是线性相关的.若10个学生初一(x )和初二(y )的数学分数则初一和初二数学分数间的线性回归方程是( )A.y ^=1.218 2x -14.192B.y ^=14.192x +1.218 2C.y ^=1.218 2x +14.192D.y ^=14.192x -1.218 2 答案 A 解析 因为x=71,∑i =110x 2i =50 520,y =72.3,∑i =110x i y i =51 467,所以,b ^=51 467-10×71×72.350 520-10×712≈1.218 2.a ^=72.3-1.218 2×71=-14.192 2,线性回归方程是:y ^=1.218 2x -14.192 2.6. (2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取( )A.08 B .07 C .02 D .01答案 D解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.7. 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3 答案 D解析 逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A 错;由0,0,0,0,0,0,0,0,2,8可知,B 错;由0,0,1,1,2,2,3,3,3,8可知,C 错.D 中x =2. (x 1-2)2+(x 2-2)2+…+(x 10-2)210=3.即(x 1-2)2+(x 2-2)2+…+(x 10-2)2=30.显然(x i -2)2≤30(i =1,2,…,10),x i ∈N *即x i ≤7.8. 有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72答案 B解析 由0.02+0.05+0.15+0.19=0.41, ∴落在区间[2,10)内的频率为0.41×2=0.82. ∴落在区间[10,12)内的频率为1-0.82=0.18.∴样本数据落在区间[10,12)内的频数为0.18×200=36. 二、填空题9. (2013·山东改编)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为________.答案 367解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0) =367. 10.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.11.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.答案 24 23解析 x 甲=110×(19+18+20+21+23+22+20+31+31+35)=24.x 乙=110×(19+17+11+21+24+22+24+30+32+30)=23.12.以下四个命题,其中正确的是________.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1 ;③在线性回归方程y ^=0.2x +12中,当解释变量x 每增加一个单位时,预报变量y ^平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量K 2(χ2)的值越小,“X 与Y 有关系”的把握程度越大. 答案 ②③解析 ①是系统抽样;对于④,随机变量K 2(χ2)的值越小,说明两个变量有关系的把握程度越小. 三、解答题13.(2013·安徽)为调查甲、乙两校高三年级学生某次联考的数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值.解 (1)设甲校高三年级学生总人数为n ,由已知条件 30n=0.05,则n =600. 在甲校高三年级抽取的30名学生中成绩在60分及60分以上的人数为25,因此甲校高三年级这次联考的及格率大约是2530=56=83.3%.(2)x 1=[(7+13+24+26+22+2)+40+50×4+60×9+70×9+80×5+90×2]÷30=1 04215;x 2=[(5+14+17+33+20)+40+50×3+60×10+70×10+80×5+90]÷30=2 06930.x 1-x 2=2 08430-2 06930=12.14.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率. 解 (1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,所以,经直观分析,收看新闻节目的观众与年龄是有关的.(2)从题中所给条件可以看出收看新闻节目的共45人,随机抽取5人,则抽样比为545=19,故大于40岁的观众应抽取27×19=3(人).(3)抽取的5名观众中大于40岁的有3人,在20岁到40岁的有2人,记大于40岁的人为a 1,a 2,a 3,20至40岁的人为b 1,b 2,则从5人中抽取2人的基本事件有(a 1,a 2),(a 1,a 3),(a 2,a 3),(b 1,b 2),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2)共10个,其中恰有1人为20至40岁的有6个,故所求概率为610=35.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
北京师范大学数学科学学院 李勇 Math_ly163
1
第二章 统计 2.1 随机抽样 2.2 用样本估计总体 2.3 变量间的相关关系 实习作业 小结
约16课时 约5课时 约5课时 约4课时 约1课时 约1课时
2
ቤተ መጻሕፍቲ ባይዱ
第三章 概率 3.1 随机事件的概率 3.2 古典概型 3.3 几何概型 小结
• 评价统计方法的好坏,属 于数理统计的研究范畴。
20
样本信息描述——频率直方图
1. 描述样本的数据 整体分布信息, 舍弃细节信息。
2. 是总体数据分布 的近似。
3. 制作时需要所有 样本数据。
4. 有随机性。 21
样本信息描述——茎叶图
1. 茎叶图保留了样本数据的所
08
有信息。
1 346 2. 能反映样本数据的分布信息。
• 反之,说明说明数据中存在可能较小 的极端值。
c) 误导:有意仅选取使用中位数或平 均值来描述数据的中心位置。
25
2. 样本标准差的意义和作用。
• 描述样本数据集中于样本
均值的程度。
• 简称为“离散程度”。x1
x
x2
•
•
有时解释成数据的稳定性。
样本标准差具有随机性,随 样本容量的增加而稳定于
式。P126 4. 几何概型——概率与区域的度量成比
例,必然事件的概率为1。P136 5. 随机模拟方法用于近似计算——几何
概型和频率近似概率的结合。P139
6. …… 10
➢增加的随机模拟、几何概
型等方面的内容
2.2.2 由直方图估计总体的数字特征 3.2.2 (整数值)随机数的产生 3.3 几何概型
8
➢通过实例理解概率统计概念
2. 通过现实生活中的实例理解概率的 基本概念。
a) 必然事件、不可能事件、随机事件— —天气、水稻生长例子。 P108
b) 概率——掷硬币实验中频率的稳定性。 P112
c) 几何概型——转盘游戏。P135
9
➢用概率观点解释统计原理
1. 游戏的公平性——等概率原则。P115 2. 豌豆实验——孟德尔遗传规律。P117 3. 古典概型——概率的规范性与加法公
2. 考虑到学生的学习心理,统计在前, 使得学生在学习统计的过程中体会 随机性,为学习概率知识做铺垫。
6
➢ 先讲古典概型后学排列组合
1. 重点是理解古典概型及其概率计 算公式的原理。
2. 排列组合的困难将影响模型原理 的学习,可能导致学习重心的偏 移。
3. 学习计数原理时,将古典概率的 计算作为一个应用,完全可以达 到以往教材的效果。
11
二、教学中应注意的问题 ➢统计部分 ➢概率部分
12
➢统计部分
13
学习统计的必要性
• 统计学是研究如何收集、整理、分析 数据的科学,它可以为人们制定决策 提供依据。
• 现代社会是信息化的社会,数字信息 随处可见,因此统计学就备受重视。
• 统计与概率的基础知识已经成为一个 未来公民的必备常识。
15
关心某城市高中生学生身高情 况,应该如何取总体?
• 该市所有在校高中生;
• 该市所有在校高中生的身高。
哪一总体的取法对?
16
随机抽样
核心问题:样本的代表性的好坏。
形象的比喻:品尝一锅汤的味道
在有限总体下: 好样本能够使得任何个体进入到样 本的概率大于0.
17
• 系统抽样特点:
1. 系统抽样比其他随机抽样方法更容 易施行,可节约抽样成本。
2 368
3. 茎叶图可以在现场随时制作, 3 389 不需要所有样本信息。
4
4. 由样本决定,有随机性。
51
22
样本信息描述——数字特征
1. 均值、中位数、众数的特点。 2. 样本标准差的意义和作用。
23
1. 均值、中位数、众数的特点
a) 都用于描述样本的中心位置,有随 机性,随样本容量的增加而稳定于 总体相应的总体特征。
3. 等比例抽样只是分层抽样中的一种。
了解每种抽样方法的优缺点,为了 使样本的代表性好,选择合适的抽 样方法以便得到对总体的较准确的 推断——这是学习抽样方法的目的。
19
确定抽样方法的原则
1. 各种特征个体都在样本中有代表。 2. 容易实施。
• 与数学方法的评价不同, 统计方法没有对错之分, 只有好坏之分。
• 平均数:描述数值变量的中心位置, 受样本中的每一个数据的影响。
• 中位数:描述数值变量的中心位置, 抗“坏”数据能力强,容易计算。
• 众数:描述分类变量的中心位置,容 易计算。
24
1. 均值、中位数、众数的特点
b) 综合利用均值和中位数获取样本信 息
• 如果样本均值大于样本中位数,说明 数据中可能存在较大的极端值。
7
➢通过案例理解概率统计概念
1. 通过案例传授统计思想。
a) 美国大选结果预测失败案例——方便 样本的弊病。 P55
b) 居民月均用水量案例——通过思考 “你认为3t这个标准一定能够保证85% 以上的居民用水不超标吗?”提出了 统计结论理解问题。P68
c) 人体的脂肪百分比与年龄案例——最 小二乘原理。P85
2. 有时在不知道总体中个体数目的情 况下,仍可应用系统抽样方法获取 样本。
3. 如果编号的个体特征随编号有一定 的周期性,可能会使系统抽样的代 表性很差。
18
• 分层抽样特点:
按照所 要调查 的量的 大小分 层。
1. 充分利用了已知的总体信息,得到的样本 比前两种方法有更好的代表性。
2. 可得到各个层的子样本以估计各个层的信 息。
14
统计学的特点
• 统计学是由局部推断总体,属于归纳 推理。数学是演绎推理。
• 统计方法归纳出的结论可能犯错误。 数学演绎推理的结论一定正确。
• 对于实际问题,有种种不同的统计解 决方法,这些方法只有好坏之分,没 有对错之分。数学结论只有对错之分。
• 评价统计方法的好坏,需要概率论和 数理统计的理论。创建新的统计方法, 需要良好的统计素质。
约8课时 约3课时 约2课时 约2课时 约1课时
3
一.与大纲教材的区别 二.教学中应注意的问题
4
一、与大纲教材的区别
➢先讲统计后讲概率 ➢先讲古典概型后学排列组合 ➢通过案例理解概率统计概念 ➢用概率观点解释统计原理 ➢增加了随机模拟、几何概型等方
面的内容
5
➢ 先讲统计后讲概率
1. 考虑到统计与概率学科发展的历是 先有统计,为了研究统计结论的可 信程度问题,概率得到了发展。