高一数学必修3《统计》公式总结以及例题

合集下载

高中数学必修3第一章《统计》小结与复习课件

高中数学必修3第一章《统计》小结与复习课件
16
(2)其频率分布直方图如下
频率/组距
0.07
0.06
0.05
0.04
0.03
0.02 0.01 o 122 126 130 134 138 142 146 150 154 158 身 高 ( cm )
(3)由样本频率分布表可知身高小于134cm 的男孩
出现的频率为0.04+0.07+0.08=0.19, 所以我们估计身高小于134cm的人数占总人数的19%.
1、相关关系
(1)概念:两个变量之间是不确定的随机关系, 但两个变量之间又有关系,称为相关关系。 (2)相关关系与函数关系的异同点。 相同点:两者均是指两个变量间的关系。 不同点:函数关系是一种确定关系,是一种因果 系;相关关系是一种非确定的关系,也不一定是因 果关系(但可能是伴随关系)。 (3)相关关系的分析方向。
22
本章小结与复习课 统计
高中数学必修3第一章统计
1
统计知识点
1、抽样方法。 (1)简单随机抽样(2)系统抽样(3)分层抽 样 2 表示数据的方法 (1)扇形图 (2)条形图(3)折线图(4)茎叶图 3、样本分布估计总体分布 (1)频率分布表(2)直方图 4、样本特征数估计总体特征数 (1)平均数 (2)方差 (3)众数 (4)中位数 5、线性回归方程。
在收集大量数据的基础上,利用统计分析,发现 规律,对它们的关系作出判断。
20
2、回归直线方程
(1)回归直线:观察散点图的特征,如果各 点大致分布在一条直线的附近,就称两个变量 之间具有线性相关的关系,这条直线叫做回归 直线。 (2)最小二乘法求线性回归方程的步骤: 1.列表、计算 2.代入公式求a,b。 3.写出直线方程。 (3)利用回归直线对总体进行估计

苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)

苏教版高中数学必修3第2章 统计 全章复习讲义(含答案解析)

【知识梳理】知识点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N ;在整个抽样过程中各个个体被抽到的概率为nN;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.【解析】由题意可得1011910,5x y ++++=22222(10)(10)(1010)(1110)(910)25x y -+-+-+-+-=,解得12,8.||4x y x y ==-=,故选D .例3. 对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300300~400400~500500~600个 数2030804030(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.【思路点拨】 通过本题可掌握总体分布估计的各种方法和步骤. 【解析】(1)频率分布表如下:寿命(h ) 频 数 频 率 累积频率 100~200 20 0.10 0.10 200~300 30 0.15 0.25 300~400 80 0.40 0.65 400~500 40 0.20 0.85 500~600 30 0.15 1 合 计2001(2)频率分布直方图如下:(3)由累积频率分布图可以看出,寿命在100~400 h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义.举一反三:【变式1】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40.【变式2】某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数 2 5 6)分数段[100,110)[110,120 [120,130)人数8 12 6分数段[130,140)[140,150)人数 4 2那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_______、_______(精确到0.01). 【答案】0.18 0.47【解析】由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47【变式3】为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品为13件,次品4件 (1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计商品为二级品或三级品的概率约是多少? 【解析】(1)样本的频率分布表为产品频数频率 一级品 5 0.17 二级品 8 0.27 三级品 13 0.43 次品40.13(2)样本频率分布的条形图为:(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.例4.甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组类型三:变量的相关性和回归分析例5.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:广告支出x(单位:万元) 1 2 3 4销售收入y(单位:万元)12 28 42 56(1) 画出表中数据的散点图;(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?【解析】(1)作出的散点图如下图所示(2)观测散点图可知各点大致分布在一条直线附近,由此可知散点图大致表现为线性相关.列出下表:序号 x y X 2xy 1 1 12 1 12 2 2 28 4 56 3 3 42 9 126 44 56 16 224 ∑1013830418易得569,22x y ==所以 414222156944184732255304()42i ii ii x y xyb xx ==--⨯⨯===-⨯-∑∑ 697352252a y bx =-=-⨯=- 故y 对x 的回归直线方程为73ˆ25yx =- (3)当x=9时, 73ˆ92129.45y=⨯-= 012 3 4x(万元)Y(万元)1020 30 40 50 60 .. . .08.0423.15=⨯-=-=bx y a .∴线性回归方程为:08.023.1^+=+=x a bx y .(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元.【变式2】一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间有如下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 y 2.25 2.37 2.40 2.55 2.64 2.75 x 1.59 1.68 1.80 1.87 1.98 2.07 y 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月总成本y 与月产量x 之间的回归直线方程. 【解析】(1)画出散点图:(2)设回归直线方程a bx y+=ˆ, 利用计算a ,b ,得b ≈1.215, 974.0ˆ≈-=+=x b y a bx y,从中抽取一个容量为100的样本,较为恰当的抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.以上三种均可3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( ) A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4.下列说法错误的是 ( )A .在统计里,把所需考察对象的全体叫做总体B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大5.要从已编号(160:)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,486. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6 h B.0.9 h C.1.0 h D.1.5 h7.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x ,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )A .0.9,35B .0.9,45C .0.1,35D .0.1,458.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( ) A .48米B .49米C .50米D .51米9.用系统抽样法要从160名学生抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为126,则第一组中抽签方法确定的号码是________.10.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数1231031则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的 %.11.某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为 . 12.甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下甲 6 8 9 9 8乙 10 7 7 7 9则两人射击成绩的稳定程度是__________________.13.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:组别频数频率145.5~149.5 1 0.02149.5~153.5 4 0.08153.5~157.5 20 0.40157.5~161.5 15 0.30161.5~165.5 8 0.16165.5~169.5 m n合计M Nm n M N所表示的数分别是多少?(1)求出表中,,,(2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?14.从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班76 74 82 96 66 76 78 72 52 68乙班86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.15.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?16.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为2150m 时的销售价格.【答案与解析】1.【答案】B 【解析】∵n40=0.125,∴n=320.故选B. 2. 【答案】C 3. 【答案】C 【解析】剔除零头 4. 【答案】B【解析】平均数不大于最大值,不小于最小值 5. 【答案】B 【解析】60106=,间隔应为10 6. 【答案】B 【解析】505.020)5.11(1025⨯++⨯+⨯=0.9.7.【答案】A【解析】由图知,成绩小于17秒的学生人数占全班总人数的频率为0.020.180.360.340.9+++=, 所以0.9x =;成绩大于等于15秒且小于17秒的的频率为0.360.340.7+=,104416461451222222=++++=)(甲s 5627313751222222=++++=)(乙s ∵ 22乙甲乙甲,s s x x >>∴ 甲的平均成绩较好,乙的各门功课发展较平衡16.【解析】(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx , 308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=), 则1962.01570308≈==xx xyl l b 8166.115703081092.23≈⨯-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y )(3)据(2),当2150x m =时,销售价格的估计值为: 2466.318166.11501962.0=+⨯=y )(万元)。

高中必修三统计知识点整理20190607191608

高中必修三统计知识点整理20190607191608
例:请调查你所在的学校的学生做喜欢的体育活动情况。
4.随机数表法:
例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
2.1.2系统抽样
1.系统抽样(等距抽样或机械抽样):
把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的 办法抽取。
K(抽样距离)二N(总体规模)/n(样本规模)
2.简单随机抽样常用的方法:
(1)抽签法; ⑵随机数表法; ⑶计算机模拟法; ⑷ 使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑: ①总体变异情况; ② 允许误差范围; ③概率保证程度。
3.抽签法:
(1)给调查对象群体中的每一个对象编号;
(2)准备抽签的工具,实施抽签
(3)对样本中的每一个个体进行测量或调查
例2某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具实施
解 (1)将每个人随机编一个号由0001至1003.
(2)利用随机数法找到3个号将这3名工人剔除.
⑶将剩余的1 000名工人重新随机编号由0 001至1000.
1 000
(4)分段,取间际10=100将总体均分为
(5)从第一段即为0001号到0100号中随机抽取一个号I.
如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估 计精度。
2.1.3分层抽样
1.分层抽样(类型抽样)
先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用 简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
(6)按编号将1,100+I,200+1,,,900+I共10个号码选出 这10个号码所对应的工人组成样本.

高考统计公式知识点总结

高考统计公式知识点总结

高考统计公式知识点总结统计学是一门研究数据收集、分析和解释的学科,其应用广泛而深入。

在高中阶段,学生们接触到的统计学知识主要集中在一些基本的统计公式上。

这些公式在高考中经常出现,对于顺利完成数学考试至关重要。

下面是对高考统计公式知识点的一些总结,希望对广大考生有所帮助。

1.概率概率是统计学中的一个重要概念,表示某个事件发生的可能性。

常用的概率公式包括:- 事件的概率公式:P(A) = n(A) / n(S),其中P(A)表示事件A发生的概率,n(A)表示事件A包含的基本事件数,n(S)表示样本空间中的基本事件数。

- 对立事件的概率公式:P(A') = 1 - P(A),其中A'表示事件A的对立事件。

2.排列组合排列组合是统计学中另一个重要概念,用于计算有关事物的不同排列或组合方式的个数。

常用的排列组合公式包括:- 排列公式:A(n, m) = n! / (n-m)!,表示从n个元素中取出m个元素进行排列的方式总数。

- 组合公式:C(n, m) = n! / (m!(n-m)!),表示从n个元素中取出m个元素进行组合的方式总数。

3.均值和标准差均值和标准差是描述一组数据分布特征的指标。

常用的计算公式包括:- 均值公式:μ = (x1 + x2 + ... + xn)/ n,其中μ表示均值,x表示数据的观测值,n表示数据的总数。

- 标准差公式:σ = √( (x1 - μ)² + ... + (xn - μ)² )/ n,其中σ表示标准差。

4.正态分布正态分布是一种常见的概率分布,其形状呈钟形曲线,对于统计学的许多问题具有重要的应用。

正态分布的概率可以通过标准正态分布表来查找,也可以利用相关的计算公式计算。

在高考中,统计学是数学考试的一个重要组成部分。

掌握以上提到的统计公式,对于正确理解和解答与统计学有关的问题至关重要。

考生可以通过多做一些相关的题目,熟悉这些公式的应用,提升自己的解题能力,在考试中取得好成绩。

高中必修三统计知识点整理

高中必修三统计知识点整理

v1.0可编写可改正必修 3 知识点总结—统计简单随机抽样1.简单随机抽样,也叫纯随机抽样。

就是从整体中不加任何分组、划类、排队等,完整随机地抽取检查单位。

特色是:每个样本单位被抽中的可能性同样(概率相等),样本的每个单位完整独立,相互间无必定的关系性和排挤性。

简单随机抽样是其它各样抽样形式的基础。

往常不过在整体单位之间差异程度较小和数目较少时,才采纳这类方法。

2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①整体变异状况;②同意偏差范围;③概率保证程度。

3.抽签法 :(1)给检核对象集体中的每一个对象编号;(2)准备抽签的工具,实行抽签(3)对样本中的每一个个体进行丈量或检查例:请检查你所在的学校的学生做喜爱的体育活动状况。

4.随机数表法:例:利用随机数表在所在的班级中抽取10 位同学参加某项活动。

系统抽样1.系统抽样(等距抽样或机械抽样):把整体的单位进行排序,再计算出抽样距离,而后依据这一固定的抽样距离抽取样本。

第一个样本采纳简单随机抽样的方法抽取。

K(抽样距离) =N(整体规模) /n (样本规模)前提条件:整体中个体的摆列对于研究的变量来说,应是随机的,即不存在某种与研究变量有关的规则散布。

能够在调查同意的条件下,从不一样的样本开始抽样,对照几次样本的特色。

假如有明显差异,说明样本在整体中的散布承某种循环性规律,且这类循环和抽样距离重合。

2.系统抽样,即等距抽样是实质中最为常用的抽样方法之一。

因为它对抽样框的要求较低,实行也比较简单。

更为重要的是,假如有某种与检查指标有关的协助变量可供使用,整体单元按协助变量的大小次序排队的话,使用系统抽样能够大大提升估计精度。

分层抽样1.分层抽样(种类抽样):先将整体中的全部单位依据某种特色或标记(性别、年纪等)区分红若干种类或层次,而后再在各个种类或层次中采纳简单随机抽样或系用抽样的方法抽取一个子样本,最后,将这些子样本合起来构成整体的样本。

高一数学 (人教版必修3):第三章 统计 Word版含解析

高一数学 (人教版必修3):第三章 统计 Word版含解析

重点列表:重点 名称重要指数 重点1 频率分布直方图 ★★★★ 重点2 茎叶图 ★★★ 重点3抛物线★★★★重点详解:用样本的频率分布估计总体分布(1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________估计总体的__________;另一种是用样本的________估计总体的__________.(2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用________________表示.各小长方形的面积总和等于________.(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布________.随着样本容量的增加,作图时所分的________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________________,它能够更加精细地反映出____________________________________.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以____________________,而且可以______________,给数据的记录和表示都带来方便.【参考答案】(1)频率分布 分布 数字特征 数字特征 (2)频率组距 各小长方形的面积 1 (3)折线图 组数 总体密度曲线 总体在各个范围内取值的百分比 (4)保留所有信息 随时记录重点1:频率分布表、频率分布直方图及其应用 【要点解读】用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.【考向1】根据数据画出频率分布直方图【例题】某市2013年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成下列频率分布表、频率分布直方图;频率分布表分组频数频率41,51)51,61)61,71)71,81)81,91)91,101)101,111)频率分布直方图(2)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解:(1)如图所示:频率分布表分组频数频率41,51) 2 230 51,61) 1 130 61,71) 4 430 71,81) 6 630 81,91) 10 1030 91,101) 5 530 101,111)2230(2)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115,有26天处于良的水平,占当月天数的1315,处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115,污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%,说明该市空气质量有待进一步改善.【评析】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、轻微污染、轻度污染的天数;对于开放性问题的解答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论.本题主要考查运用统计知识解决简单实际问题的能力、数据处理能力和应用意识. 【考向2】频率分布直方图的逆用【例题】某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)50,60, [)60,70,[)70,80,[)80,90,[]90,100.(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生的语文成绩在某些分数段的人数(x )与数学成绩在相应分数段的人数(y )之比如下表所示,求数学成绩在[)50,90之外的人数.分数段[)50,60 [)60,70 [)70,80 [)80,90x ∶y1∶12∶13∶44∶5解:(1)由()2a +×10=1, 解得a =0.005.(2)=0.05×55+0.4×65+0.3×75+0.2×85+0.05×95=73.(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段 50,60) 60,70) 70,80) 80,90)x 5 40 30 20 x ∶y 1∶1 2∶1 3∶4 4∶5 y5204025于是数学成绩在50重点2:茎叶图 【要点解读】茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 【考向1】根据茎叶图求方差【例题】以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.如果X =8,求乙组同学植树棵数的平均数和方差;注:方差s2=1n(x1-)2+(x2-)2+…+(x n-)2],其中x为x1,x2,…,x n的平均数.解:当X=8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数为=8+8+9+104=354;方差为s2=14⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫9-3542+⎝⎛⎭⎪⎫10-3542]=1116.【考向2】根据茎叶图求平均数【例题】某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.179201 530(1)根据茎叶图计算样本平均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人?难点列表:难点名称难度指数难点1 用样本的数字特征估计总体的数字特征★★★★难点2导数与函数的极值、最值★★★难点详解:用样本的数字特征估计总体的数字特征(1)众数,中位数,平均数众数:在一组数据中,出现次数________的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的________)叫做这组数据的中位数.平均数:样本数据的算术平均数,即=_______.在频率分布直方图中,中位数左边和右边的直方图的面积应该________. (2)样本方差,样本标准差 标准差s =])()()[(122221x x x x x x nn -+⋯+-+-,其中x n 是__________________,n 是________,是________.标准差是反映总体__________的特征数,________是样本标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.【答案】 (1)最多 平均数 1n(x 1+x 2+…+x n ) 相等(2)样本数据的第n 项 样本容量 平均数 波动大小 样本方差难点1:用样本的数字特征估计总体的数字特征 【要点解读】能从一组数据中求出中位数、平均数和众数 【考向1】平均数、中位数【例题】某汽车制造厂分别从A ,B 两种轮胎中各随机抽取了8个进行测试,列出了每一个轮胎行驶的最远里程数(单位:1000 km): 轮胎A 96 11297108100103 86 98轮胎B 108 101 94 105 9693 97 106(1)分别计算A ,B 两种轮胎行驶的最远里程的平均数、中位数; (2)分别计算A ,B 两种轮胎行驶的最远里程的极差、标准差; (3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?(2)A 轮胎行驶的最远里程的极差为:112-86=26, 标准差为:s =8)2()14(308)3(12)4(22222222-+-++++-++-=2212≈7.43; B 轮胎行驶的最远里程的极差为:108-93=15, 标准差为:s =86)3()7()4(5)6(1822222222+-+-+-++-++=1182≈5.43. (3)虽然A 轮胎和B 轮胎的最远行驶里程的平均数相同,但B 轮胎行驶的最远里程的极差和标准差相对于A 轮胎较小,所以B 轮胎性能更加稳定.【评析】在理解平均数、中位数、众数、极差、标准差、方差的统计意义和数学表达式的情况下,不难作出解答. 【考向2】平均数、标准差【例题】某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4. 则(1)平均命中环数为____________; (2)命中环数的标准差为____________.难点2:根据频率分布直方图计算样本的数字特征【要点解读】会从频率分布直方图中求出中位数、平均数和众数【考向1】中位数【例题】如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,可知其中位数为( )A.12.5 B.13C.13.5 D.14【答案】 B【考向2】平均数【例题】某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.组别月用电量频数统计频数频率①0,20)②20,40)正正③40,60)正正正正④60,80)正正正正正⑤80,100)正正正正⑥100,120](1)完成频率分布表并绘制频率分布直方图;(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a. 解] (1)组别月用电量频数统计频数频率①0,20)40.04②20,40)正正120.12③40,60)正正正正240.24④60,80)正正正正正正300.30⑤80,100)正正正正正250.25⑥100,120]正50.05(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:分组0,20)20,40)40,60)60,80)80,100)100,120] 频率0.040.120.240.300.250.05累计频率0.040.160.400.700.95 1.00由此可知临界值a应在区间80,100)内,且频率分布直方图中,在临界值a左侧小矩形的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.【趁热打铁】1.容量为20的样本数据,分组后的频数如下表:分组10,20)20,30) 30,40) 40,50) 50,60) 60,70)频数2 3 4 5 4 2A.0.35 B.0.45C.0.55 D.0.652.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则( )A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<3.某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数4.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2A .30%B .10%C .3%D .不能确定5.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为m 甲,m 乙,则( )甲乙8 6 5 0 8 8 4 0 0 1 0 2 87 5 2 2 0 2 3 3 7 8 0 0 3 1 2 4 4 8 3 1 4 2 3 8A.甲<乙,m 甲>m 乙 B .甲乙甲乙C .甲>乙,m 甲>m 乙 D .甲>乙,m 甲<m 乙6.样本(x 1,x 2,…,x n )的平均数为,样本(y 1,y 2,…,y m )的平均数为y (≠y ),若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数=α+(1-α) y ,其中0<α<12,则n ,m 的大小关系为( ) A .n <mB .n >mC .n =mD .不能确定7.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下.中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为________和________.甲乙9 8 1 9 7 10 1 3 2 0 2 1 4 2 41 1 5 3 02 08.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5],样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.9.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.10.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.23.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?第三章1解:由频率分布表可知:样本数据落在区间10,40)内的频数为2+3+4=9,样本总数为20,故样本数据落在区间10,40)的频率为920=0.45.故选B.2解:中位数为5.5,众数为5,平均值为17930.故选D.3解:这种抽样方法为简单随机抽样,该班这五名男生成绩的平均数为86+94+88+92+905=90,方差为15(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8;该班这五名女生成绩的平均数为 88+93+93+88+935=91,方差为15(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.故选C.5解:易知甲=21.5625,乙=28.5625,m 甲=20,m 乙=29,∴甲<乙,m 甲<m 乙.故选B. 6解:∵x 1+x 2+…+x n =n ,y 1+y 2+…+y m =m y ,∴x 1+x 2+…+x n +y 1+y 2+…+y m =(m +n ) =(m +n )α+(1-α)y ] =(m +n )α+(m +n )(1-α)y , ∴n +m y =(m +n )α+(m +n )(1-α)y .∴⎩⎪⎨⎪⎧n =(m +n )α,m =(m +n )(1-α). 故n -m =(m +n )α-(1-α)]=(m +n )(2α-1). ∵0<α<12,∴2α-1<0.∴n -m <0,即n <m .故选A.7解:设甲、乙在这10天中日加工零件的平均数分别为a ,b ,则a =20+-1-2+0+1+3+2+0+11+11+1510=24,b =20+-1-3-9+1+4+2+4+10+12+1010=23.故填24;23.8解:平均气温低于22.5℃的城市所占频率为最左边两个矩形面积之和,即0.10×1+0.12×1=0.22,又其频数为11,故总城市数为110.22=50,故样本中平均气温不低于25.5℃的城市共有50×0.18=9(个). 故填9.9解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.10解:(1)计算得A=2.3, B=1.6,从计算结果来看,A药的疗效更好.(2)从以上茎叶图可以看出,A药疗效的试验结果有10的叶集中在茎2,3上,而B药疗效的试验结果有710的叶集中在茎0,1上,由此可看出A药的疗效更好.。

高一数学必修三之统计(2021年整理)

高一数学必修三之统计(2021年整理)

高一数学必修三之统计(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高一数学必修三之统计(word 版可编辑修改))的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高一数学必修三之统计(word版可编辑修改)的全部内容。

高一数学必修三之统计一:选择题:1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a , 中位数为b ,众数为c ,则有( )A . c b a >>B .a c b >>C .b a c >>D .a b c >>2.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( ) A .3.5 B .3- C .3 D .5.0- 3.要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,48 4组号 1 2 3 4 5 6 7 8 频数 10 13 x 14 15 13 12 9A .14和0.14B .0.14和14C .141和0.14 D . 31和1415.一个容量为40的样本数据分组后组数与频数如下:[25,25。

3),6;[25。

3,25。

6),4;[25.6, 25。

9),10;[25.9,26.2),8;[26.2,26.5),8;[26。

高一数学必修3知识点总结及典型例题解析(公式)新选.

高一数学必修3知识点总结及典型例题解析(公式)新选.

新课标必修3概率部分知识点总结◆ 事件:随机事件( random event ),确定性事件: 必然事件( certain event )和不可能事件( impossible event )❖ 随机事件的概率(统计定义):一般的,如果随机事件 A 在n 次实验中发生了m 次,当实验的次数n 很大时,我们称事件A 发生的概率为()nm A P ≈ 说明:① 一个随机事件发生于具有随机性,但又存在统计的规律性,在进行大量的重复事件时某个事件是否发生,具有频率的稳定性 ,而频率的稳定性又是必然的,因此偶然性和必然性对立统一 ② 不可能事件和确定事件可以看成随机事件的极端情况 ③ 随机事件的频率是指事件发生的次数和总的试验次数的比值,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这个摆动的幅度越来越小,而这个接近的某个常数,我们称之为概事件发生的概率 ④ 概率是有巨大的数据统计后得出的结果,讲的是一种大的整体的趋势,而频率是具体的统计的结果 ⑤ 概率是频率的稳定值,频率是概率的近似值♦ 概率必须满足三个基本要求:① 对任意的一个随机事件A ,有()10≤≤A P② ()()0,1,=Φ=ΩΦΩP P 则有可能事件分别表示必然事件和不和用③如果事件()()()B P A P B A P B A +=+:,则有互斥和⌧ 古典概率(Classical probability model ):① 所有基本事件有限个 ② 每个基本事件发生的可能性都相等 满足这两个条件的概率模型成为古典概型如果一次试验的等可能的基本事件的个数为个n ,则每一个基本事件发生的概率都是n1,如果某个事件A 包含了其中的m 个等可能的基本事件,则事件A 发生的概率为 ()nm A P = ⍓ 几何概型(geomegtric probability model ):一般地,一个几何区域D 中随机地取一点,记事件“改点落在其内部的一个区域d 内”为事件A ,则事件A 发生的概率为()的侧度的侧度D d A P = ( 这里要求D 的侧度不为0,其中侧度的意义由D 确定,一般地,线段的侧度为该线段的长度;平面多变形的侧度为该图形的面积;立体图像的侧度为其体积 )几何概型的基本特点:① 基本事件等可性 ② 基本事件无限多颜老师说明:为了便于研究互斥事件,我们所研究的区域都是指的开区域,即不含边界,在区域D 内随机地取点,指的是该点落在区域D 内任何一处都是等可能的,落在任何部分的可能性大小只与该部分的侧度成正比,而与其形状无关。

高中数学必修三 计数,概率,统计与分布列知识梳理 含答案

高中数学必修三 计数,概率,统计与分布列知识梳理 含答案

计数,概率,统计与分布列知识梳理10.1分类加法计数原理与分步乘法计数原理1.分类加法计数原理完成一件事,可以有n类办法,在第一类办法中有m1种方法,在第二类办法中有m2种方法,……,在第n类办法中有m n种方法.那么,完成这件事共有_____________种方法.(也称加法原理)2.分步乘法计数原理完成一件事需要经过n个步骤,缺一不可,做第一步有m1种方法,做第二步有m2种方法,……,做第n步有m n种方法.那么,完成这件事共有__________________种方法.(也称乘法原理) 3.分类加法计数原理与分步乘法计数原理,都涉及完成一件事的不同方法的种数.它们的区别在于:分类加法计数原理与分类有关,各种方法相互独立,用其中的任一种方法都可以完成这件事;分步乘法计数原理与分步有关,各个步骤相互依存,只有各个步骤都完成了,这件事才算完成.[方法与技巧]1.分类加法和分步乘法计数原理,都是关于做一件事的不同方法的种数的问题,区别在于:分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中任何一种方法都可以做完这件事;分步乘法计数原理针对“分步”问题,各个步骤相互依存,只有各个步骤都完成了才算完成这件事.2.分类标准要明确,做到不重复不遗漏.3.混合问题一般是先分类再分步.4.要恰当画出示意图或树状图,使问题的分析更直观、清楚,便于探索规律.[失误与防范]1.切实理解“完成一件事”的含义,以确定需要分类还是需要分步进行.2.分类的关键在于要做到“不重不漏”,分步的关键在于要正确设计分步的程序,即合理分类,准确分步.3.确定题目中是否有特殊条件限制.10.2排列与组合1.排列与组合的概念2.(1)排列数的定义:从n个不同元素中取出m(m≤n)个元素的_________的个数叫作从n个不同元素中取出m个元素的排列数,用A m n表示.(2)组合数的定义:从n个不同元素中取出m(m≤n)个元素的_________的个数,叫作从n个不同元素中取出m个元素的组合数,用C m n表示.3.排列数、组合数的公式及性质1.对于有附加条件的排列、组合应用题,通常从三个途径考虑:(1)以元素为主考虑,即先满足特殊元素的要求,再考虑其他元素;(2)以位置为主考虑,即先满足特殊位置的要求,再考虑其他位置;(3)先不考虑附加条件,计算出排列数或组合数,再减去不符合要求的排列数或组合数.2.排列、组合问题的求解方法与技巧:(1)特殊元素优先安排;(2)合理分类与准确分步;(3)排列、组合混合问题先选后排;(4)相邻问题捆绑处理;(5)不相邻问题插空处理;(6)定序问题排除法处理;(7)分排问题直排处理;(8)“小集团”排列问题先整体后局部;(9)构造模型;(10)正难则反,等价条件.[失误与防范]求解排列与组合问题的三个注意点:(1)解排列与组合综合题一般是先选后排,或充分利用元素的性质进行分类、分步,再利用两个原理做最后处理.(2)解受条件限制的组合题,通常用直接法(合理分类)或间接法(排除法)来解决,分类标准应统一,避免出现重复或遗漏.(3)对于选择题要谨慎处理,注意等价答案的不同形式,处理这类选择题可采用排除法分析选项,错误的答案都有重复或遗漏的问题.10.3二项式定理1.二项式定理(1)0≤r≤n时,C r n与C n-r的关系是______n(2)二项式系数先增后减________最大当n为偶数时,第_____项的二项式系数最大,最大值为__;当n为奇数时,第____项和_______项的二项式系数最大,最大值为______和_____(3)各二项式系数和:C0n+C1n+C2n+…+C n n=____,C0n+C2n+C4n+…=C1n+C3n+C5n+…=____【知识拓展】二项展开式形式上的特点(1)项数为______(2)各项的次数都等于二项式的幂指数n,即a与b的指数的和为n.(3)字母a按_____排列,从第一项开始,次数由n逐项减1直到零;字母b按_____排列,从第一项起,次数由零逐项增1直到n.,___(4)二项式的系数从____,C1n,一直到C n-1n[方法与技巧]1.通项T r+1=C r n a n-r b r是(a+b)n的展开式的第r+1项,而不是第r项,这里r=0,1,…,n.2.二项式系数与项的系数是完全不同的两个概念.二项式系数是指C0n,C1n,…,C n n,它只与各项的项数有关,而与a,b的值无关;而项的系数是指该项中除变量外的常数部分,它不仅与各项的项数有关,而且也与a,b的值有关.3.因为二项式定理中的字母可取任意数或式,所以在解题时根据题意,给字母赋值,是求解二项展开式各项系数和的一种重要方法.4.运用通项求展开式的一些特殊项,通常都是由题意列方程求出r,再求所需的某项;有时需先求n,计算时要注意n和r的取值范围及它们之间的大小关系.[失误与防范]1.项的系数与a、b有关,二项式系数只与n有关,大于0.2.求二项式所有系数的和,可采用“赋值法”.3.关于组合式的证明,常采用“构造法”——构造函数或构造同一问题的两种算法.4.展开式中第r+1项的二项式系数与第r+1项的系数一般是不相同的,在具体求各项的系数时,一般先处理符号,对根式和指数的运算要细心,以防出错.11.1随机抽样1.抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行_________,获取数据,并以此对调查对象的某项指标作出_______,这就是抽样调查.(2)总体和样本调查对象的______称为总体,被抽取的_______称为样本.(3)抽样调查与普查相比有很多优点,最突出的有两点:①______________;②节约人力、物力和财力.2.简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率______(2)通常采用的简单随机抽样的方法:__________________3.分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样系统抽样是将总体中的个体进行编号,_______分组,在第一组中按照___________抽取第一个样本,然后按____________ (称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机械抽样.[方法与技巧]1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.[失误与防范]进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠.(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.\11.2统计图表,用样本估计总体1.统计图表统计图表是_____和_____数据的重要工具,常用的统计图表有____________,______________,______________,______________等.2.数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数_____的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在_______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x=________________在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(2)样本方差、标准差标准差s=______________________________其中x n是样本数据的第n项,n是___________,x是________标准差是刻画数据的离散程度的特征数,样本方差是标准差的____.通常用样本方差估计总体方差,当____________________时,样本方差很接近总体方差.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用_____________________________,另一种是用____________________________(2)在频率分布直方图中,纵轴表示______,数据落在各小组内的频率用______________表示,各小长方形的面积总和等于____.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的_____开始,用线段依次连接各个矩形的__________,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且___________,方便表示与比较.[方法与技巧]1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x +b,方差为a2s2.[失误与防范]频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.11.3变量间的相关关系,统计案例1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的_______(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为_______(3)在两个变量x和y的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是__________的,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是___________的.如果所有的点在散点图中没有显示任何关系,则称变量间是__________ 2.线性回归方程(1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是所要求的直线,这种方法称为最小二乘法.(2)线性回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的线性回归方程,其中a ,b 是待定参数.⎩⎪⎨⎪⎧ b =∑n i =1 (x i -x )(y i -y )∑n i =1 (x i -x )2=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2,a =y -b x .3.回归分析(1)定义:对具有________的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )中,________称为样本点的中心.(3)相关系数①r =∑ni =1 (x i -x )(y i -y )∑n i =1 (x i -x )2∑n i =1(y i -y )2=∑ni =1x i y i -n x y(∑n i =1x 2i -n x 2)(∑n i =1y 2i -n y 2);②当r >0时,表明两个变量_______;当r <0时,表明两个变量_________当r =0时,表明两个变量_________.r 的绝对值越接近于1,表明两个变量之间的线性相关程度_______.r 的绝对值越接近于0,表明两个变量之间的线性相关程度越低.4.独立性检验设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1;2×2列联表:构造一个随机变量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B没有关联的;当χ2>2.706时,有90%的把握判定变量A,B有关联;当χ2>3.841时,有95%的把握判定变量A,B有关联;当χ2>6.635时,有99%的把握判定变量A,B有关联.[方法与技巧]1.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.2.根据χ2的值可以判断两个分类变量有关的可信程度.[失误与防范]1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.2.独立性检验中统计量χ2的值的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.12.1随机事件的概率1.随机事件和确定事件(1)在条件S下,一定会发生的事件,叫作相对于条件S的_____________(2)在条件S下,一定不会发生的事件,叫作相对于条件S_____________(3)___________________________统称为相对于条件S的确定事件.(4)______________________________的事件,叫作相对于条件S的随机事件.(5)___________和____________统称为事件,一般用大写字母A,B,C…表示.2.频率与概率在相同的条件下,大量重复进行同一试验时,随机事件A发生的频率会在某个常数附近摆动,即随机事件A发生的频率具有_______.这时,我们把_______叫作随机事件A的概率,记作P(A).3.事件的关系与运算互斥事件:在一个随机试验中,我们把一次试验下发生的两个事件A与B称作互斥事件.事件A+B:事件A+B发生是指事件A和事件B______________________对立事件:不会______发生,并且___________发生的事件是相互对立事件.4.概率的几个基本性质(1)概率的取值范围:________________(2)必然事件的概率P(E)=____(3)不可能事件的概率P(F)=____(4)互斥事件概率的加法公式①如果事件A与事件B互斥,则P(A+B)=________________②若事件A与事件A互为对立事件,则P(A)=______________.[知识拓展]互斥事件与对立事件的区别与联系互斥事件与对立事件都是两个事件的关系,互斥事件是不能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生,因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件.[方法与技巧]1.对于给定的随机事件A,由于事件A发生的频率f n(A)随着试验次数的增加稳定于_________, 因此可以用频率f n(A)来估计概率P(A).2.从集合角度理解互斥事件和对立事件从集合的角度看,几个事件彼此互斥,是指由各个事件所含的结果组成的集合彼此的交集为______,事件A的对立事件A所含的结果组成的集合,是全集中由事件A所含的结果组成的集合的_______.[失误与防范]1.正确认识互斥事件与对立事件的关系:对立事件是互斥事件,是互斥事件中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的__________条件.2.需准确理解题意,特别留心“至多……”“至少……”“不少于……”等语句的含义.12.2古典概型1.基本事件的特点(1)任何两个基本事件是_______的;(2)任何事件(除不可能事件)都可以表示成_____________的和.2.古典概型具有以下两个特点的概率模型称为古典的概率模型,简称古典概型.(1)试验的所有可能结果_____________,每次试验只出现其中的一个结果;(2)每一个试验结果出现的可能性__________3.如果一次试验中可能出现的结果有n 个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是 1n;如果某个事件A 包括的结果有m 个,那么事件A 的概率P (A )= ________ .4.古典概型的概率公式P (A )=事件A 包含的可能结果数试验的所有可能结果数. [方法与技巧]1.古典概型计算三步曲第一,本试验是不是等可能的;第二,本试验的基本事件有多少个;第三,事件A 是什么,它包含的基本事件有多少个.2.确定基本事件的方法(1)当基本事件总数较少时,可列举计算;(2)列表法、树状图法.3.较复杂事件的概率可灵活运用互斥事件、对立事件、相互独立事件的概率公式简化运算.[失误与防范]1.古典概型的重要思想是事件发生的等可能性,一定要注意在计算基本事件总数和事件包括的基本事件个数时,它们是不是等可能的.2.概率的一般加法公式:P (A +B )=___________________.公式使用中要注意:(1)公式的作用是求A +B 的概率,当AB =∅时,A 、B 互斥,此时P (AB )=0,所以P (A +B )=P (A )+P (B );(2)要计算P (A +B ),需要求P (A )、P (B ),更重要的是把握事件AB,并求其概率;(3)该公式可以看作一个方程,知三可求一.12.3几何概型1.几何概型向平面上有限区域(集合)G内随机地投掷点M,若点M落在子区域G1G的概率与G1的面积成正比,而与G的形状、位置无关,即P(点M落在G1)=___________,则称这种模型为几何概型.2.几何概型中的G也可以是空间中或直线上的有限区域,相应的概率是_______之比或_________之比.3.借助_________可以估计随机事件发生的概率.[方法与技巧]1.区分古典概型和几何概型最重要的是看__________的个数是有限个还是无限个.2.转化思想的应用对一个具体问题,可以将其几何化,如建立坐标系将试验结果和点对应,然后利用几何概型概率公式.(1)一般地,一个连续变量可建立与_____有关的几何概型,只需把这个变量放在坐标轴上即可;(2)若一个随机事件需要用两个变量来描述,则可用这两个变量的有序实数对来表示它的基本事件,然后利用平面直角坐标系就能顺利地建立与______有关的几何概型;(3)若一个随机事件需要用三个连续变量来描述,则可用这三个变量组成的有序数组来表示基本事件,利用空间直角坐标系建立与_______有关的几何概型.[失误与防范]1.准确把握几何概型的“测度”是解题关键;2.几何概型中,线段的端点、图形的边框是否包含在事件之内_________所求结果.12.4离散型随机变量及其分布列1.离散型随机变量的分布列(1)将随机现象中试验(或观测)的每一个可能的结果都对应于________,这种_______称为一个随机变量.(2)离散型随机变量:随机变量的取值能够______________,这样的随机变量称为离散型随机变量.(3)设离散型随机变量X的取值为a1,a2,…随机变量X取a i的概率为p i(i=1,2,…),记作:_____________ (i=1,2,…),或把上式列表:称为离散型随机变量X(4)性质:①p i___0,i=1,2,…;②p1+p2+…=___.2.超几何分布一般地,设有N件产品,其中有M(M≤N)件次品.从中任取n(n≤N)件产品,用X表示取出的n件产品中次品的件数,那么P(X=k)=______________ (其中k为非负整数).如果一个随机变量的分布列由上式确定,则称X服从参数为N,M,n的超几何分布.[方法与技巧]1.对于随机变量X的研究,需要了解随机变量能取哪些值以及取这些值或取某一个集合内的值的概率,对于离散型随机变量,它的分布正是指出了随机变量X的______以及取这些值的______.2.求离散型随机变量的分布列,首先要根据具体情况确定X的取值情况,然后利用排列、组合与概率知识求出X取各个值的概率.[失误与防范]掌握离散型随机变量的分布列,须注意:(1)分布列的结构为两行,第一行为随机变量X所有可能取得的值;第二行是对应于随机变量X的值的事件发生的概率.看每一列,实际上是上为“事件”,下为“事件发生的概率”,只不过“事件”是用一个反映其结果的实数表示的.每完成一列,就相当于求一个随机事件发生的概率.(2)要会根据分布列的两个性质来检验求得的分布列的正误.12.5二项分布及其应用1.条件概率在已知B发生的条件下,事件A发生的概率叫作B发生时A发生的___________,用符号P(A|B)来表示,其公式为P(A|B)=__________ (P(B)>0).2.相互独立事件(1)一般地,对两个事件A,B,如果有________________,则称A、B相互独立.(2)如果A、B相互独立,则_________________________________也相互独立.(3)如果A1,A2,…,A n相互独立,则有:P(A1A2…A n)=_________________________.3.二项分布进行n次试验,如果满足以下条件:(1)每次试验只有两个相互对立的结果,可以分别称为“成功”和“失败”;(2)每次试验“成功”的概率均为p,“失败”的概率均为1-p;(3)各次试验是___________.用X表示这n次试验中成功的次数,则P(X=k)=_____________ (k=0,1,2,…,n)若一个随机变量X的分布列如上所述,称X服从参数为n,p的二项分布,简记为X~B(n,p).[方法与技巧]1.古典概型中,A发生的条件下B发生的条件概率公式为P(B|A)=____=_____,其中,在实际应用中P(B|A)=n(AB)n(A)是一种重要的求条件概率的方法.2.相互独立事件与互斥事件的区别相互独立事件是指两个事件发生的概率互不影响,计算式为____________.互斥事件是指在同一试验中,两个事件不会同时发生,计算公式为_______________.3.n次独立重复试验中,事件A恰好发生k次可看作是____个互斥事件的和,其中每一个事件都可看作是__个A事件与____个A事件同时发生,只是发生的次序不同,其发生的概率都是_________.因此n次独立重复试验中事件A恰好发生k次的概率为C k n p k(1-p)n-k. [失误与防范]1.运用公式P(AB)=P(A)P(B)时一定要注意公式成立的条件,只有当事件A、B相互独立时,公式才成立.2.独立重复试验中,每一次试验只有两种结果,即某事件要么发生,要么不发生,并且任何一次试验中某事件发生的概率相等.注意“恰好”与“至多(少)”的关系,灵活运用对立事件.12.6离散型随机变量的均值与方差,正态分布1.离散型随机变量的均值与方差若离散型随机变量X的分布列为P(X=a i)=p i(i=1,2,…r).(1)均值EX=________________________,EX刻画的是_____________________(2)方差DX=_______________为随机变量X的方差,它刻画了随机变量X与其均值EX的____________________2.二项分布的均值、方差若X~B(n,p),则EX=_____________,DX=______________3.正态分布(1)X~N(μ,σ2),表示X服从参数为__________的正态分布.(2)正态分布密度函数的性质:①函数图像关于___________对称;②_________________决定函数图像的“胖”“瘦”;③P(μ-σ<X<μ+σ)=__________;P(μ-2σ<X<μ+2σ)=__________;P(μ-3σ<X<μ+3σ)=__________[方法与技巧]1.均值与方差的性质(1)E(aX+b)=__________,D(aX+b)=_______(a,b为常数).(2)若X服从两点分布,则EX=___,DX=_______.(3)若X服从二项分布,即X~B(n,p),则EX=_____,DX=________.2.求离散型随机变量的均值与方差的基本方法(1)已知随机变量的分布列求它的均值、方差,按定义求解.(2)已知随机变量X的均值、方差,求X的线性函数Y=aX+b的均值、方差,可直接用X 的均值、方差的性质求解.(3)如果所给随机变量是服从常用的分布(如两点分布、二项分布等),利用它们的均值、方差公式求解.3.若X服从正态分布,即X~N(μ,σ2),要充分利用正态曲线的对称性和曲线与x轴之间的面积为____.[失误与防范]1.在没有准确判断分布列模型之前不能随便套用公式.2.对于应用问题,必须对实际问题进行具体分析,一般要将问题中的随机变量设出来,再进行分析,求出随机变量的分布列,然后按定义计算出随机变量的均值、方差.计数,概率,统计与分布列知识梳理答案10.1分类加法计数原理与分步乘法计数原理1. N=m1+m2+…+m n 2 .N=m1×m2×…×m n10.2排列与组合1. 一定的顺序2.(1) 所有排列(2) 所有组合3. (1) n(n-1)(n-2)…(n-m+1) ,n!(n-m)!(2) A m nA m m,n(n-1)(n-2)…(n-m+1)m!,n!m!(n-m)!(3) 1 , n!(4) C n-mn , C m n+C m-1n10.3二项式定理1.C0n a n+C1n a n-1b+…+C r n a n-r b r+…+C n n b n, r+12. (1) C r n=C n-rn .(2)中间项,n2+1 ,2Cnn,n+12, n+32,12Cnn-,12Cnn+.(3)2n 2n-1.【知识拓展】(1) n+1. (3) 降幂, 升幂(4) C0n, C n n.11.1随机抽样1.(1) 调查或观测, 推断(2) 全体, 一部分(3)①迅速、及时;2.(1) 相同.(2) 抽签法和随机数法.4. 等距,简单随机抽样, 分组的间隔11.2统计图表,用样本估计总体1.表达, 分析, 条形统计图、扇形统计图、折线统计图、茎叶图2.(1) 最多, 最中间, 1n(x1+x2+…+x n).(2)1n[(x1-x)2+(x2-x)2+…+(x n-x)2],, 样本容量, 平均数, 平方, 样本容量接近总体容量3.(1) 样本的频率分布估计总体的频率分布, 样本的数字特征估计总体的数字特征.(2) 频率组距, 各小长方形的面积, 1 (3)中点, 顶端中点(4) 可以随时记录11.3变量间的相关关系,统计案例1.(1)散点图.(2)曲线拟合.(3)线性相关, 非线性相关, 不相关的.3.(1) 相关关系(2) (x,y) (3)②正相关, 负相关, 线性不相关, 越高12.1随机事件的概率1.(1)必然事件(2)不可能事件(3)必然事件与不可能事件(4)在条件S下可能发生也可能不发生(5)确定事件和随机事件2.稳定性, 这个常数3.不能同时, 至少有一个发生,同时, 一定有一个4.(1)0≤P(A)≤1. (2)1. (3)0. (4)①P(A)+P(B).②1-P(A).[方法与技巧]1. 概率P(A)2. 空集, 补集[失误与防范]1.必要不充分12.2古典概型1.(1)互斥(2)基本事件2.(1)只有有限个,(2)相同3.m n.[失误与防范]2.P(A)+P(B)-P(AB) 12.3几何概型1.G1的面积G的面积2.体积,长度3.模拟方法[方法与技巧]。

高中数学必修3(人教B版)第二章统计2.2知识点总结含同步练习题及答案

高中数学必修3(人教B版)第二章统计2.2知识点总结含同步练习题及答案

4. 某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方 图,其中产品净重的范围是 [96, 106] ,样本数据分组为 [96, 98) , [98, 100) , [100, 102) ,
[102, 104) , [104, 106] ,已知样本中产品净重小于 100 克的个数是 36 ,则样本中净重大于或等于 98 克
并且小于 104 克的产品的个数是 (
).
A.90
答案: A 解析: 产品净重小于
B.75
C.60
D.45
100 克的概率为 (0.050 + 0.100) × 2 = 0.300 , 已知样本中产品净重小于 100 克的个数是 36 ,设样本容量为 n , 36 则 ,所以 n = 120 ,净重大于或等于 98 克并且小于 n 104 克的产品的概率为 (0.100 + 0.150 + 0.125) × 2 = 0.75 ,所以样本 中净重大于或等于 98 克并且小于 104 克的产品的个数是 120 × 0.75 = 90 .
).
A.2, 5
答案: C
B.5, 5
C.5, 8
D.8, 8
3. 样本中共有五个个体,其值分别为 a, 0, 1, 2, 3 ,若该样本的平均值为 1 ,则样本方差为 (
− − 6 A.√ 5
答案: D 解析:
)
B.
6 5
C.√2
D.2
a+0+1+2+3 = 1 ,得 a = −1 . 5 1 所以 s2 = [(−1 − 1)2 + (0 − 1)2 + (1 − 1)2 + (2 − 1)2 + (3 − 1)2 ] = 2 . 5

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

高中数学必修3(人教A版)第二章统计2.1知识点总结含同步练习及答案

⑤确定样本:从总体中找出与号签上的号码对应的个体,组成样本.
随机数表法是随机数表由数字 0 ,1 ,2,3,⋯,9 这 10 个数字组成,并且每个数字在表中 各个位置上出现的机会都是一样的,通过随机数表,根据实际需要和方便使用的原则,将几个数
组成一组,然后通过随机数表抽取样本.随机数表的优点是简单易行,它很好的解决了当总体中
样.因为 50 名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单 随机抽样中“等可能抽样”的要求.(3)是简单随机抽样.因为总体中的个体数是有限的,并且
是从总体中逐个进行抽取的,是不放回、等可能的抽取.
2013年第27届世界大学生运动会在俄罗斯举行,为了支持这次运动会,某大学从报名的 20 名大 三学生中选取 6 人组成志愿小组,请用抽签法设计抽样方案. 解:(1)将 20 名志愿者编号,编号为 1,2,3,4,⋯,20; (2)将 20 个号码分别写在 20 张形状相同的卡片上,制成号签; (3)将 20 张卡片放入一个不透明的盒子里,搅拌均匀; (4)从盒子中逐个不放回地抽取 6 个号签,并记录上面的号码;
A.2
B.3
C.6
D.7
解:C
间隔相等,所以 126 − 8 × 15 = 6.
4.分层抽样
描述: 将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在 总体中所占比例进行简单随机抽样或系统抽样,这种抽样的方法叫做分层抽样.当总体由明显差 别的几部分组成时,为了使抽取样本更好地反映总体的情况,常采用分层抽样.
③简单随机抽样是一种不放回抽样.
④简单随机抽样是一种等可能的抽样,每个个体被抽取到的可能性均为
n N

常用的简单随机抽样方法有抽签法和随机数表法.

高一数学必修3知识点总结及典型例题解析(公式)-2016

高一数学必修3知识点总结及典型例题解析(公式)-2016

新课标必修3概率部分知识点总结◆ 事件:随机事件( random event ),确定性事件: 必然事件( certain event )和不可能事件( impossible event )❖ 随机事件的概率(统计定义):一般的,如果随机事件 A 在n 次实验中发生了m 次,当实验的次数n 很大时,我们称事件A 发生的概率为()nm A P ≈ 说明:① 一个随机事件发生于具有随机性,但又存在统计的规律性,在进行大量的重复事件时某个事件是否发生,具有频率的稳定性 ,而频率的稳定性又是必然的,因此偶然性和必然性对立统一 ② 不可能事件和确定事件可以看成随机事件的极端情况 ③ 随机事件的频率是指事件发生的次数和总的试验次数的比值,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这个摆动的幅度越来越小,而这个接近的某个常数,我们称之为概事件发生的概率 ④ 概率是有巨大的数据统计后得出的结果,讲的是一种大的整体的趋势,而频率是具体的统计的结果 ⑤ 概率是频率的稳定值,频率是概率的近似值♦ 概率必须满足三个基本要求:① 对任意的一个随机事件A ,有()10≤≤A P② ()()0,1,=Φ=ΩΦΩP P 则有可能事件分别表示必然事件和不和用③如果事件()()()B P A P B A P B A +=+:,则有互斥和⌧ 古典概率(Classical probability model ):① 所有基本事件有限个 ② 每个基本事件发生的可能性都相等 满足这两个条件的概率模型成为古典概型如果一次试验的等可能的基本事件的个数为个n ,则每一个基本事件发生的概率都是n1,如果某个事件A 包含了其中的m 个等可能的基本事件,则事件A 发生的概率为 ()nm A P = ⍓ 几何概型(geomegtric probability model ):一般地,一个几何区域D 中随机地取一点,记事件“改点落在其部的一个区域d ”为事件A ,则事件A 发生的概率为()的侧度的侧度D d A P = ( 这里要求D 的侧度不为0,其中侧度的意义由D 确定,一般地,线段的侧度为该线段的长度;平面多变形的侧度为该图形的面积;立体图像的侧度为其体积 )几何概型的基本特点:① 基本事件等可性 ② 基本事件无限多颜老师说明:为了便于研究互斥事件,我们所研究的区域都是指的开区域,即不含边界,在区域D 随机地取点,指的是该点落在区域D 任何一处都是等可能的,落在任何部分的可能性大小只与该部分的侧度成正比,而与其形状无关。

(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)

(完整版)高一数学必修三《统计》知识点+练习+答案(最新整理)

三、
⑥控制图
总体特征的估计
中心线——y=μ 上界线——y=μ+3σ 下界线——y=μ-3σ
1、特征数:总体平均数 μ
总体方差 2 总体标准差
样本平均数 x
样本方差 s2 或 s*2
样本标准差
s 或 s*
1 2、有关公式:样本平均数 : x = (x1+x2 +...+xn)
n
样本方差
1 : s2 或 s*2 s 2= n [(x1- x )2+(x2+ x )2+...+(xn- x )2]
样本,则抽取的 m 个个体中带有标记的个数估计为( )
m
A. N·
M
M
B. m·
N
M
C. N·
D. N
m
8.从 60 件产品中抽取 10 件进行检查,写出抽取样本的过程.
9.某车间工人已加工一种轴 100 件,为了了解这种轴的直径,要从中抽出 10 件在同一条件 下测量(轴的直径要求为 20 mm±0.5 mm),如何采用简单随机抽样法抽取上述样本?
当总体由差异 明显的几部分 组成时,常将 总体分成几部 分,然后按照 各部分所占的 比进行抽样, 这样的抽样叫 ∽。其中分成 的各部分叫做 层。
各自
要点
从总 体中 逐个 抽取
总体 均分 成几 部分 按事 先确 定的 规则 在各 部分 抽取 将总 体分 成几 层, 分层 进行 抽取
方法步骤
1、 抽签法: ①编②放③抽
必修三统计知识点
一、
类 别 内 容 名 称
简 单 随 机 抽 样
系 统 抽 样
分 层 抽 样
抽样方法
定义

【高中数学必修】第九章 统计(公式、定理、结论图表)

【高中数学必修】第九章 统计(公式、定理、结论图表)

第九章统计(公式、定理、结论图表)1.全面调查和抽样调查调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中①抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体称为样本.样本量:样本中包含的个体数称为样本量2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中②逐个抽取n(1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都③相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内④未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个⑤不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=⑥Y1+Y2+…+Y NN ⑦1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i 1,2,…,k),则总体均值还可以写成加权平均数的形式Y⑧1 N∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=⑨y1+y2+…+y nn ⑩1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行①简单随机抽样,再把所有子总体中抽取的样本②合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层③样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.7.画频率分布直方图的步骤(1)求极差:极差为一组数据中①最大值与②最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成③5~12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、④频数累计、频数、⑤频率.其中频数合计应是样本容量,频率合计是⑥1;(5)画频率分布直方图:横轴表示分组,纵轴表示⑦频率组距.小长方形的面积组距×⑧频率组距⑨频率,各小长方形的面积的总和等于1.8.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图反映统计对象在不同时间(或其他合适情形)的发展变化情况9.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有①p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.10.计算一组n个数据的第p百分位数的步骤第1步,按②从小到大排列原始数据.第2步,计算i ③n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的④平均数.11.四分位数⑤第25百分位数,⑥第50百分位数,⑦第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.12.众数、中位数和平均数的定义(1)众数:一组数据中①出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于②中间位置的数.如果这组数据是偶数个,则取③中间两个数据的平均数.(3)平均数:一组数据的④和除以数据个数所得到的数.13.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的⑤横坐标与小矩形的⑥面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该⑦相等.(3)众数:众数是⑧最高小矩形底边的中点所对应的数据.【特别提醒】众数、中位数和平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中信息很少的一部分,对极端值不敏感14.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为①1n∑i=1n(x i-x)2②1n∑i=1nx i2-x2,标准差为③√1n∑i=1n(x i-x)2.15.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2④1N∑i=1N(Y i-Y)2为总体方差,S ⑤√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i 1,2,…,k),则总体方差为S2⑥1N∑i=1kf i(Y i-Y)2.16.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2⑦1n∑i=1n(y i-y)2为样本方差,s ⑧√s2为样本标准差.17.标准差的意义标准差刻画了数据的⑨离散程度或⑩波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.【特别提醒】对标准差和方差概念的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.18.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].<解题方法与技巧>1.使用分层随机抽样法应遵循的原则(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能入样,需在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.2.进行分层随机抽样的相关计算时,常用到的关系(1)样本容量n总体容量N 该层抽取的个体数该层的个体数;(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;(3)样本的平均数和各层的样本平均数的关系:w mm+n x+nm+ny MM+Nx+NM+Ny.典例1:某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是( )A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定.3.频率分布直方图的性质(1)因为小长方形的面积组距×频率组距=频率,所以各小长方形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小.(2)在频率分布直方图中,各小长方形的面积的总和等于1.(3)样本容量频数相应的频率.4.频率分布直方图中第p百分位数的计算方法方法一:(1)确定百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为f a%,f b%,则第p百分位数为a+p%-f a%f b%-f a%×(b-a).方法二:设出百分位数的值,利用百分位数的定义计算.典例2:为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40.5.利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.6.利用样本数字特征进行决策时的两个关注点(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响较大;中位数是样本数据所占频率的等分线,不受极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.(2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.7.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点8.计算分层随机抽样的方差s 2的步骤(1)确定x 1,x 2,s 12,s 22;(2)确定x ;(3)应用公式s 2 n1n [s 12+(x 1-x)2]+n2n [s 22+(x 2-x)2]计算s 2.9.数据分析的要点要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从平均数的大小去决定哪一组的成绩好,解决像这样的实际问题还得从实际的角度去分析.典例3:甲、乙两人在一次射击比赛中各射靶5次.两人成绩的统计表如甲表、乙表所示,请根据你所学统计知识,进一步判断这两个人这次比赛中的成绩情况. 甲表:乙表:【解析】甲、乙两人比赛的中位数、平均数如下:甲的平均数是4567865x ++++==甲;乙的平均数是536965x ⨯++==乙;甲、乙的平均数都是6,甲的中位数是6,乙的中位数是5,甲的总体成绩好些; 从方差看,甲的方差是2222221[(2)(1)012]25s =-+-+++=甲, 乙的方差是22221[3(1)03] 2.45s =⨯-++=乙;甲的成绩较乙的成绩好;甲的极差是8―4=4,乙的极差是9―5=4.【总结升华】平均数、众数、中位数描述了数据的集中趋势,极差、方差和标准差描述了数据的波动大小,也可以说反映了各个数据与其平均数的离散程度,方差越大,数据的离散程度越大,越不稳定;方差越小,数据的离散程度越小,越稳定.。

高中数学必修3《统计》小结与复习课件

高中数学必修3《统计》小结与复习课件
2
总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做 这个总体的一个样本。 样本容量:样本中个体的数目。
3
抽样方法:
(1)简单随机抽样 (抽签法、随机数法) (2)系统抽样 (3)分层抽样
4
1、抽签法步骤
(1)先将总体中的所有个体(共有N个) 编号(号码可从0到N-1). (2)把号码写在形状、大小相同的号签上, 号签可用小球、卡片、纸条等制作。 (3)将这些号签放在同一个容器中,搅拌均 匀。 (4)抽签时,每次从中抽出一个号签,连续 抽取n次。 (5)抽出样本。
1
16
(2)其频率分布直方图如下
频率/组距 0.07 0.06 0.05 0.04 0.03 0.02 0.01
o 122 126 130 134 138 142 146 150 154 158 身 高 ( cm )
(3)由样本频率分布表可知身高小于134cm 的男孩
出现的频率为0.04+0.07+0.08=0.19, 所以我们估计身高小于134cm的人数占总人数的19%.
但两个变量之间又有关系,称为相关关系。 (2)相关关系与函数关系的异同点。 相同点:两者均是指两个变量间的关系。 不同点:函数关系是一种确定关系,是一种因果
系;相关关系是一种非确定的关系,也不一定是因 果关系(但可能是伴随关系)。
(3)相关关系的分析方向。 在收集大量数据的基础上,利用统计分析,发现
标准差:s s2 ( x1 x)2 ( xn x)2 n
12
分析样本的分布情况可用 样本的频率分布表
样本的频率分布直方图
频率分布直方图的特征: (1)从频率分布直方图可以清楚的看出数据分布的
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§2 统计◆ 基本定义:(1)总体:在统计中,所有考查对象的全体叫做全体.(2) 个体:在所有考查对象中的每一个考查对象都叫做个体. (3) 样本:从总体中抽取的一部分个体叫做总体的样本. (4) 样本容量:样本中个体的数目叫做样本容量.❖ 抽样方法:(1)简单随机抽样(simple random sampling ):设一个总体的个数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时每个个体被抽到的概率相等,就称这样的抽样为简单的随机抽样,简单随机抽样常用的方法有抽签法和随机数表法. (关于制签和随机数表的制作,请参照课本第41页)(2)系统抽样(systematic sampling):将总体平均分成几个部分,然后按照一定的规则,从每一部分抽取一个个体作为样本。

先用随机的方法将总体进行编号,如果整除不能被n N 就从中用随机数表法剔除几个个体,使得能整除,然后分组,一般是样本容量是多少,就分几组,间隔nNk =,然后从第一组中用简单实际抽样的方法抽取一个个体,假设编号为 l ,然后就可以将编号为()k n l k l k l l 1...2,,-+++++ 的个体抽出作为样本,实际就是从每一组抽取与第一组相同编号的个体。

(3)分层抽样(stratifed sampling ):当已知总体是由有差异明显的几部分组成时,常将总体分成几部分,然后按各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.样本容量越大,估计越精确!颜老师友情提醒:1. 把每一种抽样的具体步骤看清楚,要求会写过程2. 个体数N 的总体中抽取一个样本容量为n 的样本,那么在整个抽样过程中每个个体被抽到的概率都相等,且等于Nn.其实三种抽样的每一个个体都是等几率的被抽到的 3. 三种抽样都是不放回的抽样 4. 在具体问题中对于样本,总体,个体应该时代单位的,如考察一个班级的学生的视力状况,从中抽取20个同学,则个体应该是20名同学的视力,而不是20名同学,样本容量则为20,同样的总体也是全班级同学的视力♦ 两种抽样方法的区别与联系:★ 典型例题剖析:例1、一个总体含有6个个体,从中抽取一个样本容量为2的样本,说明为什么在整个抽样过程中每个个体被抽到的概率相等.解:设任意一个个体为α,那么个体α被抽到分两种情况:(1)第一次被抽到:根据等可能事件概率得P 1=61, (2)第二次被抽到:即是个体α第一次没被抽到、第二次被抽到这两件事都发生.个体α第一次没被抽到的概率是65, 个体α第一次没被抽第二次被抽到的概率是51. 根据相互独立事件同时发生的概率公式, 个体α第二次被抽到的概率是P 2=65×51=61.(也可这样分析:根据等可能事件的概率求得,一共取了两次,根据分步原理所有可能结果为6×5=30,个体α第一次没被抽到第二次被抽到这个随机事件所含的可能结果为5×1=5,所以个体α第二次被抽到的概率是P 2=305=61) 个体α在第一次被抽到与在第二次被抽到是互斥事件,根据互斥事件的概率加法公式,在先后抽取2个个体的过程中,个体α被抽到的概率P= P 1+ P 2=61+61=31. 由个体α的任意性,说明在抽样过程中每个个体被抽到的概率都相等(都等于31) 点评:注意区分“任一个个体α每次抽取时被抽到的概率”与“任一个个体α在整个抽样过程中个体α被抽到的概率”的区别,一般地,如果用简单随机抽样从个体数为N 的总体中抽取一个容量为n 的样本,那么“任一个个体α每次抽取时被抽到的概率”都相等且等于N1,“任一个个体α在整个抽样过程中被抽到的概率”为Nn . 例2、(1)在120个零件中,一级品24个,二级品36个,三级品60个,从中抽取一个容量为20的一个样本,求 ① 每个个体被抽到的概率,② 若有简单随机抽样方法抽取时,其中个体α第15次被抽到的的概率, ③ 若用分层抽抽样样方法抽取时其中一级品中的每个个体被抽到的概率.解:① 因为总体个数为120,样本容量为20,则每个个体被抽到的概率P 1=12020=61② 因为总体个数为120,则体α第15次被抽到的的概率P 2=1201 ③ 用分层抽样方法:按比例12020=61分别在一级品、二级品、三级品中抽取24×61=4个,36×61=6个,60×61=10,所以一级品中的每个个体被抽到的概率为P 3=244=61.注:其实用分层抽样方法抽取时二级品、三级品中每个体被抽到的概率也都为61.点评:本题说明两种抽样方法都能保证在抽样过程中,每个个体被抽到的概率都相等.且为Nn . 例3、某地区有3000人参加今年的高考,现从中抽取一个样本对他们进行分析,每个考生被抽到的概率为101,求这个样本容量. 解:设样本容量为n ,则3000n =101,所以n=300.点评:“在整个抽样过程中个体α被抽到的概率”为Nn这一结论的逆用. 例4、下列抽取样本的方式是否属于简单随机抽样?说明理由. (1) 从无限多个个体中抽取50个个体作样本.(2) 盒子里共有100个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.解:(1) 不是简单随机抽样.由于被抽取样本的总体个数是无限的.(2) 不是简单随机抽样.由于不符合“逐个抽取”的原则,且抽出的结果可能是只有一个零件重复出现.点评:简单随机抽样的特点:(1) 它要求被抽取样本的总体个数是有限的. (2) 它是从总体中逐个地进行抽取. (3) 它是一种不放回抽样.例5、 某校有学生1200人,为了调查午休对学习成绩的影响情况,计划抽取一个样本容量为60的样本,问此样本若采用简单随机抽样将如何进行?解:可用两种方法: 方法一:(抽签法)(1)编号: 将1200名学生进行随机编号为1,2, …,1200,(可按学生的学号或按学生的生日进行编号).(2)制签:做1200个大小、形状相同的号签,分别写上这1200个数,放在个容器里,并进行均匀搅拌.(3)逐个抽取:连续抽取60个号签,号签对应的同学即为样本. 方法二:(随机数表法)(1)编号: 将1200名学生进行编号分别为0000,0001,…, 1199,(2)选数:在课本附表1随机数表中任选一个数作为开始.(如从第11行第7列的数9开始)(3) 读数:从选定的数开始向右(或向上、向下、向左)读下去,选取介于范围的号码,直到满60个号码为止.(4) 抽取:抽取与读出的号码相对应的学生进行分析.点评:抽签法和随机数表法是常见的两种简单随机抽样方法,本问题显然用随机数表法更方便一些,因为总体个数较多.另外随机数表法编号时,位数要一样,首数确定后,可向左、向右、向上、向下各个确定的方向进行抽取.例6、某工厂中共有职工3000人,其中,中、青、老职工的比例为5∶3∶2,从所有职工中抽取一个样本容量为400的样本,应采取哪种抽样方法较合理?且中、青、老年职工应分别抽取多少人?解:采用分层抽抽样样方法较为合理.由样本容量为400,中、青、老职工的比例为5∶3∶2,所以应抽取中年职工为400×105=200人, 应抽取青年职工为400×103=120人, 应抽取青年职工为400×102=80人. 例6. 见课本43P 例1.点评:因为总体由三类差异较明显的个体构成,所以应采用分层抽抽样样方法进行抽取.总体分布的估计ⅰ.频率分布表:见课本第51页: ★ 例11. 注意全距,组距的确定。

一般是先查出最大值,最小值,其差值取适当的量作为全距,正常情况下分为十组左右,组数全距组距=,也就是合理分组 2. 分组的时候一般取左闭右开区间,最后一个区间取闭区间,然后填写分组、频数、频率、合计3. 如果全距不利于分组(如不能被组数整除)就可适当的增大全距,即在左右两端增加相同的量4.分组过少,总体的特征不明显;分组过多,总体特征不利于比较ⅱ.频率分布直方图:1.横轴表示数据的内容,每一线段表示一个组的组距,注意横轴要有单位2.纵轴表示的是:组距频率3.每个小矩形的面积都是该组所对应的频率 ⅲ.频率分布折线图: 1. 由频率分布直方图直接得到,取值区间的两端点分别向外延伸半个组距并取此组距上再x 轴上的点,然后顺次连接直方图中每一个小矩形上底边的中点,形成折线图 2.当样本容量足够大,分组的组距取得足够小时,折线图取与一条平滑的曲线,称这条曲线为总体分布的密度曲线,而且曲线与横轴围成的面积为1 3. 在总体密度曲线中,总体在区间(a,b )内取值的可能性就是直线x=a , x=b , y=0 和总体密度曲线围成的面积 4. 累计频率分布曲线上任意一点 ()b a P , 的纵坐标标b 表示的连续型总体,取小于等于 a 的值的可能性ⅳ. 三者的特点频率分布表:数据翔实、具体、清晰明了,便于查阅 频率分布直方图:形象直观,对比效果强烈 频率分布折线图:能够反映变化趋势ⅴ.茎叶图的特点: 优点——简单易行,杂乱的数据在用茎叶图表示后能直观地反映出数据的水平状况、稳定程度;所有的数据都可以在茎叶图中找到. 缺点——分析只是粗略的,对差异不大的两组数据不易分析,另外,对位数较多的数据不易操作,数据较多时效果不是很好.注意点: 1. 对重复出现的数据要重复记录,不能遗漏 2. 茎要从小到大自上而下的排列,中间用一条竖线隔开 3. 叶也要按照从小到大的顺序排列,对于两组数据的可以用两条竖线把茎和叶隔开,左边的叶最好按照从大到小的顺序排列,右边的叶按照从小到大的顺序排列 4. 茎叶图一般在衡量一位或者两位运动员在比赛时的得分情况( 例题见课本 58P )总体特征数的估计反映总体某种特征的量较总体特征数,比如平均数、中位数、方差、众数等ⅰ.平均数(average ) 或均值(mean ): ∑==+++=ni i n a n n a a a a 1211... 其原理:最小二乘法 ——设与实验数据近似的值为 x 则它与这n 个实验数据的离差为 ..., , , , 321n a x a x a x a x ----由于上面的离差有正有负,故不易直接相加,就考虑离差的平方和()()()()22221... n a x a x a x x f -++-+-=()n n a a a x a a a nx +++++++-= (22)221212所以当∑==+++=ni i n a n n a a a x 1211...时,离差的平方和的函数取得最小,误差也就最小,故而用na a a n+++...21 作为这组数据的理想近似值.ⅱ.平均数的求法: 题目类型有离散型和连续型两种情况①∑==+++=n i in x n n x x x x 1211... ②加权平均数:∑==+++=ni i i n n p x p x p x p x x 12211...(其中i 21p , ... , p , p 为i 21 x , ... , x , x 对应的频率),这里也是为我们今后将要学习的数学期望作铺垫见课本 例 2 6564-P 注:特别地,对于连续型的随机变量在分好组后,其i 21 x , ... , x , x 应该取每一组的组中值近似的表示ⅲ.样本方差(variance ): ()2121∑=-=n i i x x n s=22221231[()()()()]n x x x x x x x x n-+-+-++-样本标准差(standard deviation):()∑=-=ni ix x n s 121 说明:1. 平均数、中位数、众数是描述数据集中趋势的统计量2. 方差、标准差是反映一组数据波动大小或稳定程度或各个数据与平均数的离散程度的统计量,记住它们的表达形式,在选择题中常出现关于它们的判断3. 一个重要结论:21221x x n s n i i -=∑=4. 方差与越大,稳定性越差5. 关于它们的运算,分连续型和离散型两种情况,见课本 6867-P 对于离散型的随机变量也要注意选择组中值例题:从两块玉米地里各抽取10株玉米苗,分别测得它们的株高如下(单位:cm ):甲:25 41 40 37 22 14 19 39 21 42 乙:27 16 44 27 44 16 40 40 16 40 根据以上数据回答下面的问题: (1)哪种玉米苗长得高? (2)哪种玉米苗长得齐?[分析] :看哪种玉米苗长得高,只要比较甲乙两种玉米苗的平均高度即可;要比较哪种玉米苗长得齐,只要比较哪种玉米苗高的方差即可,方差越小,越整齐,因为方差反映的是一组数据的稳定程度解:(1)()()()()cm x cm x 31401640401644274416271013042213919142237404125101=+++++++++==+++++++++=乙甲乙种玉米长得高乙甲 ∴<x x (2)()()()()()()()()()()⎥⎥⎦⎤⎢⎢⎣⎡-+-+-+-+-+-+-+-+-+-=222222222223042302130393019301430223037304030413025101甲s()22.104cm =()()()()[]()2222228.12831442314033161331272101cm s =-⨯+-⨯+-⨯+-⨯=乙 甲种玉米长得齐乙甲 22∴<x x评: 1. 特别注意本题中的两问的说法的不同,所以算法就不同2. 一般的说哪组数据齐、稳定、波动情况等都是通过方差来判断ⅳ.几个重要的结论:对于一组数据n 21 x , ... , x , x 的平均数为x 方差为2s 标准差为s① 若()n , ... , 2 1,i , =i x 都增加a ,则平均数为 a x + 方差为 2s 标准差为 s也可以这样解释:同时增加a ,也就是相当数据平移了,不会改变数据的波动程度,所以方差和标准差都不会变.②若()n , ... , 2 1,i , =i x 都递增a %,则平均数为 ()x a %1+ 方差为 ()22%1s a + 标准差为 ()s a %1+③若()n , ... , 2 1,i , =i x 都变为原来的a 倍,则平均数为 x a 方差为 22s a 标准差为as例题: 已知n 21 x , ... , x , x 的方差为2,则32x , ... , 32x , 32n 21+++x 的标准差为 ?解法1:(公式推导法)x n x x x n=+++ (21)()()()3232...323221+=++++++∴x nx x x n()()()()824461432326122121=⨯=⨯=-⨯=+-+=∴∑∑==s x x x x ni i ni i 方差22=∴标准差解法2:(推理法)因为数据的每一项都是先2倍后加上3,而加上3对方差没有影响,2倍后则方差变为原来的4倍,即方差标为8 ,则标准差为 22.线性回归方程ⅰ.变量之间的关系:① 确定的函数关系 ② 相关关系(有一定的关系,但不能用函数表达出来)ⅱ. 对于一组数据探讨它们满足的关系,可以先画出散点图,看它们的大致趋势,然后选择一种函数进行数据拟合,电脑和计算器一般给出6种拟合函数,也就是说对于一组数据可以用各种函数模型来拟合,只不过拟合度不同而已,当拟合度2R 越接近于1则拟合得越好,本教材之研究线性拟合,也就是求线性回归方程 ⅲ. 线性回归分析:理论依据——最小二乘法 见课本 72P ⅳ. 设线性回归方程为 a bx y +=,关键在于求b a ,()()()∑∑∑∑∑∑∑∑∑=========---=--=⎥⎦⎤⎢⎣⎡-⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡-=ni ini i in i ini i ini n i i i ni n i i n i i i i xxyy x xx n xx n y xx x n y x y x n b 12112211212111 yx b y a -=ⅴ. 相关系数: ⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛--=∑∑∑===ni i n i i ni ii y n y x n x x n yx r 1221221y称为的样本相关系数与x y线性相关程度越高越接近于并且负相关时当正相关时当1 r , 1 ; ,0 ; ,0r ≤<>r r线性相关程度越低越接近于0 rⅵ. 颜老师说明:1. 由于公式的复杂,数据有的也较多,所以在具体做题目时可以列出表格来,对应填进去,然后用公式计算,这样就不会产生慌乱的感觉2.做题目时要细心,不要乱,在我们高一阶段一般只给出5~6组数据,算起来已经不是很难了3. 当然这种拟合(我们主要学习线性拟合——就是求线性回归方程)在电脑里都可作出来图像来,而且求出相应的拟合度,有兴趣的同学可以在Excel 软件里试一试。

相关文档
最新文档