生物统计学 第4讲 数字特征
生物统计课件:第2章 随机变量及其数字特征
分布函数的定义
设X是一个随机变量,x是任意实数,则 函数
F ( x) = P{ X ≤ x}
称为X的分布函数(distribution function).
F ( x ) = P{ X ≤ x}
= ∑ pk xi ≤ x
例
X
~
0 1
1 2 1 1
3 6 2
0,
1
,
F(
x)
=
3
1
2
,
1,
x<0 0≤ x <1
伯努利概型
试验结果具有对立性的n重独 立重复试验称为n重伯努利试验,简 称伯努利试验。
伯努利试验的特点:
• 对立性 • 独立重复性
例:一次试验结果为“成功”、“失败”; 如果作两次试验呢? … … 如果作n次试验呢?
在一次Bernoulli试验中,
P (成功) = π, P (失败)= 1-π
二重Bernoulli试验,
二项分布的最可能值
n
Pk
∑ (a + b)n = Cnk akbn−k
k =0
..
0
..n
n=13, p=0.5
常见离散型随机变量(2)
定义:若随机变量X的概率函数为
P{X = k}=λke-λ k!
(λ > 0) k = 0 ,1 2,L
则称X服从参数为λ的泊松分布
(Poisson distribution),记作
P{x1 <X ≤ x2}=P{X ≤x2)−P{X ≤x1} =F(x2)−F(x1)
例
X的取值
0 12
相应概率P 0.16 0.48 0.36
0,
F(x)
统计学第4章数据特征的描述
极差计算简单,但容易受到极端值的影响,不能全面 反映数据的离散程度。
四分位差
定义
四分位差是第三四分位数与第 一四分位数之差,用于反映中
间50%数据的离散程度。
计算方法
四分位差 = 第三四分位数 第一四分位数
优缺点
四分位差能够避免极端值的影 响,更稳健地反映数据的离散
程度,但计算相对复杂。
方差与标准差
统计学第4章数据特征 的描述
https://
REPORTING
• 数据特征描述概述 • 集中趋势的度量 • 离散程度的度量 • 偏态与峰态的度量 • 数据特征描述在统计分析中的应用 • 数据特征描述的注意事项
目录
PART 01
数据特征描述概述
REPORTING
WENKU DESIGN
数据特征描述在推断性统计中的应用
参数估计 假设检验 方差分析 相关与回归分析
基于样本数据特征,对总体参数进行估计,如点估计和区间估 计。
通过比较样本数据与理论分布或两组样本数据之间的差异,对 总体分布或总体参数进行假设检验。
研究不同因素对总体变异的影响程度,通过比较不同组间的差 异,分析因素对总体变异的贡献。
定义
方差是每个数据与全体数据平均数之方根,用于衡量数据的波动大小。
计算方法
方差 = Σ(xi - x̄)² / n,标准差 = √方差
优缺点
方差和标准差能够全面反映数据的离散程度,且计算相对简单,但容易受到极端值的影响。同时,方差 和标准差都是基于均值的度量,对于非对称分布的数据可能不够准确。
适用范围
适用于数值型数据,且数据之间可能 存在极端异常值的情况。
特点
中位数不受极端值影响,对于存在极 端异常值的数据集,中位数能够更好 地反映数据的集中趋势。
生物统计学第四版--教学大纲
课程简介《生物统计学》是运用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,是生物学各专业的专业基础课。
本门课程在第七学期进行,是在学生已学习了《高等数学》课程和《植物学》、《动物学》、《生理学》、《遗传学》等生物学各学科的基础知识的基础上开设本门课程。
本课程系统地介绍了生物统计学的基本原理和方法,在简要叙述了生物统计学的概念、产生、发展和作用、生物学研究中试验资料的整理、特征数的计算、概率和概率分布、抽样分布基础上,着重介绍了平均数和频率的假设检验、X 2检验、方差分析、直线回归与相关分析、可直线化的非线性回归分析、协方差分析、试验设计的原理和常用试验设计及其统计分析、多元回归与相关分析和多项式回归分析,同时简要介绍聚类分析、判别分析、主成分分析、因子分析、典型相关、时间序列分析等多元分析。
本课程的主要目的是培养学生具有生物学试验设计的能力和对试验资料进行统计分析处理的能力.一、教学环节和教学方法1教学环节本门课程为生物学的专业基础课,在第七学期进行。
学生已学习了《高等数学》课程和《植物学》、《动物学》、《生理学》、《遗传学》等生物学各学科的基础知识,在此基础上开设本门课程。
主要教学形式为课堂讲授,主要教学环节包括课堂讲授、辅导答疑、课外作业、习题讲解等。
2教学方法以课堂讲授为主,研制电子教案和多媒体幻灯片以及C A I课件,在教学方法和手段上采用现代教育技术.二、本课程的性质和任务《生物统计学》是运用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,是生物学各专业的专业基础课.随着生物学的不断发展,对生物体的研究和观察已不再局限于定性的描述,而是需要从大量调查和测定数据中,应用统计学方法,分析和解释其数量上的变化,以正确制定试验计划,科学地对试验结果进行分析,从而作出符合科学实际的推断。
《生物统计学》不仅提供如何正确地设计科学试验和收集数据的方法,而且也提供如何正确地整理、分析数据,得出客观、科学的结论的方法。
生物统计学的基本特征
生物统计学的基本特征生物统计学是一门研究生物学数据分析的学科,通过对生物学数据的收集、整理和分析,揭示生物学现象背后的规律和模式。
生物统计学具有以下基本特征。
1. 数据的收集和整理:生物统计学首先需要收集和整理生物学实验或调查所得到的数据。
数据可以是定量的,如测量结果或计数数据,也可以是定性的,如观察结果或分类数据。
生物统计学家需要设计合理的数据收集方法,并对数据进行质量控制和清洗,以确保数据的准确性和可靠性。
2. 数据的描述和总结:生物统计学通过描述和总结数据的基本特征来了解数据的分布和变异程度。
常用的描述统计量包括平均值、中位数、标准差、方差等。
这些统计量可以帮助研究者了解数据的中心位置、离散程度和分布形态,从而对生物学现象进行定量描述。
3. 数据的推断和假设检验:生物统计学利用统计推断方法对样本数据进行推断,从而对总体进行推断。
通过假设检验,研究者可以判断样本数据与某个假设的一致性,从而得出结论。
常用的假设检验方法包括t检验、方差分析、卡方检验等。
这些方法可以帮助研究者判断两组数据或多组数据之间是否存在显著差异,从而对生物学现象进行比较和解释。
4. 数据的建模和预测:生物统计学通过建立数学模型来描述生物学现象的概率分布和关联关系。
常用的建模方法包括线性回归、逻辑回归、生存分析等。
这些模型可以帮助研究者预测和解释生物学现象的变化趋势和影响因素,为生物学研究提供理论依据和预测工具。
5. 数据的可视化和解释:生物统计学通过可视化方法将复杂的生物学数据转化为图表或图像,帮助研究者直观地理解数据的特征和规律。
常用的可视化方法包括直方图、散点图、箱线图等。
这些方法可以帮助研究者发现数据中的趋势、异常和关联关系,从而提供直观的解释和推断。
生物统计学的基本特征使其成为生物学研究中不可或缺的工具。
通过生物统计学的方法和技术,研究者可以对生物学现象进行客观、准确和全面的描述和解释,为生物学研究提供科学的依据和指导。
04生物统计学第4章1
置信水平
样本统计量
41
抽样分布
置信水平
1- 接受域
拒绝域
H0值 观察到的样本统计量
临界值
样本统计量
42
抽样分布
置信水平
1- 接受域
拒绝域
H0值 临界值
样本统计量
43
1.第一类错误(弃真错误)
◦ 原假设为真时拒绝原假设 ◦ 会产生一系列后果
◦ 第一类错误的概率为
被称为显著性水平
2.第二类错误(取伪错误)
◦ 原假设为假时接受原假设
◦ 第二类错误的概率为
20
假设检验中的两类错误
(决策结果)
H : 无罪 假设检验就好像一场审判过程 0
统计检验过程
陪审团审判
设H0;或者说,是把希望(想要)证明的有效假 设作为备择假设 3. 先确立备择假设H1
33
例1,改善栽培技术后,将会使豌豆的平 均籽粒重超过360毫克以上
◦ 属于研究中的假设 ◦ 建立的原假设与备择假设应为
H0: 360 H1: 360
例2,改进筛选方法后,会使鱼苗场的杂 种率降低到2%以下
◦ 事先对总体参数或分布形式作出某种假设 ◦ 然后利用样本信息来判断原假设是否成立
2. 类型
◦ 参数假设检验 ◦ 非参数假设检验
3. 特点
◦ 采用逻辑上的反证法 ◦ 依据统计上的小概率原理
8
这个值不像我 们应该得到的 样本均值 ...
抽样分布
... 因此我们拒 绝假设 = 50
... 如果这是总 体的真实均值
3. 检验统计量的基本形式为
Z x 0 n
14
什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率
第一章绪论生物统计学详解演示文稿
第十三页,共35页。
(二)系统误差也叫片面误差(lopsided error),
这是由于试验动物的品种、年龄、性别、病程等不同, 饲料种类、品质、数量、管理指施相差较大,仪器不 准、标准试剂未经校正,药品批次不同、药品用量以 及种类不符合试验计划的要求,以及观测、记载、抄 录、计算中的错误所引起。在试验中是可以避免的。
• 3. 判定试验结果的可靠性
试验受试验因素和偶然因素的影响,一个试验结果,使又试 验因素造成的还是误差造成的,要正确判断必须用统计分 析的方法.
第六页,共35页。
4. 提供通过样本推断总体的方法。 试验的目的在于认识总体规律,但总体往往 庞大.
5.确定事物之间的相互联系 科学试验不仅是研究事物的特征,还要研究 事物间的相互关系,从而达到预测事物发展 的.
n
x
x1 x2 xn
xi
i 1
n
n
n
• 其中,(Sigma)为总和符号,i1 x表i 示从第
一个观察值 x1 累加到第n个观察值 xn ,若在意
义上已明确时,简记为 。 x
第十八页,共35页。
关于总和符号的几个性质
• 常数的总和等于该常数的n倍,即
n
其中C为常数;注意:在后面一些章节经常会遇
•即
第二十六页,共35页。
M d x(n1) / 2
当n为偶数时n,/ 2 和 (n 1)位/ 2置的两个观察值
• 之和的二分之一即为中数,即:
Md
xn / 2 x(n / 21) 2
• 2、若资料已分组,并编制成了次数分布表,可
利用次数分布表计算中数。
Md
生物统计学-试验资料的整理与特征数的计算
资料搜集的方法
调查
对已经存在的事件的资料按某种方案进行收集 的方法
试验
对已有的或没有的事物加以处理的方法
调查
普查:是对研究对象的全部个体逐一进行调查的方法 抽样调查:是根据一定的原则从研究对象中抽取一部分
具有代表性的个体进行调查的方法
于资料中的最大值 组限可取到10分位或5分位上,临界值就高不就低
组号 下限 上限 组中值
1 35.0 40.0 37.5
2 40.0 45.0 42.5
…… …… …… ……
11 85.0 90.0 87.5
次数分布表-计量资料
分组:
根据各组上、下限后,将原始资料中各观测值归于相应的组
制表:
0.35
0.21 0.11 0.05
累积频率 Cumulative P
0.02 0.09 0.28 0.63
0.84 0.95 1.00
1 自然值进行分组,最大值17,最小值11 2 数据主要集中在14,向两侧分布逐渐减少
次数分布表-计数资料
小麦品种300个麦穗穗粒数 18-62 62 - 17 = 45 ,分为45组?
来亨鸡每月产 蛋数变动范围:
11~17
分为7组 统计各组次数 计算频率和累积频率
制表
次数分布表-计数资料
表 2-2 100只来亨鸡每月产蛋数次数分布表
每月产蛋数 Preduct 11 12 13 14 15 16 17
次数 Frequency
2 7 19 35 21 11 5
频率 Percent
0.02 0.07 0.19 0.35 0.21 0.11 0.05
考研生物统计学知识点精讲
考研生物统计学知识点精讲考研生物统计学是生物医学领域的一门重要学科,也是考研生物医学考试中的一部分内容。
本文将重点介绍生物统计学的相关知识点,帮助考研生同学们更好地理解和掌握这门学科。
一、生物统计学概述生物统计学是一门研究如何从数据中推断、决策和建模的学科。
它主要涉及收集、处理和分析生物医学数据,以及对数据结果的解释和推断。
1. 数据类型生物医学数据可以分为定性数据和定量数据。
定性数据是指描述性的数据,如性别、病情等。
定量数据是可以进行数值化和计算的数据,如身高、体重、血压等。
2. 统计学描述统计学描述主要包括中心趋势和离散程度的度量。
中心趋势包括均值、中位数和众数,离散程度包括标准差、方差和极差。
3. 概率与分布概率是描述事件发生可能性的数值。
常见的概率分布有正态分布、泊松分布和二项分布,其中正态分布是最为常见也最为重要的一种分布。
4. 假设检验假设检验用于确定两个或多个数据集之间是否存在差异。
常用的假设检验方法有t检验、方差分析和卡方检验。
二、生物统计学方法生物统计学方法是生物医学研究中常用的分析工具。
下面我们将介绍一些常见的生物统计学方法。
1. 相关分析相关分析用于研究两个或多个变量之间的关系。
常见的相关分析方法有皮尔逊相关系数和斯皮尔曼相关系数。
2. 回归分析回归分析用于研究自变量与因变量之间的关系。
常见的回归分析方法有线性回归和 logistic 回归。
3. 生存分析生存分析用于研究患者生存时间与各种因素之间的关系。
常见的生存分析方法有 Kaplan-Meier 生存曲线和 Cox 比例风险模型。
4. 方差分析方差分析用于研究两个或多个组之间的差异。
常见的方差分析方法有单因素方差分析和多因素方差分析。
三、生物统计学应用生物统计学在生物医学研究中有着广泛的应用。
下面列举了一些典型的应用领域。
1. 临床试验生物统计学在临床试验中的应用很广泛,主要包括随机对照试验的设计和结果分析。
2. 流行病学研究生物统计学在流行病学研究中用于确定疾病的发病率、风险因素以及预测和控制疾病的传播。
(完整word版)生物统计学第四版知识点总结
一、田间试验的特点1、田间试验具有严格的地区性和季节性,试验周期长。
2、田间试验普遍存在试验误差3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或栽培条件的效果。
二、田间试验的基本要求结果重演性、结果可靠性、条件先进代表性、目的明确性三、单因素试验的处理数就是该因素的水平数。
四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是?3因素3水平的处理组合数是?多因素试验的处理数是各因素不同水平数的所有组合。
五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为喷施等量清水。
六、简单效应的计算N 的简单效应为40-30=10在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。
七、平均效应的计算P的主效(8+14)/2=11;N的主效(10+16)/2=13;八、互作的计算N与P的互作为(16-10)/2=3或(14-8)/2=3九、田间试验误差可分为系统误差和随机误差两种。
(1、系统误差影响试验的准确性,随机误差影响试验的精确性。
2、准确度受系统误差影响,也受随机误差影响;精确度受随机误差影响。
3、若消除系统误差,则精确度=准确度。
)十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。
适当的时候可以考虑增加重复次数来降低误差。
小区面积一般在6-60m2,而示范小区面积不小于330m2 。
十一、通常情况下,狭长小区误差比方形小区误差小。
小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。
一般小区长宽比为3-10:1,甚至达20:1十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。
十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复;小区面积较大的试验可设2-4次重复。
十四、将对照或早熟品种种在试验田四周,一般4行以上。
医学生物统计学知识点
医学生物统计学知识点在医学领域,生物统计学是一门重要的学科,它提供了在医学实验和研究中收集、分析和解释数据的方法和技巧。
本文将介绍医学生物统计学的一些基本知识点。
一、基本概念1. 总体和样本:在生物统计学中,研究对象被称为总体,而从总体中选取的一部分作为研究样本。
2. 变量和观测值:研究中所关心的特定性质或特征被称为变量,而在样本中观察到的具体数值被称为观测值。
二、描述性统计学1. 频数分布:用来描述变量不同取值出现的次数,通常以频数表或频率直方图的形式展示。
2. 平均数:用来表示一组数据的集中趋势,包括算术平均数、加权平均数和几何平均数等。
3. 中位数:将一组数据按照大小排序,中间的那个值即为中位数,对于偶数个数据则取中间两个数的平均值。
4. 方差和标准差:用来衡量数据的离散程度,方差是各数据与平均数之差的平方和的平均数,标准差是方差的平方根。
三、概率与概率分布1. 概率的基本原理:描述事件发生的可能性,介于0和1之间,其中0表示不可能发生,1表示一定会发生。
2. 离散型随机变量与概率分布:如二项分布、泊松分布等,适用于离散型变量的概率计算。
3. 连续型随机变量与概率密度函数:如正态分布、指数分布等,适用于连续型变量的概率计算。
四、假设检验1. 原假设与备择假设:在医学研究中,我们通常提出原假设来进行检验,并根据收集到的数据判断是否拒绝原假设。
2. 显著性水平和P值:显著性水平是我们指定的拒绝原假设的程度,而P值是根据实际数据计算出来的,表示观察到的结果与原假设一致的可能性。
3. 单样本检验和双样本检验:单样本检验用于研究样本与总体的差异,双样本检验用于比较两个样本之间的差异。
五、相关性分析1. 相关系数:用来衡量两个变量之间的线性相关程度,常用的有皮尔逊相关系数和斯皮尔曼等级相关系数。
2. 散点图:用来展示两个变量之间的关系,可以直观地观察到变量之间的趋势。
六、回归分析1. 简单线性回归:研究一个自变量与一个因变量之间的关系,通过回归方程来描述二者之间的线性关系。
生物统计学复习资料(整理)
生物统计学复习资料(整理)生物统计学复习资料第一章1.生物统计学的基本作用:1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
2)判断试验结果的可靠性3)提供由样本推断总体的方法4)提供试验设计的一些重要原则2.统计学发展过程:古典记录统计学近代描述统计学现代推断统计学3.总体:具有相同性质的个体所组成的集合4.个体:组成整体的基本单元5.样本:从总体中抽出的若干个体所构成的集合6.变量:相同性质的事物间表现差异性的某项特征。
按其性质分为连续变量和非连续变量。
变量可以是定量的,也可以是定性的。
7.连续变量:表示在变量范围内可抽出某一范围的所有值8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
10.参数:对总体特征的度量11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。
12.效应:试验因素相对独立的作用13.误差:是试验中不可控因素所引起的观测值偏离真值的差异14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。
15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。
16.错误:是指在试验过程中,人为因素所引起的差错。
17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章1.次数分布:在不同区间内变量出现的次数所构成的分布。
2.资料根据生物的形状特性,可分为数量性状和质量性状3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。
4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在5.质量性状资料的方法:统计次数法,评分法统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数给分法:给予每类性状以相对数量的方法。
数理统计第二章数字特征
计算方法
对于一组数据,峰态系数可 以通过计算四阶中心矩与标 准差的四次方的比值得到。
判断标准
当峰态系数大于3时,数据分 布呈现尖峰态;当峰态系数 小于3时,数据分布呈现平峰 态;当峰态系数接近3时,数 据分布接近正态分布。
偏态和峰态的关系
相互影响
偏态和峰态都是描述数据分布形态的统计量,它们之间存在相互影响。当数据分布呈现偏态时,其峰态也可能受到影 响。
偏态对峰态的影响
当数据分布呈现右偏态时,其右侧的极端值会对峰态产生较大影响,使得峰态系数增大;当数据分布呈现左偏态时, 其左侧的极端值会对峰态产生较大影响,使得峰态系数减小。
峰态对偏态的影响
当数据分布呈现尖峰态时,其分布的集中程度较高,可能导致偏态系数的绝对值增大;当数据分布呈现 平峰态时,其分布的分散程度较高,可能导致偏态系数的绝对值减小。
数理统计第二章数字特征
目录
• 数字特征概述 • 集中趋势度量 • 离散程度度量 • 偏态与峰态度量 • 分布形状的描述与检验 • 数字特征在统计分析中的应用
01 数字特征概述
定义与意义
定义
数字特征是统计学中用于描述数据集 基本属性和结构的一组数值。
意义
通过数字特征,可以简洁有效地揭示 数据集的中心趋势、离散程度、分布 形态等关键信息,为后续的数据分析 和建模提供重要依据。
标准差
方差的算术平方根,它反映了数 据的波动程度。标准差用s表示。
变异系数
• 变异系数:标准差与平均数的比值,它反映了数据的相对波动 程度。变异系数越小,说明数据的波动程度越小;变异系数越 大,说明数据的波动程度越大。
04 偏态与峰态度量
偏态系数
定义
偏态系数是描述数据分布偏态程度的一个统计量,用于衡量数据分布的不对称性。
第一章绪论生物试验统计学和特征数
作为样本或资料的代表数与其他资料进行比较。 将分母用n-1代替,可以避免偏小的弊病,可以做到对总体标准差的较好的估计。
试验误差:观察值偶然偏离试验处理的真实值称为试验 误差,或叫误差。误差(error):观察值与理论值之间 的差异。
系统误差(lopsided error,片面误差):指在相同的条件 下,多次测量同一量时,误差的绝对值和符号保持恒定, 在条件改变时,则按某一确定的规律变化的误差。系统误 差是可以消除的。或有一定原因引起的误差,也称偏差。 系统误差使数据偏离了其理论值,影响数据的 总体——具有相同性质的个体所组成的集合称为 总体。个体——组成总体的基本单元称为个体。
样本——从总体中抽出的若干个个体所构成的集合 称为样本.
样本容量(sample size)——样本个体数目的大小称为样本 容量。样本统计数——通过从样本计算出来的统计数,如样本 平均数、样本标准差等。
**统计学上的试验误差指随机误差。
随机误差的规律性
系统误差源自某种系统 性原因,它的规律性比 较明显。 随机误差就个体而言, 很难寻找它的规律性; 但对一个比较大的群体, 也有规律可循。如数量 性状的随机误差在理论 上服从正态分布。
6 8 .2 7 %
9 5 .4 5 %
-3
-2
-1
0
1
2
3
随机误差的分布模式
第一章绪论生物试验统计学和特征数
优选第一章绪论生物试验统计 学和特征数
第一节 常用术语
一、随机事件的规律性
随机事件就个体而言,
很难寻找它的规律性;
但对一个比较大的群体,
也有规律可循。随机事
件在理论上服从正态分
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
连续型随机变量的方差
15
E(C)=C E(aX+b)=aE(X)+b E(X±Y)=E(X)±E(Y) D(C)=0 D(aX+b)=a2D(X) X、Y独立:D(X±Y)=D(X)+D(Y)
二、期望、方差的性质
16
0.8
1 X -1 P 0.7 0.3
Y = 2X
0.7 0.7 0.6 0.5 0.4 0.3 0.3 0.2 0.1 0 -2 -1 0 1 2
n=25, p=0.2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
• 二项分布的方差随n的变化
25
X ~ B ( n, p )
0.6 0.5
D( X ) = np(1 − p )
n=5
0.4
n=20
0.3
0.2
X P
0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0.0
0 0.008
1 0.076
2 0.265
3 0.411
4 0.240
2.1e −2.1 x f ( x) = 0
x≥0 x<0
0
1
2
3
4
第五节 随机变量的数字特征
6
E ( X ) = ∑ xi pi
i
D( X ) = E ( X − E ( X )) = ∑ ( xi − E ( X ) ) pi
2 ( − 1) X2 : 0.1
1 0 4 0 2 22 = 0.7 0.2 0.1 0.7 0.2
E ( X 2 ) = 1×0.1 + 0×0.7 + 4×0.2 = 0.9 E ( X 2 ) − ( E ( X )) 2 = 0.9 − 0.32 = 0.81
p 0.14 0.1 0.08 0.06 0.04 0.02 0.01 k 3 4 4 5 6 8 11 E (X ) 0.6973 0.5939 0.5336 0.4661 0.3839 0.2742 0.1956
例3
13
E ( X ) = ∑ xi pi = lim ∑ xi Si
i i
= lim ∑ xi f ( xi )∆x = ∫
i
+∞ −∞
xf ( x )dx
连续型随机变量的数学期望
14
D( X ) = E ( X − E ( X )) = ∫
2
+∞ −∞
( x − E ( X )) f ( x )dx
2
= E ( X ) − ( E ( X )) = ∫
2 2
+∞ −∞
x f ( x )dx − ( E ( X ) )
Q D( X ) = E ( X − E ( X )) 2
= D( X ) ± 2COV ( X , Y ) + D(Y )
ρ XY
COV ( X , Y ) = D( X ) D(Y )
= D( X ) + D(Y ) ± 2 ρ XY D( X ) D(Y )
代数和的方差△
18
1.两点分布(0-1分期望、方差
19
X ~ B ( n, p )
P ( X = k ) = C p (1 − p )
k n k
n− k
E ( X ) = ∑ xk pk
n
= ∑ kC p (1 − p )
k n k k =0
n−k
2.二项分布
20
X ~ B ( n, p )
1 Yi = 0
P ( A U B ) = P ( A) + P ( B ) − P ( AB ) Q P ( AB ) = P ( A) P ( B )
0.7 = 0.4 + P ( B ) − 0.4 P ( B )
P ( A B ) = P ( A)
课堂练习key2
5
•位置:期望 中位数 众数 •变异:方差(标准差) 全距 变异系数
P ( A U B ) = P ( A) + P ( B ) − P ( AB ) Q P ( AB ) = 0
0.7 = 0.4 + P ( B ) − 0
P ( AB ) P ( B ) P ( A B) = = =1 P ( B) P ( B)
课堂练习key2
4
2:已知P(A)=0.4,P (A∪B)=0.7 (2)若A、B相互独立容,则P (B) = 0.5 ; P ( A B) = 0.6 .
2 2 i
= E ( X ) − ( E ( X )) = ∑ x pi − ( E ( X ) )
2 2 2 i i
2
X cm E(X) cm D(X) cm2
X kg E(X) kg D(X) kg2
一、数学期望和方差
7
0.8 0.7 0.7
X -1 1 P 0.7 0.3
0.6 0.5 0.4 0.3 0.3 0.2 0.1 0 -2 -1
D( X ) = 1.32 ×0.1 + 0.32 × 0.7 + 1.7 2 ×0.2 = 0.81
例2
9
−1 0 2 X : 0.1 0.7 0.2
D( X ) = E ( X − E ( X )) 2 = E ( X ) − ( E ( X ))
2 2
D( X ) = (−1 − 0.3) 2 ×0.1 + ( 0 − 0.3) 2 ×0.7 + (2 − 0.3) 2 ×0.2 = 0.81
E ( X ) = −1× 0.1 + 0× 0.7 + 2× 0.2 = 0.3
( X − E ( X )) 2 :
(−1 − 0.3) 2 0.1 (0 − 0.3) 2 0.7 1.32 (2 − 0.3) 2 = 0.2 0.1 0.32 1.7 2 0.7 0.2
例3
12
1 E ( X ) = 1 − (1 − p ) + k
k
p=0.1
2 E (X ) 0.6900 k 3 0.6043 4 0.5939 5 0.6095 8 0.6945 10 0.7513 30 0.9909 33 0.9994 34 1.0016
p=0.01
2 E (X ) 0.5199 k 5 0.2490 10 0.1956 11 0.1956 12 0.1969 100 0.6440 635 0.9999 650 1.0001
课堂练习
2
1:假设男生女生出生机会相同。已知一个家庭 有3个孩子,其中一个是女孩。求该家庭中 至少有一个男孩的概率 6/7 .
男男男 女男男 男女男 男男女 男女女 女男女 女女男 女女女
课堂练习key1
3
2:已知P(A)=0.4,P (A∪B)=0.7 (1)若A、B互不相容,则P (B) = 0.3 ; P ( A B) = 1 ;
1
1:假设男生女生出生机会相同。已知一个家庭有3个 孩子,其中一个是女孩。求该家庭中至少有一个男孩 . 的概率 2:已知P(A)=0.4,P (A∪B)=0.7 (1)若A、B互不相容,则P (B) =
P ( A B) =
; ; ; .
(2)若A、B相互独立,则P (B) = P ( A B) = 学号+姓名
二项分布的数学期望、方差
22
X ~ B ( n, p )
n=10;p=0.1
0.5 0.4 0.3 0.2 0.1 0 -0.1 0
D( X ) = np(1 − p )
n=10;p=0.9
0.5 0.4 0.3 0.2 0.1 0 -0.1 0
2
4
6
8
10
2
4
6
8
10
n=10;p=0.2
0.5 0.3 0.1 -0.1 0 2 4 6 8 10 0.5 0.3 0.1 -0.1 0 2
n=10;p=0.3
4
6
8
10
n=10;p=0.4,n=k
0.5 0.4 0.3 0.2 0.1 0 0 2 4 6 8 10 0.5 0.4 0.3 0.2 0.1 0 0 2
n=10;p=0.5
4
6
8
10
• 二项分布的方差随p的变化(李新飞)
23
X ~ B ( n, p )
0.6 0.5
D( X ) = np(1 − p )
例2
10
在一个人数为N的人群中普查某种疾病,为此要抽 验N个人的血.如果将每个人的血分别检验,则共需检 验N次. 为减少工作量,一位统计学家提出新的方案:k个人 为一组,把同组k个人的血样混合后检验. • 如果混合血样呈阴性反应,就说明这k个人都无此 疾病,这k个人只要检验这1次就够了; • 如果混合血样呈阳性反应,说明这k个人中至少有 一个人有此疾病,则此k个人的血样再分别进行检 验,这k个人检验k+1次. k=? 例3 最佳普查方案(P54,例2.7)
D(Y ) = 2 D( X )
2
0.8 0.7 0.7 0.6 0.5
Y P
-2 2 0.7 0.3
0.4 0.3 0.3 0.2 0.1 0 -2 -1 0 1 2
例4 2X的方差
17
D( X ± Y ) = E ( X ± Y − E ( X ± Y ) )
记:µ X = E ( X ), µY = E (Y )
p=0.05
0.4
p=0.4
0.3
0.2