理论分布 PPT

合集下载

第七章城市规模分布ppt课件

从上表可以看出，按1989年的资抖，浙江的二城市指数为2，四和十一城市指数接近于1，最接近于理想状态；凡是具有双中心或准双中心格局的省区，如河北(石家庄和唐山)、山东(济南和青岛)、广西(南宁和柳州)、四川(重庆和成都)、安徽(合肥和淮南)、内蒙古(包头和呼和浩特)、河南(郑州和洛阳)、吉林(长春和吉林)等省区3个指数值都很低，二城市指数远不到2，四和十一城市指数都不到甚至远低于1；而青海、湖北、陕西、广东、云南、苏沪等省区城市人口集中在首位城市的特征最明显，3种城市指数都很高；辽宁、黑龙江、江苏、湖南等省二城市指数都大于2，但因有多个大中城市发育，四城市指数和十一城市指数却比较低。
(二)城市金字塔的K值
K=下一规模等级的城市数/上一等级规模的城市数对K值的认识：
①中心地学说认为，K值是常数 ②也有人认为，K值是变化的，规模级越高，K值越大；规模级越低，K值越小。〖城市规模等级划分的间距不同，K值也不同。〗
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
同一城市体系不同等级划分的规模分布举例
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
中国1980和1990年的城市金字塔
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
2. 四城市指数
S4=P1/(P2+P3+P4)
3.十一城市指数
S11=2P1/(P2+P3+…+P11) 按照位序—规模的原理，正常的四城市指数和十一城市指数都应该是1，而两城市指数应该是2。【显然，四城市指数和十一城市指数比二城市指数

第五节交通流理论统计分布课件

交通流参数与道路状况之间的关系
道路状况对交通流参数有显著影响，良好的道路状况有利于提高车速，降低车辆密度和拥堵程度；反之，不良的道路状况会导致车速降低，车辆密度增大，增加拥堵程度。
交通流参数与驾驶员行为之间的关系
驾驶员行为对交通流参数也有影响，驾驶员的驾驶行为如超速行驶、违规变道等会影响车速和车辆密度的分布；而驾驶员对道路状况的判断和反应也会影响交通流参数的变化。
无人驾驶对交通流理论的挑战与机遇
01
无人驾驶技术的兴起对传统交通流理论提出了新的挑战，需要重新审视和调整现有的理论体系。
02
无人驾驶技术为交通流理论提供了新的研究机遇，通过与人工智能技术的结合，有望实现更加智能、高效的交通管理和优化。
交通流的基本概念
01
02
03
交通流
指在一定时间内，通过道路某一断面的车辆和行人的数量。
交通流特性
包括流量、速度、密度等，这些特性之间相互影响，共同决定交通流的状态。
交通流模型
用于描述交通流特性的数学模型，通过模型可以预测交通流的变化趋势。
交通流理论的发展历程
古典交通流理论
以车辆跟驰理论和流体动力学为基础，主要研究单车道的交通流特性。
详细描述
这些统计分布模型各有其适用范围和特点，在交通流理论中常用于分析不同特性的交通流量和车流量数据。选择合适的统计分布模型对于准确描述交通流特性至关重要。
REPORT
CATALOG
DATE
ANALYSIS
SUMMAR Y
03
交通流参数分析
车流量分析
01
02
03
04
车流量定义
车流量是指在单位时间内通过某一地点的车辆数量。

3-理论分布与抽样分布

68-95-99.7规则
➢ 正态分布有其特定的数据分布规则： ▪ 平均值为, 标准差为σ的正态分布 ▪ 68%的观察资料落在的1σ之内 ▪ 95%的观察资料落在的2σ之内 ▪ 99.7%的观察资料落在的3σ之内
19
20
三、68-95-99.7规则
68.26% 的资料 95.45% 的资料 99.73% 的资料 -3 -2 -1 0 1 2 3 -3s -2s -s +s +2s +3s
体称为样本平均数的抽样总体。其平均数和标准差分
别记为和。x
s x
是样s x本平均数抽样总体的标准差，简称标准误 (standard error)，它表示平均数抽样误差的大小。统计学上已证明x总体的两个参数与x 总体的两个参数有如下关系：
u=(x-μ)／σ
x～N(0,1)
上一张下一张主页退12出
3.3.3 正态分布的概率计算 1. 标准正态分布的概率计算
设u服从标准正态分布，则u在[u1，u2 ）内取值的概率为：
＝Φ(u2)－Φ(u1)
(3-16)
Φ(u1)与Φ(u2)可由附表1查得。
上一张下一张主页退13出
例如，u=1.75时，由附表1可以查出 Φ(1.75)=0.95994
图3-6 μ相同而σ不同的3个正态分布比较大 8
（6）分布密度曲线与横轴所围成的区间面积为1，即：
（7）正态分布的次数多数集中在平均数μ的附近，离均数越远，其相应次数越少，在3σ以外的极少，这就是食品工业控制中的3σ 原理的基础。
上一张下一张主页退 9出
3.3.2 标准正态分布
上一张下一张主页退16出
(1) P(u＜-1.64)=0.05050 (2) P (u≥2.58)=Φ(-2.58)=0.024940 (3) P (｜u｜≥2.56)

正态分布完整ppt课件

正态性检验
使用如Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法，对误差项进行正态性检验，以验证其是否符合正态分布。
方差分析中F分布应用
01 02
F分布的定义
F分布是一种连续型概率分布，常用于方差分析中的假设检验。在方差分析中，通过比较不同组间的方差与组内方差，判断各因素对结果的影响是否显著。
筛选方法
包括单变量分析和多变量分析等，结合临床意义和统计学显著性进行生物标志物的筛选。
社会科学调查数据分析
社会科学调查数据特点
大量、复杂、多维度的数据，往往需要进行统计分析和数据挖掘。
正态分布在社会科学调查数据分析中的应用
通过对调查数据进行正态性检验，选择合适的数据处理和分析方法，如参数检验、回归分析等。
有对称性和单峰性。
性质
对称性：正态分布曲线关于均值对称。
单峰性：正态分布曲线只有一个峰值，位于均值处。
均值、中位数和众数相等。
概率密度函数在均值两侧呈指数下降。
正态曲线特点
01
02
03
04
形状
钟形曲线，中间高，两边低。
对称性
关于均值对称，即左右两侧形状相同。
峰值
位于均值处，且峰值高度由标准差决定。
05
正态分布在金融学领域应用
风险评估及资产组合优化
风险评估
正态分布用于描述金融资产的收益和风险分布，通过计算均值和标准差来评估投资组合的风险水平。
资产组合优化
基于正态分布假设，利用马科维茨投资组合理论等方法，构建最优资产组合以降低风险并提高收益。
VaR（Value at Risk）计算
正态分布用于计算投资组合在一定置信水平下的最大可能损失（VaR），以衡量潜在风险。

正态分布t分布ppt(共49张PPT)

u=x-μ/σ
(五)标准正态分布曲线下的面积分布规律
标准正态分布曲线以u值为横轴变量，位置参数µ=0，形状参数ơ=1，标准正态分布曲线与横轴之间的整体面积为1或100% 。标准正态分布曲线下面积的分布规律有如下规律（图5
） u=-1,u=1范围内的面积占正态曲线下总面积的68.27%，即有
研究以推论总体的方法，称为抽样研究方法。
由抽样而引起的样本均数与总体均数之间的差别及样
本均数与样本均数之间的差别称为抽样误差。从正态分布的同一总体中随机抽取例数相等的若
干个样本，分别计算它们的均数，这些别
标准差描述个体变量值间的变异程度。凡同性质的资料，标准差大表示个体变量值变异大，样本均数对个体的代表性差。标准差小表示个体变量值变异小，样本均数对个体的代表性好。
B、样本均数
单项选择题
t 5、 0.05,9(单侧 )
t0.0 5,9(双侧 )
A、大于 B、小于 C、等于 D、无关
界值为
t 的t界值。0.0 5,
t0.0 1,
t值与自由度的关系
一般情况下，t分布曲线较标准正态分布曲线低平，因此， t0.05,1.96 t0.0,12.58 自
t 由度越小，t分布曲线越低平则、t 0.05, 0.01,
界值越大。
t界值与概率的关系
设以t 分布曲线与横轴所夹总面积为 100%，则横轴上某一区间和曲线所夹面积与总面积之比，相当于t值在该区间内出现的概率（P），从一个正态总体中随机抽样，获得t 值落于整个横轴的概率 P=1，获得l t l 的P t0.05, 0.05 ，对应曲线面积 0.05 ，|t| 的P t0.01 , 0.01 ，对应的曲线面积 0.01 。

《正态分布》ppt课件

《正态分布》ppt课件
目录
CONTENTS
• 正态分布基本概念 • 正态分布在统计学中应用 • 正态分布在自然科学领域应用 • 正态分布在社会科学领域应用 • 正态分布计算方法及工具介绍 • 正态分布在实际问题中案例分析
01 正态分布基本概念
CHAPTER
定义与性质
定义
对称性
正态分布是一种连续型概率分布，描述了许多自然现象的概率分布情况。在统计学中，正态分布又被称为高斯分布。
系统误差与随机误差
正态分布可以帮助区分系统误差和随机误差。系统误差是由于实验装置或方法本身的缺陷引起的，而随机误差则是由于各种不可控因素引起的。通过正态分布分析，可以对这两类误差进行识别和纠正。
化学中浓度分布规律研究
01
溶液浓度的正态分布
在化学实验中，溶液的浓度分布往往符合正态分布。通过测量不同位置
利用SPSS的图形功能，可以绘制多种统计图表，包括频率分布直方图、正态分布曲线图等。
SPSS提供了丰富的统计分析方法，如参数估计、假设检验、方差分析等，可以根据研究需求选择合适的方法进行分析。
06 正态分布在实际问题中案例分析
CHAPTER
质量控制过程中产品合格率评估
质量控制图
利用正态分布原理，通过绘制质量控制图，可以直观地展示产品质量的波动情况，从而及时发现并处理异常波动，确保产品合格
数据输入与整理
在Excel中输入数据，并进行必要的整理，如删除重复值、处理缺失值等。
使用内置函数计算均值和标准差
Excel提供了丰富的内置函数，可以直接计算数据集的均值（AVERAGE函数）和标准差（STDEV函数）。
绘制图表
利用Excel的图表功能，可以根据数据快速生成频率分布直方图和正态分布曲线图。

理论分布与抽样分布

统计学证明，服从二项分布B(n,p)旳随
机变量之平均数μ、原则差σ与参数n、p有
如下关系：（即次数平均数、原则差）
当试验成果以事件A发生次数k表达时
μ=np
σ2= npq
(3-7)
σ= npq
当试验成果以事件A发生旳频率k／n或
百分数表达时（即样本平均数、原则差）
p p ( pq) / n
xpx qnx
n
x0
c c c
0 6
0.850
0.156
1 6
0.851
0.155
2 6
0.852
0.154
c c
3 6
0.853
0.153
4 6
0.854
0.152
0.22350
二项分布旳应用条件有3点：
（1）一对互斥事件（2）（p+q=1），P是稳定值。（3） n次成果相互独立
1.1.4二项分布旳平均数与原则差
由图2-6做100听罐头净重资料旳频率分布直方图，能够设想，假如样本取得越来越大(n→+∞)，组分得越来越细(i→0)，某一范围内旳频率将趋近于一种稳定值 ── 概率。这时，频率分布直方图各个直方上端中点旳联线 ── 频率分布折线将逐渐趋向于正态分布曲线。
上一张下一张主页退出
（1）随机单位时间和单位空间旳稀有事件; （2）在n→∞,p→0，且 n p =λ(较小常数)情况下，二项分布趋于泊松分布; （3）每次试验成果相互独立。对于在单位时间、单位面积或单位容积内，所观察旳事物因为某些原因分布不随机时，不是泊松分布。（Such as contagion, Bacteria Group in milk)

概率和理论分布.

1、当随机变量 x 的取值是一个确定的实数，且每
一实数发生的概率也是确定的，这种类型的变量就称为离散型随机变量（discrete random variable）
如：设生男孩为 x 1 ，生女孩为 x 0 ，则
Px1 0.52
Px0 0.48
其含义是：生男孩的概率为 0.52，生女孩的概率为
0.48
又如： x 1 为猪丹毒治愈， x 0 为未治愈，则
Px1 p 0.93
Px0 q 0.07
设一个布袋里装有1个白球、2个红球、3个黑球、4
个黄球，充分混匀，x 0 为取得白球， x 1为取得
红球，x 2 为取得黑球，x 3 为取得黄球，则
Px0 p1 0.1

1
3

3

2
0

3

1 27
二红一白的概率是
3
1 3
2

2 3
1

6 27
一红二白的概率是
3
1
1

3

2 3
2

12 27
无红三白的概率是

1 3
0

2 3
3

8 27
这四种情况相加之和为1
抽取三个球共有四种组合，这四个组合各个组合出
二、事件间的关系和事件、积事件互斥事件、对立事件完全事件系、事件的独立性
三、随机事件的概率（probability）随机事件的出现，带有很大的偶然性；但这种偶然
性也有一定的规律：有些随机事件出现的可能性大一些，有些则小一些

理论分布与抽样分布

在回归分析中的应用
建立回归模型
根据自变量和因变量的关系，建立合适的回归模型，如线性回归、非线性回归等。
估计模型参数
利用样本数据对回归模型的参数进行估计，得到回归方程的系数和截距。
检验模型显著性
通过计算F值或t值等统计量，对回归模型的显著性进行检验，判断自变量对因变量是否有显著影响。
预测和控制
理论分布与抽样分布
目录
• 引言 • 理论分布概述 • 抽样分布概述 • 理论分布与抽样分布的关系 • 理论分布与抽样分布在实践中的应用 • 总结与展望
01
引言
目的和背景
阐述理论分布与抽样分布的概念及其关系分析在统计学中理论分布与抽样分布的重要性探讨如何利用理论分布与抽样分布进行统计推断
汇报范围
在方差分析中的应用
方差齐性检验
在进行方差分析前，需要对各组的方差进行齐性检验，以确定是否满足方差分
析的前提条件。
计算统计量
利用样本数据计算各组均值、总均值、组间方差和组内方差等统计量。
建立模型
根据研究问题和数据特点，建立方差分析模型，包括因素、水平、交互作用等。
进行F检验
根据方差分析模型，计算F值，并利用F分布进行假设检验，判断因素对结果是否有显著影响。
抽样分布的形状和特性与总体分布密切相关。
依赖于样本量
统计量的分布
随着样本量的增加，抽样分布的形状逐渐趋近于正态分布。
抽样分布描述的是统计量（而非单个样本值）的分布情况。
抽样分布的形成原理
中心极限定理
当从均值为μ、方差为σ^2的总体中随机抽取容量为n的样本时，随着n的增大，样本均值的抽样分布逐渐趋近于均值为μ、方差为σ^2/n的正态分布。

理论分布和抽样分布

THANKS FOR WATCHING
感谢您的观看
确定拒绝域
根据显著性水平和检验统计量的分布，确定拒绝原假设的区域。
作出决策
将计算得到的检验统计量值与拒绝域进行比较，决定是否拒绝原假设。
抽样分布在假设检验中的意义和作用
提供理论基础
确定拒绝域
通过抽样分布可以确定检验统计量的分布和拒绝域，从而进行假设检验的决策。
抽样分布理论为假设检验提供了理论基础，使得我们能够从样本数据中推断总体参数。
05 抽样分布在参数估计中的应用
点估计方法介绍
矩估计法
利用样本矩来估计总体矩，从而得到参数的估计值。
最大似然估计法
根据样本数据，选择使得似然函数达到最大值的参数值作为估计值。
最小二乘法
通过最小化误差的平方和来得到参数的估计值。
区间估计方法介绍
置信区间法
利用样本数据构造一个置信区间，该区间以一定的概率包含总体参数的真值。
进行假设检验
在参数假设检验中，需要利用抽样分布来确定检验统计量的分布及其临界值。
06 抽样分布在假设检验中的应用
假设检验的基本思想和步骤
选择检验统计量
根据假设选择合适的检验统计量，如$t$统计量、$F$统计量等。
计算检验统计量的值
根据样本数据计算检验统计量的值。
建立假设
根据研究问题提出原假设（$H_0$）和备择假设（$H_1$）。
报告范围
01 理论分布的定义、性质及其常见的类型。
02 抽样分布的概念、性质及其与样本量的关系。
03
理论分布和抽样分布在假设检验、置信区间估计等统计推断方法中的应用。
04
通过实例和案例分析，展示理论分布和抽样分布在实践中的具体应用。

第二章理论分布与抽样分布

统计学上通过大量实验而估计的概率称为实验概率或统计概率，用公式表示为：
P(A) lnim an
式中P代表概率，P(A)代表事件A的概率。 P(A)的取集范围为：0≤ P(A) ≤1。
随机事件的概率表现了事件的客观统计规律性，它反映了事件在一次试验中发生可能性的大小，概率大表示事件发生的可能性大，概率小表示事件发生的可能性小。
立。例如，事件A为“花的颜色为黄色”，事件B为“产量高”，如果花的颜色
与产量无关，则事件A和B相互独立。
第二章理论分布与抽样分布 12
2.1 事件、概率和随机变量-概率的计算法则
互斥事件的加法
假定两互斥事件A和B的概率分别为P(A)和P(B)，则 P(A+B)=P(A)+P(B)
例如：某一批水样中，Cd的含量≤0.03mg/L的概率
第二章理论分布与抽样分布 8
2.1 事件、概率和随机变量-事件间的关系
互斥事件如果事件A和B不能同时发生，即A和B是不可能事件，则
称事件A和B互斥。例如饮用水中Cd污染＜0.003mg/L和 =0.003mg不可能同时发生，为互斥事件。
第二章理论分布与抽样分布 9
2.1 事件、概率和随机变量-事件间的关系
第二章理论分布与抽样分布
第二章理论分布与抽样分布 1
2.1 事件、概率和随机变量
（1）事件和事件发生的概率（2）事件间的关系（3）计算事件概率的法则（4）随机变量
第二章理论分布与抽样分布 2
2.1 事件、概率和随机变量
事件(event)：在自然界中一种事物，常存在几种可能出现的情况，每一种可能出现的情况称为事件。
对立事件
事件A和B不可能同时发生，但必发生其一，即A＋B为必然事件

3 理论分布与抽样分布

1.3.3 正态分布的概率计算
标准正态分布的计算：已知X ～N(0，1)，求X在实数区间（a，b）上的概率P（a＜x＜b）？
Ф(b)－Φ(a)

这个积分比一般正态分布要简单，在实际工作中应用广泛。为了使用方便，前人编制了标准正态分布函数的数值表。见附表。
（1）附表1可解决：已知a和b，求P（a＜x＜b）?
从波松分布的实例中，分布参数λ往往是未知的，
只能从所观察的随机样本中计算出相应的样本平均
数作为 λ 的估计值，将其代替计算公式中的λ，计
算出 k = 0，1，2，… 时的各项概率。
上一张下一张主页
退出

例，为监测饮用水的污染情况，现检验某社区每毫升饮用水中细菌数，共得400个记录如下：
量x ，其可能取值为某范围内的任何数值，且x 在其取值范围内的任一区间中取值时，其概率是确定的，则称x为连续型随机变量 ( continuous random variable)。
不能列出试验结果和取此结果的概率，只能给出一定范围和在此范围内取值上一张的概率。
下一张主页
退出
1.2.1 泊松分布的定义

当随机变量x（x=k）所有可能取值是非负整数，且其概率分布为：
λ e P( x k ) k!
k λ
其中，λ是一个大于0的常数；k=1,2,…，n,…； e是自然对数的底数；则称随机变量x为服从参数为λ 的泊松分布。
记为： x～P(λ)。
1.2.2 泊松分布的重要特征
上一张下一张主页退出
离散型随机 ห้องสมุดไป่ตู้ 量：如果表示试验结果的
变量x，其可能取值为可列个，且以各种确定的概率取这些不同的值，则称 x 为离散型随机变量 ( discrete random variable)；

理论分布 PPT

第五章理论分布
为了便于读者理解统计分析的基本原理，正确掌握和应用以后各章所介绍的统计分析方法，本章在介绍概率论中最基本的两个概念— —事件、概率的基础上，重点介绍生物科学研究中常用的几种随机变量的概率分布——正态分布、二项分布、及样本平均数的抽样分布和 t 分布。
一、事件（一）必然现象与随机现象在自然界与生产实践和科学试验中，人们会观察到各种各样的现象，把它们归纳起来，大体上分为两大类：
一、二项分布的概念
试验或调查中有这样一类常见的变数，其总体中的全部个体可以根据某种性状的出现与否分为两类
例，一粒种子可能发芽也可能不发芽等
这类变数属于间断性随机变数，其总体包括非此即彼的两项对立事件，这样的总体称为二项总体
二、二项分布的概率计算
如将掷一枚硬币于地面出现正面，反面为0，正面为1，随机变量X取值有0和1两个数，所以正面数与概率呈函数关系，可以用f(x)来表示，f(x)称为随机变量X的概率函数
(二)计算概率的基本定理
定理I：P(A)=1－P(A)
对立事件
定理II:P(A＋B)=P(A)＋P(B) 互斥事件
定理III:P(A·B)=P(A)·P(B) 独立事件
例5.1一批种子发芽的概率为0.95，不发芽的概率为0.05
例5.2某农场一批杂交水稻种子进行品质分级，其中一级种子占15%二级种子占30%其余为三级。计算二级以上种子的概率
二项分布必须满足两个基本假定： 1、各事件是相互独立的，即任何一个事件发生与否，不影响其它事件发生的概率； 2、各个随机事件只能发生非此即彼的对立事件。形状： (1)、当p=0.5，即p=q时，二项分布为对称分布， (2)、当p>0.5，即q<0.5时，二项分布为偏右， (3)、当p<0.5，即q>0.5时，二项分布为偏左。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第五章理论分布
为了便于读者理解统计分析的基本原理，正确掌握和应用以后各章所介绍的统计分析方法，本章在介绍概率论中最基本的两个概念— —事件、概率的基础上，重点介绍生物科学研究中常用的几种随机变量的概率分布——正态分布、二项分布、及样本平均数的抽样分布和 t 分布。
一、事件（一）必然现象与随机现象在自然界与生产实践和科学试验中，人们会观察到各种各样的现象，把它们归纳起来，大体上分为两大类：
例如:为了确定抛掷一枚硬币发生正面朝上这个事件的概率，历史上有人作过成千上万次抛掷硬币的试验。在下表中列出了他们的试验记录。
表抛掷一枚硬币发生正面朝上的试验记录
从上表中可看出，随着实验次数的增多，正面朝上这个事件发生的频率越来越稳定地接近0.5，我们就把0.5作为这个事件的概率。
二项分布必须满足两个基本假定： 1、各事件是相互独立的，即任何一个事件发生与否，不影响其它事件发生的概率； 2、各个随机事件只能发生非此即彼的对立事件。形状： (1)、当p=0.5，即p=q时，二项分布为对称分布， (2)、当p>0.5，即q<0.5时，二项分布为偏右， (3)、当p<0.5，即q>0.5时，二项分布为偏左。
P（ф）=0。
三、概率的基本运算
（一）事件间的相互关系
1、和事件：事件A与事件B至少有一个发生
2、积事件：事件A与事件B同时发生
3、互斥事件：事件A与事件B不能同时发生
4、对立事件：事件A与事件B必发生其一，但不能同时发生
5、独立事件：事件A的发生与否，与事件B的概率毫无关系；反之事件B的发生与否，与事件A的概率也毫无关系。
（二）随机试验与随机事件
1、随机试验:通常我们把根据某一研究目的，在一定条件下对自然现象所进行的观察或试验统称为试验（trial）。而一个试验如果满足下述三个特性，则称其为一个随机试验（random trial），简称试验：
（1）试验可以在相同条件下多次重复进行；（2）每次试验的可能结果不止一个，并且事先知道会有哪些可能的结果；
一类是可预言其结果的，即在保持条件不变的情况下，重复进行试验，其结果总是确定的，必然发生（或必然不发生）。这类现象称为必然现象（inevitable phenomena）或确定性现象（definite phenomena）。
另一类是事前不可预言其结果的，即在保持条件不变的情况下，重复进行试验，其结果未必相同。这类在个别试验中其结果呈现偶然性、不确定性现象，称为随机现象（random phenomena ）或不确定性现象（indefinite phenomena）。
第三节正态分布
一、正态分布方程及特性
（一）正态分布方程正态分布是连续型随机变量的理论分布
客观世界确有许多现象的数据是服从正态分布。其次在适当条件下，它可用做二项分布离散型或连续型的近似分布，因此常常应用正态分布代替其他分布来计算概率和进行假设测验。虽有些总体不作正态分布，但从总体中随机抽出的样本平均数及其他一些统计数的分布在 n→∞仍然趋近于正态分布
在一般情况下，随机事件的概率p是不可能准确得到的。通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。即 P（A）=p≈a/n （n充分大）
（二）概率的古典定义
对于某些随机事件，用不着进行多次重复试验来确定其概率，而是根据随机事件本身的特性直接计算其概率。
有很多随机试验具有以下特征：
大家有疑问的，可以询问和交流
可以互相讨论下，但要小声点
9
（2）必然事件我们把在一定条件下必然会发生的事件称为必然事件（certain event），用Ω表示。例如，在标准大气压下，水加热到100℃必然会沸腾，就是一个必然事件。
（3）不可能事件我们把在一定条件下不可能发生的事件称为不可能事件（impossible event），用ф表示。例如，在标准大气压下，水温度低于100 ℃ 就不可能会沸腾。
3、正态分布曲线与横轴间的总面积为1
µ±1δ
68.24%
µ±2δ
95.46%
µ±3δ
99.73%
µ±1.96δ
95%
µ±2.58δ
99%
二、正态分布标准化
由上述正态分布的特征可知，正态分布是依赖于参数μ和σ2(或σ)的一簇分布，正态曲线之位置及形态随μ和σ2的不同而不同。这就给研究具体的正态总体带来困难，需将一般的N(μ，σ2)转换为 μ=0,σ2=1的正态分布。我们称μ=0，σ2=1的正态分布为标准正态分布(standard normal distribution)。从标准正态分布累积函数的数值表中查出(附表 2) 标准化正态分布是µ=0，δ2=1的正态分布由于不同的正态总体存在不同的µ和δ2，所以N（µ,δ2）不是一条曲线，而是一个曲线系统这给研究具体正态总体带来许多困难，需要将一般正态分布标准化，
例如，在编号为1、2、3、…、10 的十个球中随机抽取1个，有10种不同的可能结果：
“ 取得一个编号是1” 、“ 取得一个编号是 2”、…、“取得一个编号是10”，这10个事件都是不可能再分的事件，它们都是基本事件。
由若干个基本事件组合而成的事件称为复合事件（compound event）。如“取得一个编号是2的倍数”是一个复合事件，它由“取得一个编号是2 ”、“是4”、“是6、“是8”、“是10”5 个基本事件组合而成。
1、试验的所有可能结果只有有限个，即样本空间中的基本事件只有有限个；
2、各个试验的可能结果出现的可能性相等，即所有基本事件的发生是等可能的；
3、试验的所有可能结果两两互不相容。
（三）概率的性质 1、对于任何事件A，有
0≤P（A）≤1； 2、必然事件的概率为1，即
P（Ω）=1； 3、不可能事件的概率为0，即
（3）每次试验总是恰好出现这些可能结果中的一个，但在一次试验之前却不能肯定这次试验会出现哪一个结果。
例如：在一定孵化条件下，孵化6枚种蛋，观察其出雏情况，它们都具有随机试验的三个特征，因此都是随机试验。
2、随机事件随机试验的每一种可能结果，在一定条件下可能发生，也可能不发生，称为随机事件（random event），简称事件（event），通常用 A、B、C等来表示。（1）基本事件我们把不能再分的事件称为基本事件（elementary event），也称为样本点（sample point）。
=0.97500－0.02500
=0.9500
u x
例：已知菜豆角长度服从正态分布N（9.978，1.4412）问(1)角长小于6.536㎝；(2)大于12.128㎝；(3)介于8.537㎝和9.978㎝之间概率
随机现象或不确定性现象，有如下特点：
在一定的条件实现时，有多种可能的结果发生，事前人们不能预言将出现哪种结果；对一次或少数几次观察或试验而言，其结果呈现偶然性、不确定性；
但在相同条件下进行大量重复试验时，其试验结果却呈现出某种固有的特定的规律性— —频率的稳定性，通常称之为随机现象的统计规律性。
P(A＋B)=P(A)＋(B)=1计算两次都是币值的一面向上的概率。
P(A·B)=P(A)·P(B)= 1/2×1/2=1/4
三、小概率事件实际不可能性原理
随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小，例如小于0.05、 0.01、0.001，称之为小概率事件。
f(0)=1/2 f(1)=1/2
若两枚X=0、1、2，如q为反面1/2，p为正面1/2
（p＋q）2二项式展开得:
(p＋q)2 f(0)=q2=(½ )2=¼
f(1)=2pq=2(½ )(½ )=½ f(2)=p2=(½ )2=¼ 若掷n枚于地面x=0、1、2、3、……n， (p＋q)n二项式展开计算各个随机变量的概率函数
fN(x) 1 e-12(x-)2
2
(二)正态分布曲线的特征
1、正态分布曲线是中间高、两边低，而且对称的光滑曲线，曲线最高峰在平均数处，越是接近平均数的组变量分布的次数越多、离平均数越远，分布的次数越少。
2、正态分布曲线因总体平均数和标准差的不同呈现为不同的曲线，所以它不是一条曲线，而是一个曲线系统，不同的总体都有它自己的曲线。
(二)计算概率的基本定理
定理I：P(A)=1－P(A)
对立事件
定理II:P(A＋B)=P(A)＋P(B) 互斥事件
定理III:P(A·B)=P(A)·P(B) 独立事件
例5.1一批种子发芽的概率为0.95，不发芽的概率为0.05
例5.2某农场一批杂交水稻种子进行品质分级，其中一级种子占15%二级种子占30%其余为三级。计算二级以上种子的概率
概率的统计定义在相同条件下进行n次重复试验，如果随机事件A发生的次数为a，那么a/n称为随机事件A的频率（frequency）；当试验重复数n逐渐增大时，随机事件A的频率越来越稳定地接近某一数值 p ，那么就把p 称为随机事件A的概率。
这样定义的概率称为统计概率（statistics probability）。
f(x)=Cnxpxqn-x——贝努里公式
Cnm
Anm Amm
n! m!(nm)!
例一批种子发芽率为70%，每穴播种6粒种子计算每穴出6棵苗、5、4、3、2、1、0棵苗的概率各为多少？
解：设x表示每穴出苗数 P(x=6)=C660.76 × 0.30=0.117 649 P(x=5)=C650.75 × 0.31=0.302 526 P(x=4)=C640.74 × 0.32=0.324 135 P(x=3)=C630.73 × 0.33=0.185 220 P(x=2)=C620.72 × 0.34=0.059 535 P(x=1)=C610.71 × 0.35=0.010 206 P(x=0)=C600.70 × 0.36=0.000 729