管理数量方法与分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 1、定义
• 在一次试验中,事件A发生的可能性大小。
– 2、概率的性质 • (1) 0 £ P(A) £1 • (2)P(W) =1, P(f) = 0
• (3)若A和B互斥,则
• (4)若A和B是对立事件,则
P(A)+ P(B) =1
• (5)
• 古典概率
– 随机试验的样本空间是由有限个样本点构成, 且每个样本点在试验中是等可能出现的,则事 件A发生的概率可用如下公式计算
• P(A)=A包含的样本点个数/全部样本点个数
– 例:
• 条件概率与事件的独立性 • 1、条件概率
• 已知A发生的条件下,B发生的概率,记为P(B|A)
– 一般的有:
P(B | A) = P(AB) P(A)
– 例:
• 全概率公式 • 设B1,B2,…,Bn是样本空间的互斥全划分,
则事件A可表示为: • A发生的概率为:
• 此公式称为全概率公式(已知事件A在每个 互斥子空间发生的概率,求A发生的概率)
• 贝叶斯公式
P(Bi
|
A)
=
பைடு நூலகம்
P(ABi ) P(A)
=
P(Bi )P(A P(A)
|
Bi
)
=
P(Bi )P(A | Bi )
n
åP(Bj )P(A | Bj )
j=1
– 1、已知事件A在整个空间发生的概率P(A),以
第1章 数据分析的基础
• 本章重点难点
– 1.数据分组与变量数列 – 2.分布中心与离散程度的测定 – 3.偏度与峰度 – 4.两个变量的相关关系
• 学习目标
– 重点掌握:
• 1.数据分组与变量数列编制的方法及其应用; • 2.分布中心与离散程度指标的种类、测定方法及其应用; • 3.偏度、峰度以及相关系数的作用以及计算方法。
– 定义:
• 某一变量按变量值从小到大排列,位于数列中心的 变量值。
– 未分组数据:
• 排列后直接找中心位置,如果中心位置有两个,则 中位数是这两个数的算数平均值。
– 单项分组数据:
• 计算累计次数,累计次数的一半所对应(距离最近) 的分组为其中位数。
– 组距分组数据:(不做要求)
• 众数
– 定义:
– 1、确定组数 – 2、确定组距 – 3、确定组限 – 4、计算各组的次数 – 5、编制变量数列表
• 累积频数和累积频率
– 1、计算方法(演示)
– 2、洛伦兹曲线
• (1)定义:向上累积频率(数)的分布曲线 • (2)编制方法:
– 首先,将分配对象和接受分配者的数量化成结构相对数, 并进行向上累积
– 意义:(1)反映变量取值的一般水平

(2)反映密度曲线的中心位置
• 算术平均数
– 一般方法:
• (1)计算全部样本的变量值的和 • (2)总和除以样本的总数
– 1、简单算数平均数(未分组数据)
• 计算方法:变量值求和;除以样本数
– 2、加权平均数
• (1)单项分组数据
– 计算方法:变量值求和=加总(变量值*次数);样本数 =加总(次数)
– 能够理解:本章学习内容中的基本概念。
1.1 数据分组与变量数列
• 数据分组
• 对某一变量的不同取值,按照其自身变动特点和研 究需要划分成不同的组别
• 以便更好地研究该变量的分布特征及变动规律
– 单项分组 – 组距分组
• 变量数列的两个要素
– 组别 – 频(次)数
• 变量数列的编制方法(五步骤)
– 能够理解:概率与概率分析的相关概念、定义、定律和定理。 – 了解:大数定律与中心极限定理的本质内容。
2.1随机事件与概率
• 必然事件 • 随机事件 • 事件的关系(图形演示)
– 包含 – 相等 – 互斥 – 对立
• 事件的运算(图形演示)
–并 –交 – 补(对立) –差 – 互斥
• 随机事件的概率
1.4 偏度与峰度
• 1、偏度的测度
• (1)皮尔逊偏度系数 • (2)鲍莱偏度系数 • (3)矩偏度系数
– 正值则为右(正)偏,平均数大于众数 – 负值则为左(负)偏,平均数小于众数
• 2、峰度的测度
– 峰度值大于3为尖峰,小于3为平峰
1.5两个变量的相关关系
• 1、协方差
– 正值表示正相关 – 负值表示负相关
• 某一变量的全部取值中,出现次数最多的那个变量。
– 未分组数据众数:
• 统计每个取值的出现次数
– 单项分组数据的众数:
• 次数最高的分组对应的变量值
– 组距分组数据的众数:
• 次数最高的分组,按照上下限公式计算
• 算数平均数、中位数、众数的关系 • 1、对称分布
– 三者相等
• 2、右偏分布
– 众数<中位数<算数平均数
– 横轴表示接受分配者的累积,纵轴表示分配对象的累积
• (3)意义:对角线是绝对平等线,距离绝对平等线 越远,表示分配越不平等
• 变量数列分布图
– 柱状图 – 直方图
• 次数密度=次数/组距 • 频率密度=频率/组距
– 折线图
1.2 分布中心的测度
• 分布中心得概念和意义
– 定义:距离一个变量的所有取值最近的位置
及A与某一样本子空间同时发生的概率P(Abi)。
求A发生的条件下是子空间Bi发生的概率P(Bi|A).
– 2、已知子空间发生的概率,事件A在整个空间 发生的概率P(A)以及在子空间上的条件概率 P(A|Bi),求A发生的条件下是子空间Bi发生的概 率P(Bi|A).
• 3、左偏分布
– 算数平均数<中位数<众数
1.3 离散程度的测度
• 离散程度测度的意义
– 1、反映变量值之间的差异大小,反映中心指标 的代表性
– 2、反映密度曲线的形状
• 离散程度的测度指标
– 1、极差 – 2、四分位全距 – 3、平均差 – 4、标准差 – 5、方差 – 6、变异系数=标准差/均值
• (2)组距分组数据
– 计算方法:变量值=组中值;其他类似单项分组数据
• 调和平均数
– 例: 乡名
甲 乙 丙
平均亩产 总产量
播种面积
500
1300
700
3500
800
3600
– 要计算三个乡的平均产量
• 平均产量=总产量/总播种面积
– (1)三个乡的总产量 – (2)三个乡的总播种面积
• 中位数
• 2、相关系数
– 绝对值越大,相关度越高
rxy
=
s xy s xs
y
第2章 概率与概率分布
• 本章重点难点
– 1.随机时间与概率; – 2.随机变量及其分布; – 3.随机变量的数字特征与独立性; – 4.大数定律与中心极限定理。
• 学习目标
– 重点掌握:
• 1.随机事件概率的性质与计算; • 2.随机变量及其分布的性质与测定方法; • 3.随机变量数字特征及其测定方法。
相关文档
最新文档