数理统计模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计分析是进行科学预测、探索未来的重要方法; 统计分析技术是处理调查研究资料的必要工具。
第二节 描述性统计模型
一、集中趋势分析
(一)含义:
集中量数也称集中趋势量数,是用一个 数值去代表一组数据的一般水平。常用的集中 量数有平均数、中位数和众数。平均数是所有 测量数据的算术平均值,中位数是将测量数据 按大小顺序一分为二的变量属性值,即位于排 列顺序中间位置的数值,众数是测量数据中出 现频率最高的数值。
••••••• •

中间程度的正相关

•• •••••••••••
•••••••••••••••••••••••••••••••

| r | = 0.936
••••••••••••••••••••••••••
•• •
• • ••••
强的负相关
| r | = 0.560

• •••••••••••••••••••••••••••••••••••••••••••
二、统计的两种功能
描述与推理 描述性统计(descriptive statistics)
描述性统计是概括所取得数据的共有性质。 推论性统计(inferential statistics)。
推论性统计帮助研究人员对数据做出判断。
三、管理研究中统计分析的功能
统计分析的方法可以为管理研究提供一种清晰精确 的形式化语言;
e
残差(residuals(e)).
在SPSS统计软件中,具体操作是:在统计菜单 (statiatics)中单击摘要(summarize)、频数 (frequencies),并在频数对话框中选择所要的图 表(charts),即可获得这些图表。
第三节 推论性统计模型
统计推断的功能 从随机样本中推断总体参数特征、以统计为基 础验证假设。
中间程度的负相关
弱的正相关



• •
• •
••••••••••••
•••••••••••••••••••• •

••

| r | = 0.3390



••••••••••••••••••••••••••••••••••••

••
• •
• •

弱的负相关
回归分析
回归…寻找“Y”与“X”关系的方法 什么是回归?
单纯线性回归模型
Model
在这里, εi ~ iid N(0,σ2)
Yi = + xi + i (i = 1,.…, n)
i 是相互独立的 遵守N(0, 2) 的概率变量
y (xi, yi)
εi ei
x
✓定义 一个独立变量(x)与 一个从属变量(Y)间的关系 方程式化后显示的方法
通过样本推测的直线
一、双变量的回归分析与相关分析
回归分析模型
收入——X
居民储蓄量——Y
50 45 40 35 30 25 20 15 10
5 0
0
2
4
销售量 6
(一)回归模型
Y
50
45
40
35
30
25
销售量
20
15
10
5
0
0
2
4
6
来自百度文库
X
1、回归模型的概念
强的正相关


••
•• ••
••••••••••••••••

有一组数据是9位工人本月的产量:96、96、 97、99、100、101、102、104、155。
则:平均数为105.5,中位数为100,众数为 96。
(二)集中趋势分析的作用
集中量数说明某一管理现象在一定条件下,其数量的 一般水平。
集中量数可以对于在不同空间的同类现象进行比较。 集中量数可以对一定管理现象在不同时间中的变化进
其计算式为:
其中,为标准差
(x i x )2
N
,x为样本值,X
为平均数,N为样本总数。
三、 频数与频率分析
为直观地反映一组测量数据的分布状况,经 常用频数与频率分析。频数分布描述测量值中各 属性值出现的次数,频率分布则是用比率的形式 来表示,各属性值除以样本总数即可得到该属性 值的频率。
频数分布也可转化为可视化的表达方式,如长条 图、直方图、饼图。
描述“ Y”与“X”关系的数学方法 - 创建过程的“ 模型”。
✓确立X与Y的关联性
➢ 相关是告诉关系的程度,回归分析是找出Y=F(X)的函数关系式
单纯线性回归
回归分析的阶段
Data 收集
用散点图确认关系
用最小二乘法 推断总体
进行方差分析
画直线 (Line Fitting)
分析残差
此章的因子为一个,因子和输出值(Y) 的关系为直线关系的单纯线性回归 (Simple Linear Regression)
yˆ abx
未知的真实直线
y/x x
最小平方和的单纯回归
✓将误差平方和最小化的推断方法,找出将残差平方最小化的直线.
420
410
400
390
从 属
380
变 370
量 360
350
340
330
320


• ••






单纯回归直线




• ••
与回归直线的 差异
• 直线是以“最小平方和推断法 (least square estimation)”的 原则画出的.从资料的点到直线 的距离的平方和最小化.
行比较,以说明这些现象的发展趋势和规律。 集中量数可以用来分析某些管理现象之间的依存关系。
二、离散趋势分析
(一)含义
离散趋势分析是反映测量数据的分散程度,其 常用指标有:极差(range)与标准差(standard deviation)。极差是测量数据中的最大值与最小值之 间的差异,由两个极端值来决定,只适用于定距与定 比数据。标准差综合反映所有数据的分散程度,与平 均数配套使用,适用于定距于定比数据,
350
400
450
独立变量
拟合线,回归方程式构造
Scatter Plot Y vs.X with Fitted Line Y = a + bX
•直线的方程式是 Y = a +bX • a是 常数, b是斜率.
b • “拟合线”是包括实际点和直线的平
方差的和最小化后形成的直线.
• 实际资料的点和直线的差异称为
数理统计模型
主要内容
数理统计模型概述 描述性统计 推论性统计模型 统计模型中常见的错误 统计模型建立程式 举例
第一节 数理统计模型概述
一、统计分析概述
统计分析通过计算研究对象的特征的样本平 均值、方差,或者所占百分比,研究样本特征值 与母体特征值的关系,研究变量之间的关系,特 别是因果关系,从而发现被研究对象的发展规律, 或者验证有关假想、结论是否成立,验证有关理 论在新的时空中是否成立。进而可以针对深层原 因,引出改变客观世界的策略。
相关文档
最新文档