概率论与数理统计 课程设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
1.设计目的 (2)
2.设计原理 (2)
3.设计过程 (3)
3.1设计题目 (3)
3.2问题分析 (4)
3.3模型的建立 (6)
3.4模型的求解 (9)
4.总结 (9)
5.附录 (10)
1设计目的
1. 学习和掌握MATLAB 的有关命令。
2. 自已收集数据( 可以利用统计年鉴或其它公开的数据), 利用你的数据建立模型。
3. 说明模型的意义。
2.设计原理
回归分析是一种处理变量的统计相关关系的一种数理统计方法。回归分析的基本思想是: 虽然自变量和因变量之间没有严格的、确定性的函数关系, 但可以设法找出最能代表它们之间关系的数学表达形式。
回归分析主要解决以下几个方面的问题:
(1) 确定几个特定的变量之间是否存在相关关系, 如果存在的话, 找出它们之间合适的数学表达式;
(2) 根据一个或几个变量的值, 预测或控制另一个变量的取值, 并且可以知道这种预测或控制能达到什么样的精确度;
(3) 进行因素分析。例如在对于共同影响一个变量的许多变量(因素)之间, 找出哪些是重要因素, 哪些是次要因素, 这些因素之间又有什么关系等等。
回归分析有很广泛的应用, 例如设计数据的一般处理, 经验公式的求得, 因素分析, 产品质量的控制, 气象及地震预报, 自动控制中数学模型的制定等等。
多元回归分析是研究多个变量之间关系的回归分析方法, 按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分析), 按回归模型类型可划分为线性回归分析和非线性回归分析。
3.设计过程
3.1设计题目
下面为一家洗涤剂制造商的统计数据
利用数学软件及概率论与数理统计知识对以上数据进行分析,求出销售量与公司销售价格、其他公司销售价格和广告费用之间的关系。
3.2问题分析
抽象事物之间的关系很难用一种精确的方法表示出来,可以用回归分析对本题的各个变量进行处理,根据所给的数据构造回归模型,回归系数用最小二乘法进行估计。从而我们可以得出销售量与公司销售价格、其他公司销售价格和广告费用之间的关系,可实现解决、预测和控制销售量的发展情况。
3.3模型建立
数学符号: y 表示销售量
1x 价格差
2x 广告费
3x 其他公司的平均价格
4x 公司价格
1x =3x -4x ,
首先利用表中的数据分别作出 y 对1x 和2x 的散点图。
-1
-0.8-0.6-0.4-0.2
00.20.40.60.81
x
y
图1,销售量与价格差之间的关系
5
5.56
6.57
7.5
77.5
8
8.5
9
9.5
10
10.5
x
y
图2,销售量与广告费之间的关系
观察散点图可知 y 与1x 的关系是线性的,而 y 与2x 的关系是二次函数形式。得到回归模型
εββββ++++=2
2322110y x x x (1)
用 MATLAB 统计工具中的命令 regress 求解得表一数据:
由( 1 )解得的数据如表一所示,1β、2β的置信期间包含零点,不显著。分析模型可知1x 与2x 有交互作用,可把模型表示为:
εβββββ+++++=2142
2322110x x x x x y (2)
在用 [b,bint,r,rint,stats]=regress(y,x,alpha) 求得表二数据。显然表二的数据比表一好得多。
得到各因素与销售量的关系为:
212
2215516.21790.15449.131741743424.46x x x x x y -+-+= (3)
把 20 组数据带入加以检验:得 0y =8.0717。模型得到很好的拟合。得到销量与价格差和广告费之间的关系可用 (3) 近似表示出。
3.4模型求解
利用 MATLAB 的统计箱工具中的命令 regress 求解,使用格式为: [b ,bint ,r ,rint ,stats]=regress (Y ,X ,alpha ) 其中:
b 是回归系数的点估计值
alpha 为显著性水平(缺省时为 0.05 ) bint 为回归系数的区间估计
r 与 rint 分别为残差和置信区间
Stats 是用于检验回归模型的统计量,有三个数值,第一个是相关系数2γ,2γ越接近 1 ,说明回归模型越显著;第二个是F 值,)1,(1-->-k n k F F α时拒绝0H ,F 越大,说明回归方程越显著;第三个是对应的概率p ,μ
1.输入数据:
>> x=[1 -0.05 5.5 30.25
1 0.25 6.75 45.5625
1 0.6 7.25 52.5625
1 0 5.5 30.25
1 0.25 7 49
1 0.
2 6.5 42.25
1 0.15 6.75 45.5625
1 0.05 5.25 27.5625
1 -0.15 5.25 27.5625
1 0.15 6 36
1 0.
2 6.5 42.25
1 0.1 6.25 39.0625
1 0.4 7 49
1 0.45 6.9 47.61
1 0.35 6.8 46.24
1 0.3 6.8 46.24
1 0.5 7.1 50.41
1 0.5 7 49
1 0.4 6.8 46.24
1 -0.05 6.5 42.25];
y=[7.38;8.51;9.52;7.5;9.33;8.28;8.75;7.87;7.1;8;7.89;8.15;9.1;8.86;8.9;8.87;9.26;9;8.75;7.95;] ;
2.回归分析
alpha=0.05;
[b,bint,r,rint,stats]=regress(y,x,alpha)
rcoplot(r,rint)
b =
19.5662
0.7349
-4.5738
0.4333
bint =
5.5893 33.5430
-0.3829 1.8528
-9.2533 0.1058
0.0429 0.8238
r =
-0.1022
-0.1109
-0.1046