食品实验分析与设计·第八章 直线回归与相关_PPT幻灯片

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(yyˆ)0 ;
性质3 回 归 直 线 通 过 点 (x, y) 。
如果将 aybx式代入 yˆ abx 式,
得到回归方程的另一种形式(中心化形式):
y ˆ y b x b y x b ( x x )
【例8-1】食品感官评定时,测得食品甜度与蔗
糖浓度的关系如表8-1所示,试建立y与x的直线
变量间的关系
一类是变量间存在着完全确定性的关系,可以用精 确的数学表达式来表示。
如长方形的面积 (S) 与 长(a)和 宽(b)S=ab。 它们之间的关系是确定性的,只要知道了其中两个变 量的值就可以精确地计算出另一个变量的值,这类变 量间的关系称为函数关系。
另一类是 变 量 间不存在完全的确定性关系, 不能用精确的数学公式来表示。
依变量y的实际观测值总是带有随机误差,因 而依变量y的实际观测值yi可用自变量x的实际 观测值xi表示为:
yi xi i (i=1,2, …, n)
直线回归的数学模型
总体线性回归模型的图示
Y
yi xii 观察值
i
yxx
X
观察值
总体线性回归模型
参数
随机误差
yi xii
依变量
自变量
yx
y条件平均数
原因 Y

函数关系 有精确的数学表达式
(确定性的关系)
量 间
一元回归分析 直线回归分析 曲线回归分析


因果关系

非 相确
(回归分析)
多元非线性回归分析
多元回归分析 多元线性回归分析
关定
关性
系的 关 系
简单相关分析—— 直线相关分析
平行关系
(相关分析) 多元相关分析
复相关分析 偏相关分析
第一节 直线回归
一种是因果关系,即一个变量的变化受另一个或几个变量的影响。
如小麦的生长速度受遗传特性、营养水平、管理条件等因素
的影响。子代的体高受亲本体高的影响;
结果
Y1
X
Y2
Y3
另一种是平行关系,它们互为因果或共同受到另外因素的影响。
如人的身高和胸围之间的关系属于平行关系。
同胞间的身高或体重
结果X1
X2
X
Y
X3
原因
回归方程。
表8-1 食品甜度与蔗糖浓度的关系
蔗糖质量分数x % 1.0 3.0
甜度 y
15
18
4.0 5.5 7.0 8.0
9.5
19 21
22.6 23.8 26
(1)作散点图
以蔗糖质量分数 (x)为横坐标, 甜度(y)为纵坐 标作散点图,如 图8-2所示。
甜度 y
30
ቤተ መጻሕፍቲ ባይዱ25
20
15
10
5
0
0
2
4
从散点图可以看出:
①两个变量间有关或无关;若有关,两个变量 间关系类型,是直线型还是曲线型;
②两个变量间直线关系的性质(是正相关还是 负相关)和程度(是相关密切还是不密切);
散点图直观地、定性地表示了两个变量之 间的关系。为了探讨它们之间的规律性,还必 须根据观测值将其内在关系定量地表达出来。
如果把变量y与x内在联系的总体直线回归方程记 为y=α+βx
一、直线回归方程的建立
对于两个相关变量,一个变量用x表示,另 一个变量用y表示,如果通过试验或调查获得 两个变量的n对观测值: (x1,y1),(x2,y2),……,(xn,yn)
为了直观地看出x和y间的变化趋势,可将 每一对 观 测 值 在 平 面直角坐标系描点,作 出散点图
直线回归分析
• 二维散点图 作为相关分析最直观的表达形式莫过于用两 变量值绘制的散点分布图
b叫做样本回归系数,表 示 x 改 变一个 单位,y平均改变的数量。
b 的符号反映了x影响y的性质, b的绝对值大小反映了 x 影响 y 的 程度
yˆ 叫做回归估计值,是当x在在其研究 范 围
内取某一个值时y值平均数 x 的估计值。
回归方程的基本性质:
性质1 性质2
Q (yy ˆ)2最小;
如人的身高与体重的关系,作物种植密度 与产量的关系,食品价格与需求量的关系等等
特点:这些变量间都存在着十分密切的关系, 但不能由一个或几个变量的值精确地求出另一 个变量的值。
像这样一类关系在生物界中是大量存在的, 统计学中把这些变量间的关系称为相关关系, 把存在相关关系的变量称为相关变量。
相关变量间的关系一般分为两种:
Q (y y ˆ)2(y a b)2 x最小
根据微积分学中的求极值的方法,令
Q对a、b的一阶偏导数等于0,即:
Q bQa22ini1n1yyi iaabbxixixi00
整理得关于α 、b的正规方程组:
a nbxy
a xb x2 xy
解正规方程组,得:
x y (
b
x )(y )/n
分子是自变量x的离均差 与 依 变 量 y 的 离 均 差 的
乘 积和 (xx)y (y,)简 称 乘积和,记作 SPxy
S x y P ( x x ) y y ( ) x ( y x ) y ( ) / n
yˆ abx
α叫做样本回归截距,是回归直线与y轴交点的纵坐标, 当x=0时, = αyˆ;
在x、y直角坐标平面上可以作出无数 条直 线,我们把所有直线中最接近散点图中全部散点
的直线用来表示x与y的直线关系,这条直线称为
回归直线。 设回归直线的方程为:
yˆ abx
其中,a 是α的估计值,b是β的估计值。
a、b应使回归估计值 yˆ与实际观测值y
的偏差平方和最小,即:总的离回归平方 和,即剩余平方和
S x P y x y ( x ) n (y ) 8.1 5 3 6 1 7 8.7 4 6 5 .7 68 S y S y 2 y 2 /n 3.2 1 1 0 0 .4 4 2 4 /7 5 8 .0 4 3
(x x )y ( y ) SxP y
x2 ( x )2/n
(x x )2 SxS
aybx
b xx 2 y ( ( x )x )( 2/y n )/n (x (x x )x y ) ( 2y ) S S x xy P S
分母是自变量x的离均差 平方和 (xx)2,
记作SSX。
6
8
10
蔗糖质量分数 x %
图8-2 食 品 甜 度 与 蔗 糖 浓 度 的 关 系
(2)计算回归截距a,回归系数b,建立直线 回归方程
首先根据实际观测值计算出下列数据:
x x/n 3.0 8 /7 5 .4286
y y/n 1.4 /7 52.7 0714
S x S x 2 x 2 /n 2.5 5 3 . 9 0 2 8 /7 5 .2 3 1
相关文档
最新文档