数据分析导论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

我国优化试验设计方法
60末期代 末期代, ■60末期代,华罗庚教授在我国倡导与普及 优选法” 如黄金分割法、 的“优选法”,如黄金分割法、分数法和斐波 那契数列法等。 那契数列法等。 ■数理统计学者在工业部门中普及 “正交设 计”法 。 70年代中期 年代中期, ■70年代中期,优选法在全国各行各业取得 明显成效。 明显成效。
什么叫做试验设计方法? 什么叫做试验设计方法?
把数学上优化理论、技术应用于试验设计中, 把数学上优化理论、技术应用于试验设计中,科学 的安排试验、处理试验结果的方法。 的安排试验、处理试验结果的方法。 采用科学的方法去安排试验,处理试验结果, 采用科学的方法去安排试验,处理试验结果,以最 少的人力和物力消费,在最短的时间内取得更多、 少的人力和物力消费,在最短的时间内取得更多、 更好的生产和科研成果的最有效的技术方法。 更好的生产和科研成果的最有效的技术方法。
学习方式与要求
学习方式: 课堂教学+上机操作 学习方式 课堂教学 上机操作 学习要求:独立思考 学习要求: 考核方法: 考核方法:考试 总评成绩:平时 %+机试30% %+机试 总评成绩:平时20%+机试 % +笔试 50% %
以例1为例
假设每个金属离子取5个浓度(%): 假设每个金属离子取 个浓度(%): 个浓度 : Cu2+: 0.02,0.04,0.06,0.08,0.10 , , , , : 0.2,0.4,0.6,0.8, Zn2+: 0.2,0.4,0.6,0.8,1.0 : Mg2+:1.0பைடு நூலகம்2.0,3.0,4.0,5.0 , , , , : Fe3+: 0.2,0.4,0.6,0.8,1.0 , , , , : Na+: 1.0,2.0,3.0,4.0,5.0 , , , ,
例1
某同学做植物细胞培养实验的毕业论文时, 某同学做植物细胞培养实验的毕业论文时,需要考察 不同金属离子在不同浓度下对植物细胞生长的影响: 不同金属离子在不同浓度下对植物细胞生长的影响: : ~ : ~ %, : ~ %, Cu2+: 0~0.1%, Zn2+: 0~1%, Mg2+:0~5%, %, : : ~ % Fe3+: 0~1%, Na+: 0~5% ~ %, 试问:如何安排实验才能尽可能又好又快地完成实验? 试问:如何安排实验才能尽可能又好又快地完成实验?
例2
该同学在一次测量植物细胞培养液中Mg2+的残留量 该同学在一次测量植物细胞培养液中 (ppm)数据: )数据: 137 124 128 151 162 110 197 154 153 142 128 92 试问:这些数据中的197和92是否可信? 是否可信? 试问:这些数据中的 和 是否可信
优化试验设计方法发展
基本概念
1、实验设计 、
实验设计指对实验进行计划、安排和规划的过程。 实验设计指对实验进行计划、安排和规划的过程。
2、数据处理 、
数据处理就是对实验获得的数据进行分类、判别和分析的过程。 数据处理就是对实验获得的数据进行分类、判别和分析的过程。
本课程的意义
实验设计
1)事半功倍,节约时间和人力物力 )事半功倍, 2)减少实验的盲目性 ) 3)实验成功的根本保证 )
本课程的意义
数据处理
1)数据进行鉴别筛选 ) 2)优化实验方案 ) 3)获得科学规律 ) 4)预测未知结果 )
例3
时间(d) 0 1 2 3 4 5 6 蛋白质量(mg/L) 230 145 94.2 72.3 50.8 34.2 27.4
例3
250 蛋白质量(mg/L L) 200 150 100 50 0 0 1 2 3 4 5 6 7 时间(day)
我国优化试验设计方法
1978年 七机部由于导弹设计的要求, ■1978年,七机部由于导弹设计的要求,提出了 一个五因素的试验, 一个五因素的试验,希望每个因素的水平数要 多于10 而试验总数又不超过50 10, 50, 多于10,而试验总数又不超过50,显然优选法 和正交设计都不能用,随后,方开泰教授( 和正交设计都不能用,随后,方开泰教授(中 国科学院应用数学研究所) 国科学院应用数学研究所)和王元院士提出 均匀设计” “均匀设计”法,这一方法在导弹设计中取得 了成效。 了成效。
实验设计与数据处理
导论
课程度的性质: 课程度的性质:
试验设计方法是一项通用技术, 试验设计方法是一项通用技术,是当代科技人员必 须掌握的技术方法。 须掌握的技术方法。
课程的任务: 课程的任务:
熟悉并掌握近代最常用、 熟悉并掌握近代最常用、最有效的几种优化试验设 计方法的基本原理及其应用。 计方法的基本原理及其应用。
例3
250 蛋白质量(mg/ /L) 200 150 100 50 0 0 1 2 3 4 时间(day) 5 6 7 y = 0.3659x 4 - 5.7354x 3 + 35.057x 2 - 116.76x + 230.38 R 2 = 0.9995
本课程的内容
1)数据的基本判别与表示 ) 方差分析 2)数据的分析方法 ) 回归分析 单因素优化设计(对分法、黄金分割法、爬山法) 单因素优化设计(对分法、黄金分割法、爬山法) 3)实验设计 ) 正交设计 多因素优化设计 均匀设计 4)常用数据处理软件 ) Excel、Origin、Sas、Spss、Matlab等 、 、 、 、 等
优化试验设计方法发展
随后, ■随后, F.Yates,R.C.Bose,O.Kempthome,W.G.Cochran, D.R.Cox和G.E.P.Box对试验设计都作出了杰出 D.R.Cox和G.E.P.Box对试验设计都作出了杰出 的贡献,使该分支在理论上日趋完善, 的贡献,使该分支在理论上日趋完善,在应用 上日趋广泛。 上日趋广泛。 ■50年代,日本统计学家田口玄一将试验设计中 50年代, 年代 应用最广的正交设计表格化, 应用最广的正交设计表格化,在方法解说方面 深入浅出为试验设计的更广泛使用作出了众所 周知的贡献。 周知的贡献。
上世纪20年代,由于农业试验的需要, 20年代 ■上世纪20年代,由于农业试验的需要,费 (R.A.Fisher)在试验设计和统计分析方面做 歇(R.A.Fisher)在试验设计和统计分析方面做 出了一系列先驱工作, 出了一系列先驱工作,从此试验设计成为统计 科学的一个分支。 科学的一个分支。 上世纪40年代,在二次世界大战期间, 40年代 ■上世纪40年代,在二次世界大战期间,美 国军方大量应用试验设计方法。 国军方大量应用试验设计方法。
要做多少个实验? 要做多少个实验?
完全实验: 完全实验: N=55=3125(次) 正交实验: 正交实验: N=L25(56)=25(次) 均匀实验: 均匀实验: N=U8(85)=8(次)
相关文档
最新文档