基于人体营养健康角度的中国果蔬发展建模_于慧
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
芒果 、 橙子产量数据来源于 F AO S TAT 数据库 注 :
表 3 蔬菜聚类分析结果表
类别 第1类 第2类 第3类 第4类 第5类 第6类 第7类 茄子 胡萝卜 , 菠菜 小白菜 , 生菜 , 韭菜 , 蘑菇 西红柿 , 南瓜 萝卜 , 大白菜 , 芹菜 圆白菜 , 青椒 , 土豆 , 苦瓜 , 菜花 黄瓜 , 丝瓜 , 竹笋 , 冬瓜 蔬菜种类
·2 5·
· 课题集锦 ·
基于人体营养健康角度的中国果蔬发展建模
2 0 1 5年6月
因此需要寻找第二个乃至第三 、 第四个主成分 , 第二个主成分不应该再 包 含 第 一 个 主 成 分 的 信 息 , 依次 类推 , 统计上的描述就是让这两个主成分的协方差为零 , 几何上就是这 两 个 主 成 分 的 方 向 正 交 。 具体确 定各个主成分的方法如下 :
2 0 1 1年 3 5 9 8. 4 8 5 4 2. 6 8 4 3 5. 0 0 6 8 8 9. 3 5 1 5 7 9. 4 8 2 4 9. 0 8 1 0 4 0. 0 0 9 0 6. 7 5 2 7 1. 1 0 5 8 3. 5 0 2 2 7 6 8. 1 8 7 0. 9 0
檺檺檺檺檺檺殣
课题集锦
基于人体营养健康角度的中国果蔬发展建模
于 慧1, 葛永錱2, 南 旭1
( ) 中国海洋大学 经济学院 , 山东 青岛 2 中国海洋大学 数学科学学院 , 山东 青岛 2 1. 6 6 1 0 0; 2. 6 6 1 0 0
摘 要: 我国食物生产在一定程度上依然不能适应营养需求 , 居民营养不足与 过 剩 并 存 。 为 了 解 决 这 个 问 题 , 本文 将数据范围定位在常见的果蔬品种上 , 对其所含营 养 成 分 进 行 主 成 分 分 析 和 聚 类 , 选 择 主 要 的 蔬 菜 水 果。利 用 损 用线性回归的方法 , 通过对以 往 数 据 的 分 析 , 构 建 模 型 预 测 果 蔬 的 消 费 量。进 一 步 地, 构建线 耗率和马尔可夫链 , 性最优化模型来确定不同经济区域 、 不同季度的主要蔬菜水果的最合理消费量 和 购 买 成 本 。 基 于 居 民 人 体 的 营 养 均衡 、 购买成本 、 种植者收益 、 进出口贸易以及土地面积等多方面因素的考虑 , 构建多目标规划模型, 寻找最优的产 量和消费量 。 从种植产量 、 价格 、 国民营养摄入等方面向有关部门提出合理化建议 。 关键词 : 主成分分析 ; 聚类分析 ; 马尔可夫链预测 ; 线性回归 ; 自回归滑动平均模型 ; 多目标规划 ( ) 中图分类号 : O 2 9 文献标志码 : A 文章编号 : 2 0 9 5 3 0 7 0 2 0 1 5 0 2 0 0 2 5 1 3 - - -
表 1 水果聚类分析结果表
类别 第1类 第2类 第3类 第4类 第5类 第6类 第7类 苹果 大枣 芒果 梨, 橘子 , 西瓜 , 哈密瓜 , 木瓜 , 枇杷 杏, 草莓 , 柚子 , 荔枝 , 龙眼 , 柠檬 , 无花果 , 樱桃 , 金橘 , 石榴 香蕉 , 山楂 , 椰子 , 榴莲 , 火龙果 桃子 , 李子 , 葡萄 , 橙子 , 桑葚 , 柿子 , 菠萝 , 杨梅 , 杨桃 , 山竹 , 番荔枝 水果种类
Z Mp , 1 =a 1 1M1 +a 1 2M2 + … +a 1 p 烄 Z Mp , 2 =a 2 1M1 +a 2 2M2 + … +a 2 p 烅 Zm = a m 1M1 +a m 2M2 + … +a m pMp , 烆 …, 其中 : Z i 个主成分 ; M1 , M2 , Mp 表示作为营养成分的指标 。 i 表示第
2 0 0 9年 3 1 6 8. 0 8 4 2 4. 7 8 4 0 0. 0 0 6 4 7 8. 4 7 1 4 2 6. 3 0 2 2 0. 6 0 8 8 3. 3 9 7 9 4. 0 6 2 8 7. 5 6 4 6 3. 3 4 2 0 3 9 5. 5 1 7 1. 3 0
2 2 2 , …, ( …, 对 每一个i均有a 且( 使得Z a a a a a a a a i 1+ i 2+ … + i 1 1, 1 2, 1 1 样本方差最大 , 2 1, 2 2, 2 p =1 p) p)
…, , 不仅垂直于 ( 同时满足使 Z 依此类推 , 即可求得全部主成分 。 利用附件 a a a 1 1, 1 2, 1 2 样本方差最大 , p) 中的主要水果的 营 养 成 分 表 , 对水果各个成分含量( 维 生 素 A、 生 物 素、 胡 萝 卜 素、 叶 B 1、 B 2、 B 6、 C、 E, 酸、 泛酸等 )进行主成分分析 , 其特征值为 ( 0. 0 0 2 1 9, 0. 0 0 3 8 7, 0. 0 5 6 0 7, 0. 0 7 8 1 7, 0. 1 7 4 2 4, 0. 1 8 5 8 0, 0. 2 8 3 6 1, 0. 3 6 9 0 7, 0. 4 8 8 8 5, 0. 5 6 5 0 0, ) 。 0. 7 5 5 8 0, 0. 9 8 7 6 6, 1. 0 8 5 7 2, 1. 1 4 4 2 6, 1. 3 3 8 1 5, 1. 3 7 3 8 1, 1. 7 4 1 8 9, 2. 1 6 1 3 9, 2. 6 5 8 8 4, 4. 4 9 1 0 6 按特征值从大到小进行排序 , 选择前 9 个特征值所对应的特征向量作为主成分的系数 。 前 9 个特征值的 在本数据样本中是 8 和占比就是选取的 9 个主成分的贡献度 , 5% 。 利用 M 提取9个主要成分 , 使累计贡献率达到8 从大到 a t l a b对营养成分进行主成分分析 , 5% 以上 , …, 分别记为 Z 将主成分贡献度作 为 权 重 数 , 得 到 综 合 主 成 分, 作 为 营 养 成 分 的 指 标。 小排序 , Z Z 1, 2, 9。 同理 , 蔬菜的营养成分指标提取了6个主成分 , 累计贡献率达到9 因此认为 , 原指标的线性组合生成 1% , 的这些新指标可以很好地概括原来成分所代表的信息 。 1. 3 以主要理化指标为基础对果蔬进行聚类 为了选择主要的果蔬品种 , 考虑将主要成分含量相近的品种归为一类 , 这样任选其中一种或几种就 可以满足人体对相应营养成分的需求 。 同时 , 将常见的果蔬进行聚类 , 进而从每一类别中选取产量较大 的作为该类品种的代表 。 , 利用 M 输入主要成分含量的数据 , 进行聚类分析 , 结果如表 1 所示 。 a t l a b
第4卷 第2期 2 0 1 5年6月 檺檺殣 檺檺檺檺檺檺檺殣
数学建模及其应用 M a t h e m a t i c a l M o d e l i n a n d I t s A l i c a t i o n s g p p 檺殣
V o l . 4N o . 2 J u n . 2 0 1 5
1 主要蔬消除食品营养成分的量纲 由于各营养成分指标单位可能不一样 , 如果各自改变量纲 , 结 果 会 不 一 样。 本文首先对数据进行标 准化处理 , 采用平移极差变化 : i n{ i i j- m j} ξ ξ 1≤ i 6 ≤3 , …, 2, 2 0。 j = 1, ξ = m a x{ i n{ - m i i j} j} ξ ξ
步, 为了防止指标之间的共线性可能对信息的表示造成重复 , 故采取主成分分析对指标进行降维处理 。 以水果为例 , 一种水果不会包含所有的2 即1个主成分不足以代表原来的2 0种营养成分 , 0个变量 ,
收稿日期 : 2 0 1 4 1 1 2 6 - - : _ 通讯作者 : 于慧 , E-m a i l u h u i v i v i a n e a h. n e t @y y
蘑菇南瓜产量数据来源于faostat数据库72课题集锦基于人体营养健康角度的中国果蔬发展建模2015年6月表5主要的蔬菜水果代表品种表代表品种主要水果苹果大枣芒果西瓜草莓香蕉葡萄柿子橙子梨主要蔬菜茄子胡萝卜菠菜蘑菇西红柿黄瓜南瓜萝卜大白菜芹菜土豆2主要蔬菜水果的营养成分摄入量预测在假设蔬菜水果的营养成分不随年份改变而变化的前提下对于蔬菜水果的年人均消耗量分别从城镇和农村两方面考虑从中华人民共和国统计年鉴获取19902012年的城镇农村居民蔬菜水果年人均消费量主要水果和蔬菜的年总产量和中国总人口数
利用中华人民共和国统计年鉴查询蔬菜和水果的产量 , 缺少的数据利用其他数据库予以补齐 。 第1类到第3类自成一类 , 对于第4类到第7类的水果 , 通过分析其产量来确定其代表品种 , 以满足 人 体对不同营养成分的需求 , 其结果如表2所示 。 其中 , 第4类的代表水果是梨 、 西瓜 , 第5类是草莓 , 第6 类是香蕉 , 第 7 类是葡萄 、 柿子和橙子 。 同样地 , 对蔬菜做相同处理 , 其聚类分析结果如表 3 所示 , 主要蔬 菜的产量及在蔬菜中所占份额如表 4 所示 。 由上述分析可以得出代表蔬菜和水果的品种 , 如表5所示 , 可以分别满足占蔬菜水果总产量的7 0% 和6 其所含的各营养成分的含量和种类可以满足人体所需 。 5% 左右 ,
·2 6·
第 4 卷第 2 期
数学建模及其应用
表 2 2 0 0 8-2 0 1 1 年主要水果的产量及其占额表
V o l . 4N o . 2 J u n . 2 0 1 5
水果 / 万吨 苹果 大枣 芒果 西瓜 梨 草莓 香蕉 葡萄 柿子 橙子 水果总产量 主要水果产量份额 /%
2 0 0 8年 2 9 8 4. 6 6 3 6 3. 4 1 3 8 0. 0 0 6 2 8 2. 1 7 1 3 5 3. 8 1 2 0 0. 0 4 7 8 3. 4 7 7 1 5. 1 5 3 1 8. 7 2 3 9 3. 6 9 1 9 2 2 0. 1 9 7 1. 4 2
2 0 1 0年 3 3 2 6. 3 6 4 4 6. 8 3 4 0 0. 0 0 6 8 1 8. 1 0 1 5 0 5. 2 6 2 3 3. 0 0 9 5 6. 0 5 8 5 4. 9 0 2 8 3. 4 2 5 4 1. 8 0 2 1 4 0 1. 4 5 7 1. 8 2
′ i j
1≤ i 6 ≤3 1≤ i 6 ≤3
′ ] 。 其中 , 这样就消除了量纲的限制 , 且ξ i 中的j 指标含量 。 0, 1 i i j 控制在 [ j 表示蔬果品种 ξ 1. 2 主成分分析提取主要理化指标 鉴于本问题涉及的数据维数较高 , 数据量较大 , 很多统计方法 在 高 维 下 有 一 定 的 偏 移 和 误 差 ; 进一
食物供需基本平衡 , 食品安全 状 况 总 体 稳 定 性 好 , 居民营养健 我国农产品综合生产能力稳步提高 , , 。 , 居 康状况得以明显改善 食物与营养发展成效显著 尽管如此 我国食 物 生 产 依 然 不 能 适 应 营 养 需 求 , 国务院办公厅正式颁布 《 中国 民营养不足与过剩现象并存 。 为了规划解决该问题 , 2 0 1 4年1月2 8 日, 》 。 纲要指出 , 食物与营养发展纲要 ( 我国要推广膳食结构多样化的健康消费模式 , 保障 2 0 1 4-2 0 2 0年) 充足的能量和蛋白质摄入量 , 控制脂肪摄入量并保持适量的维生素和矿物质摄入量 , 充分保证人体营养 素的摄入量 。 蔬菜水果都是富含营养素的主要农产品 , 为人体提供矿物质 、 维生素和膳食纤维等 。 为实现人体营养均衡 , 满足健康需要 , 国家需要对蔬菜水果生产规模做出战略性调整 。 科学决策的 基础是较准确地掌握现实情况 。 我国蔬菜水果种类繁多 , 官方发布 的 相 关 数 据 缺 失 现 象 普 遍 。 本 文 利 用世界粮农组织 、 美国农业部等数据库分析主要的蔬菜水果 , 并预测其 消 费 量 发 展 趋 势 , 通过建立和求 解优化模型来分析主要蔬菜水果的最优产量和消费量 , 尝试从种植 、 价 格、 国民营养摄入等方面向有关 部门提出合理化建议 。