【速记】国家农业信息化工程技术研究中心 陈天恩:农业大数据的研究与实践
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【速记】国家农业信息化工程技术研究中心陈天恩:农业
大数据的研究与实践
因会后收到不少嘉宾反馈,对演讲内容非常感兴趣,演讲信息量大,现场又无法及时记录,特在后期推出嘉宾演讲速记系列,以最大程度弥补这个遗憾。导读【大数据在农业领域的应用案例】【演讲主题】农业大数据研究应用【演讲
内容】国家农业信息化工程技术研究中心信息工程部主任陈天恩,为大家介绍了农业大数据的研究与实践。演讲内容主要包括以下三个方面:一、农业大数据;二、如何利用大数据帮助农业生产节本增效;三、农业大数据的研究与实践。非常高兴受星环孙总的邀请,来跟大家聊聊关于农业大数据、农业信息化方面的工作。之前花了很长的时间了解过星环相关的产品和技术,也是结合我们十几年在做农业大数据过程当中碰到的一些困惑,跟星环的工程师有过几次比较深入的沟通,这是这次我来跟大家分享这个农业大数据相关工作的一个驱动力。农业大数据
还是要说一说农业,在座的各位可能做农业的不多,主要都是其他行业或者IT行业,大数据的来源就不用说了。从我们的观点来看,首先互联网是大数据的主要来源。另外这两年蓬勃发展的,特别是5G这些技术出现以后,物联网加速了大数据的发展,这可能是一个大的背景。但是从我们这个行
业来讲,农业大数据还略有不同,我们认为农业的大数据可能跟互联网关系不是特别大,跟物联网有一定的关系。简单概括一下,这不是一个定义,我们认为农业大数据是指农业的生产经营管理服务这个过程中产生的,符合大数据相关标准的这些数据的集合,以及其获取、分析、处理、管理和应用相关的技术。下面我还列了一些它主要的来源,包括这些图,每一个图都代表了目前关注度比较高,大家应用度比较高的农业方面的一些大的数据,来自于一些智能装备,来自于一些传感器、遥感卫星,或者是大家都知道一些基因测序数据,以及质检的一些相关机器的数据,也包括一些交易的数据和交互的数据。
农业气象数据。我们在平时工作当中用的比较多的一类称得上是大数据的,就是这个多尺度的农业气象数据,所谓的多尺度就是不同分辨率的,有的可能是以全球为观测尺度,有的是以亚洲为观测尺度,有的是一个省,甚至现在在农业里面可以做到一个乡镇或者一个地块,在多尺度的情况下,就有很多的气象数据,可以用在农业从宏观到微观的各个层面。动植物的生命基因数据。大家可能都知道全人类基因组测序的事情,现在在农作物这个领域,其实很多我们平时吃到的稻米、小麦,包括我们很多的蔬菜,都做了全基因组测序,在这里有很多DNA的信息,而这个信息数据量相当大,但
目前来讲它的95%以上的信息对我们人类来说还是一个谜
团,所以在这里有很多可以做数据分析挖掘的工作。
农业自然环境的数据。这个自然环境包括农田的土壤环境,包括水资源水环境,也包括农业涉及到的很多生产资料相关的环境数据,这也是一个非常大的命题。
农作物的生产观测数据。现在在农业领域有一个领域特别火,叫表型,或者基因型和表型相关性的一个研究。所谓的型就是农作物外观,它的一些性状是什么样的。现在所有的生物领域的和农学领域的同志们,都特别关心农作物生长的观测数据。以前我们没有很好的手段去做小尺度的观测,我们只能用卫星做大尺度的面状的观测。但是,现在随着很多仪器技术的发展,我们可以对一个单株来进行观测,这个时候产生的数据量相比以前翻了很多个数量级倍,所以对这种非常复杂的数据,它又有视频图象数据,又有传感器数据,还有一些生理生态指标的数据,很多非结构化的数据怎么处理,怎么去利用这些数据研究我们的作物,这个也是一个值得探讨的问题。
大家都知道现在没有多少人下地干活了,将来中国的农业主要靠农机装备来作业了,针对这种普通的拖拉机,当我们装上了很多传感器以后,它就成为一个智能化的农机装备,随之而来的它会产生很多数据,收集这些数据的目的是为了更好的让它执行田间作业,让它效率更高,成本更低,或者是执行得更到位,现在基本上我去过的、工作过的或者合作过
的一些农场,都号称自己现在是99.99%的机械化率,没有人下地干活了,这个时候靠农机可以采集很多的生产性的数据,从播种的数据一直到产量的数据,都可以靠农机实时的采收上来,现在我们针对这样的数据分析还刚刚开始起步。另外还有农产品流通的数据,这些大家都很容易理解,包括电商交易的数据。如何利用大数据帮助农业生产节本增效
通过这么多数据,在大数据平台的支撑下,我们要来发现一些科学规律。大家知道我们所在的宾馆的房子是设计师设计好蓝图,然后施工人员把它盖出来的,农作物现在基本都是长成什么样就是什么样,但是我们通过对数据的分析,特别是一些生物信息学的数据加进来以后,我们也可以来对作物进行设计,我希望这个水稻长成什么样,产量是多少,是可以一开始在分子层面就做好设计的。大家感兴趣的话,北大有一个作物设计创新实验室,这是一个非常火的领域,核心的内容就是要找出刚才我说的基因测序的信息跟这个表型
信息之间的相关性,有了这些相关性之后,我在基因层面对它进行调控或者编辑以后,这个作物就可以按照我的需要生长成我需要它成为的样子或者是产量。
这是一个广大的万亿级的市场,我们怎么用数据来帮助农业生产节本增效,这里可以讲上三天三夜,包括提高农产品的流动效率,大家都知道农产品暴涨暴跌,有的时候特别便宜,农民都不愿意卖,烂在地里了,有的时候特别特别贵,连个
大蒜都买不起,问题就出在采销两端的信息不对称。如果我们有一些好的信息采集和分析手段,就可以逐步消除这种信息不对称,让社会更加和谐,让劳动者有所得,让消费者能够吃上安全的农产品,这也是我们现在工作一个很大的领域。包括现在的生鲜电商,是电商的一个新的蓝海,在这里很多人在做用户消费行为的识别,推送一些好的农产品,帮它做更好的营销。农业大数据的研究与实践
下面说说我们的工作,我们的工作重点就是围绕农业数据智能在做一些算法的研究,平台的开发,和一些产业化的应用服务。
第一,农业大数据可视性服务的关键技术研究。因为农业领域存在一些问题和困难,传统的大数据技术或者信息技术在这里发挥作用还是有一定门槛的,或者有一些需要克服的技术瓶颈。我们重点从数据管理到知识发现。所谓的知识发现就是数据的挖掘,包括考虑个性化推送服务发布的相关技术。这是我们这两年做的一个数据模型,这在农业领域还是用得挺广泛的,大家都知道首先农田都是面状的,它有很多空间上面的属性,另外作物都是随着时间生长的,它有很多时序方面的特性,我们为了研究好这个农业,研究好这个作物或者动物的生长,我们首先要有一个好的数据结构去描述这种物理现象或者客观的现象,如果有个好的数据模型,可能我们的研究就事半功倍,如果没有很好的数据模型或者数学模