美国政府的大数据计划
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
美国政府的大数据计划
2013/5/23 10:08:00来源:中国电子政务网【大中小】查看评论(0) 核心提示:近日,奥巴马政府宣布“大数据的研究和发展计划。”通过提高我们从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全,并改变教学研究。
美国国家医学图书馆
集成生物学及内部的信息(i2b2),旨在创造能够整合和交换医疗保健和生物医学研究数据的方法和工具。通过i2b2开发的软件工具整合、挖掘和表示的数据,能够通过共享开源和开源管理下,在全球50多个组织进行使用。
行为与社会科学办公室(OBSSR)
国家老化计算机化数据存档(NACDA) 通过在老龄上的研究,帮助研究人员从有开发潜力广泛数据集上获得利润。NACD保存和提供美国老龄最大的电子图书数据。
人口研究的数据共享(DSDR)提供的数据归档,保存,传播和其他数据的基础设施服务。 DSDR朝着一个统一的法律,技术和实质性框架工作,在其中分享人口科学的研究数据。
NIH – NSF联合项目
在计算神经科学的合作研究(CRCNS)是一个NIH-NSF联合支持的项目,帮助合作研究项目之间的计算科学家和神经科学家促进对神经系统的结构和功能,神经系统紊乱机制和神经系统所使用的计算战略机制的认识。近年来,德国联邦教育和研究部还加入了在德国的方案,并支持研究。
美国国家科学基金会(NSF)
推进大数据科学与工程的核心技术(BIGDATA)是一个NSF和NIH之间新的联合招标项目,旨在促进管理、分析、可视化和从大量多样分散异构的数据集中提取有用信息的核心技术。具体来说,将会支持对数据的管理、数据分析、与电子科学的合作,帮助在科学、工程、医学技术和工具的开发和评估方面取得突破性的研究和创新,使美国在基础技术上未来保持几十年的竞争力。
用于21世纪科学与工程学的网络基础设施框架(CIF21)开发,整合,协调,充分利用了一套先进的网络基础设施方案,通过整个国家科学基金会的努力,创造有意义的网络基础设施,以及一体化水平的数据和工具,以支持科学和教育。
NSF通过联合计划,建立一个新的CIF21对综合研究生教育和研究培训实习生的跟踪计划(IGERT)。目的是新一代的研究人员能够解决基本的大数据有关的核心技术和技术的挑战,能够在跨学科进行网络基础设施的教育和支持。
引文数据,能够提供透明和可持续使用和引用的数据集,由一封联邦政府工作人员发起的信中开始进行资助,反映了联邦政府在基金资助研究数据的管理和可持续发展。
数据和软件保护的开放科学(DASPOS)第一次尝试建立一个来自大型强子对接机和费米实验室的理学家与,数字保管、异构存储系统、大规模计算机系统方面专家之间的正式合作。其目的是制定和执行紧集的定义,参赛者大型活动所依据的大规模,长期的计划,以及各学科之间的共性指标。EarthCube支持引导社区网络基础设施的发展,将数据集成到一个框架,加快地质科学知识的传递。 NSF 的刚刚宣布CIF21框架内第一轮EarthCube奖项,通过探索性研究(EAGER的)机制的早期概念资助,第一步是在地学行为研究上打下基础。
Mission-oriented Resilient Clouds 项目通过技术进行检测,诊断并对攻击作出响应,有效地建立了“社区卫生服务系统”的云,以解决云计算固有的安全挑战。该方案还旨在开发新技术,使云应用和基础设施受到攻击时能够继续运行。只要整体能够有效的运行和保存,可以允许个别主机和任务损失。
对加密数据的编程计算(PROCEED)的研究工作旨在开发实用的方法,相关现代化计算编程语言,使数据加密时仍然能使用云计算环境,以克服信息安全的重大挑战。使用户能够不需首次解密的情况下能够操纵加密的数据,它将使得对手拦截信息更加困难。
在视频和图像的检索和分析工具(VIRAT)计划旨在开发一个系统能够利用军事图像分析员收集的数据进行大规模的军事图像分析。VIRAT如果成功,将使分析师能够在相关活动发生时建立警报。VIRAT还计划开发工具,能够以更加准确率和召回率的去从大量视频库里进行视频内容的检索。
XDATA项目计划旨在开发用于分析大量的半结构化和非结构化数据的计算
技术和软件工具。最核心的挑战是,可伸缩的算法在分布式数据存储应用、如何使人机交互工具能够有效的迅速定制不同的任务,以方便对不同数据进行视觉化处理。对开源软件工具包的灵活使用,使得能够处理大量国防应用中的数据。
国土安全部(DHS)
卓越研究中心和可视化数据分析(CVADA),罗格斯大学和普渡大学(以及另外三个伙伴大学)的研究人员之间进行协作,通过对大量的异构数据进行研究,使
得急救员可以发现人为或自然灾害、恐怖事件,需要执法的边境安全问题,网络威胁的爆炸物。
能源部 (DOE)
高级科学计算研究办公室(ASCR)提供数据管理,可视化和数据分析的社区,包括数字化保存和社区访问。套件程序里包括广泛使用数据管理的技术,如开普勒科学的工作流程系统;存储资源管理标准;各种数据存储管理技术,如BeSTman,大容量数据移动器和适应式的IO系统(ADIOS); FastBit数据索引技
术(雅虎使用)和两个主要的科学可视化工具,ParaView 和 VisIt。
高性能存储系统(HPSS)是对磁盘和磁带系统上PB级数据进行管理的数据管理软件。由美国能源部和IBM开发的HPSS在世界各地的大学和实验室的使用,用在数字图书馆,国防应用和包括纳米技术,基因组学,化学,磁共振成像,核物理,计算流体力学,气候在内的一系列学科,以及诺斯罗普·格鲁门公司,美国国家航空航天局(NASA)和美国国会图书馆。
对千万亿次的数据分析处理从庞大的科学数据集提取信息,发现其主要特征,并理解其间的关系。研究领域包括机器学习,数据流的实时分析,非线性随机的数据缩减技术和可扩展的统计分析技术,广泛适应于从能源部到电网,包括宇宙学和天气数据,传感器数据等。
下一代网络方案支持工具,使得合作研究在能够进行重大发现,包括2001
年的Globus中间件项目大量数据的移动和使用, 2003年的GridFTP的数据传
输协议, 2007年的地球系统网格(ESG)的工具。今天的GridFTP的服务器开放
科学网格,ESG,和生物社区的科学数据每月超过1 PB的移动。 Globus中间件也被得克萨斯大学,软件公司,石油公司利用并一起合作,培养学生能够使用先进的石油工程方法和集成的工作流程。
基础能源科学办公室(BES)
BES的科学用户设施支持旨在协助用户数据管理和分析大数据,可每天从一个单一的实验数据大容量化(1012字节)努力。例如,加速数据采集,处理和分
析(ADARA)项目解决了数据的散裂中子源(SNS)的数据系统提供实时分析,实验控制的工作流程需要,以及已经建立X射线影像资料库,以最大限度地提高数据的可用性和更有效地利用同步加速器光源。
在2011年10月,由生物工程学会和ASCR的基础能源科学的数据和通信研讨会将确定实验数据的需求,这可能会影响的科学发现。