大数据与政务信息共享应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
让数据说话—数据挖掘案例
2009年致命交通事故按星期和时间对比
挖掘1:每天的 18:0挖0-挖掘21掘2:0Fra Baidu bibliotek30:就是从单交一天通周来的看时
挖掘结论:每天晚上18点到事2故1,的点间黑高一段色发来般星时看期段是,六,晚星为期单天的 18:0天0-午死21夜亡:0零数0也点之是至冠人三,点其,是
1994年,纽约警察局梅普尔组织开发了一个以地图为基础的统计分析系 统,治安开始逐年好转,应用第一年凶杀案就减少24%,到2009年凶杀案减 少了70%,使纽约跻身全美最安全的大城市行列,CompStat系统名扬全球。
电子化
地图墙:跟踪劫案发生的时间、地点,
分析其原因和规律。
将每天发生的各种罪案录入CompStat系统, 进行加总和分析,形成“可预测未来的图5表”
信息
一个单身公寓的 面积是30平米
提炼规律
知识
我国的人均居住 面积是30平米
数
据 价
知识
值
信息
数据
抢占“大数据”这个前沿,无异 于抢占了下一个时代的“石油” 和“金矿”。
4
数据规模
美国纽约治安管理的应用案例
纽约是美国人口数量最多、密度最大、多元化程度最高的城市。70年代起 ,黑帮横行、毒品泛滥,治安不断恶化。
图形说明:12个扇形代表12个月份,内环蓝色
代表战斗死亡的人数,外环红色代表非战斗死亡
的人数,也就是可以预防、改善医疗卫生的原因 10
让数据说话--数据可视化案例
➢ UGC【用户产生信息】数据
通过媒体、网络等渠道,在地图上呈现发布信息用户的分布状态,以 及查看上传文件。
让数据说话--数据可视化案例
沃尔玛的啤酒和尿布的故事
数据挖掘的经典案例: 沃尔玛啤酒和尿布的故事
沃尔玛通过对大量的销售数据进行数据挖掘
,发现一些年轻的爸爸经常要去超市购买婴儿尿
布,有30%到40%的新爸爸会顺便买点啤酒犒劳
自己。沃尔玛随后对啤酒和尿布捆绑进行销售,
不出意料,销售量双双增加。
6
数据应用的4个阶段
数据库
存储、查询数 据,造成信息 孤岛、信息壁 垒。 “巧妇难为无 米之炊”
一、 大数据的背景
1
什么是大数据
大数据(Big Data) 是指那些大小已经超出了传统意义上的尺度,
一般的软件工具难以捕捉、存储、管理和分析的数据。 “大数据”的意义不仅在于其“容量之大”,更多意义在于人类可以“
分析和使用”的数据在大量增加,通过数据的交换、整合和分析,可以发现 新的知识,创造新的价值,带来“大知识”、“大科技”和“大发展”。
数据开放是世界的潮流和趋势,我们要做的第一步是政府
14
间数据的共建共享!
二、政务信息共享的思考
15
问题1:政府内部复杂的工作流程
➢ 办理申领养老金手续
人社局
社保征 收窗口
首次参保时,核验身 份证、户口本
全球数据从数量、速度、多样性三个维度,呈现爆炸性增长。 数据爆炸
2
大数据时代的要求
人口
13.7亿
收集数据、使用数据、开放数据
互联网用户
手机用户 2010年新增数据量
3500拍
9.5亿
4.8亿
3亿 2.4亿
3亿 250拍
中国 美国
中国 美国
中国 美国
中国 美国
1拍=100万G,
相当于100万部电影的大小
2009
美国政府建立数据开放门 户网站Data.Gov ,全面开 放政府所拥有的公共数据 ,一年后,开放数据总数 达到27万项
2011
国际上成立了“开放政府 联盟”,先后有31个国家
/地区建立了公共数据的开 放网站(包括香港、新加 坡、韩国)
政府主导,向全社会开放的公共数据,成为社会创新的一 个平台。美国data.gov网站中 25%的数据分析工具由社会 力量自发开发,并得到广泛应用。例如航班延误分析系统 、商品召回手机查询系统等。
餐结束时间,周末凌晨0点到们3点驾次车是致是出泡命星行时吧期最段天活结,。跃束其的次是星 时间,许多人容易酒驾导致致时命段交。期通六事的同故一发时段 生。交警部门有针对性地在这两个时间段开 展每天查各时酒间驾段致行命交动通事,故可数据以分析有效预防事故的发生, 达一到一周周事时事间半故段数发功比生对倍事故的数据效比对果。
中国人口是美国的4.56倍,互联网用户是美国的2倍,手机用户是美国
3
的3倍,但新增数据量却只是美国的7%、欧洲的12%、日本的62%。
当今世界的大数据浪潮
与互联网的发明一样,大数据浪潮绝不仅是信息技术领域的革命,更是 在全球范围启动透明政府、加速企业创新、引领社会变革的利器。
数据
30是个数据
赋予背景
8
8
让数据说话--数据可视化
基础信息资源库
数据可视化
对海量的数据进行分 析和建模,发现数据 之间隐藏的关系、模 式和趋势,为决策者 提供依据。
以电子地图为基础,直 观展示人口、法人、房 屋(城市部件)等公共 基础信息及事件情况, 为各级各部门科学决策 提供数据支撑和依据。
查询 服务
统计 服务
专题 应用
➢ 城市人群的即时定位窗口
我们通过网络搜索分析人们在公众媒体上传的信息,根据信息分类直
观展示不同人群的地理分布位置。
Live Streams
让数据说话--数据可视化案例
➢ 关系可视化
将人与人、人与房、人与法人之间的关系进行可视化呈现。
数据开放是世界的潮流和趋势
2004
民间首个公共数据开放网 站,主要是国会立法法案 数据库
分析 服务
9
让数据说话--数据可视化案例
一份图表催生了一座医院,改变了一个制度
1850年代的克里米亚战争期间,现代护 理业之母--南丁格尔根据战场死亡情况的统 计进行数据可视化的探索,自行设计了历史 上第一份“极区图”,清晰地反映了“战斗 死亡”和“非战斗死亡”两种原因死亡人数 的悬殊对比,强烈的视觉效果引起了英国社 会的极大反响,直接促成了英国政府出台建 立野战医院的决定。
数据仓库
将各个不同系统的数 据,按统一定义的格 式提取出来,通过清 洗、转换、集成,最 后百流归海。
数据挖掘
对海量的数据进行分 析和建模,发现数据 之间隐藏的关系、模 式和趋势,为决策者 提供依据。有了数据 仓库的依托,数据挖 掘犹如“巧妇”走进 了“米仓”。
数据可视化
把复杂的数据之间的关 系和发展趋势,用更为 直观的图形、地图、动 画等方式,呈现给最普 通的用户,让数据成为 贴近大众生活、浅显易 懂、人皆可用的工具和 手段
让数据说话—数据挖掘案例
2009年致命交通事故按星期和时间对比
挖掘1:每天的 18:0挖0-挖掘21掘2:0Fra Baidu bibliotek30:就是从单交一天通周来的看时
挖掘结论:每天晚上18点到事2故1,的点间黑高一段色发来般星时看期段是,六,晚星为期单天的 18:0天0-午死21夜亡:0零数0也点之是至冠人三,点其,是
1994年,纽约警察局梅普尔组织开发了一个以地图为基础的统计分析系 统,治安开始逐年好转,应用第一年凶杀案就减少24%,到2009年凶杀案减 少了70%,使纽约跻身全美最安全的大城市行列,CompStat系统名扬全球。
电子化
地图墙:跟踪劫案发生的时间、地点,
分析其原因和规律。
将每天发生的各种罪案录入CompStat系统, 进行加总和分析,形成“可预测未来的图5表”
信息
一个单身公寓的 面积是30平米
提炼规律
知识
我国的人均居住 面积是30平米
数
据 价
知识
值
信息
数据
抢占“大数据”这个前沿,无异 于抢占了下一个时代的“石油” 和“金矿”。
4
数据规模
美国纽约治安管理的应用案例
纽约是美国人口数量最多、密度最大、多元化程度最高的城市。70年代起 ,黑帮横行、毒品泛滥,治安不断恶化。
图形说明:12个扇形代表12个月份,内环蓝色
代表战斗死亡的人数,外环红色代表非战斗死亡
的人数,也就是可以预防、改善医疗卫生的原因 10
让数据说话--数据可视化案例
➢ UGC【用户产生信息】数据
通过媒体、网络等渠道,在地图上呈现发布信息用户的分布状态,以 及查看上传文件。
让数据说话--数据可视化案例
沃尔玛的啤酒和尿布的故事
数据挖掘的经典案例: 沃尔玛啤酒和尿布的故事
沃尔玛通过对大量的销售数据进行数据挖掘
,发现一些年轻的爸爸经常要去超市购买婴儿尿
布,有30%到40%的新爸爸会顺便买点啤酒犒劳
自己。沃尔玛随后对啤酒和尿布捆绑进行销售,
不出意料,销售量双双增加。
6
数据应用的4个阶段
数据库
存储、查询数 据,造成信息 孤岛、信息壁 垒。 “巧妇难为无 米之炊”
一、 大数据的背景
1
什么是大数据
大数据(Big Data) 是指那些大小已经超出了传统意义上的尺度,
一般的软件工具难以捕捉、存储、管理和分析的数据。 “大数据”的意义不仅在于其“容量之大”,更多意义在于人类可以“
分析和使用”的数据在大量增加,通过数据的交换、整合和分析,可以发现 新的知识,创造新的价值,带来“大知识”、“大科技”和“大发展”。
数据开放是世界的潮流和趋势,我们要做的第一步是政府
14
间数据的共建共享!
二、政务信息共享的思考
15
问题1:政府内部复杂的工作流程
➢ 办理申领养老金手续
人社局
社保征 收窗口
首次参保时,核验身 份证、户口本
全球数据从数量、速度、多样性三个维度,呈现爆炸性增长。 数据爆炸
2
大数据时代的要求
人口
13.7亿
收集数据、使用数据、开放数据
互联网用户
手机用户 2010年新增数据量
3500拍
9.5亿
4.8亿
3亿 2.4亿
3亿 250拍
中国 美国
中国 美国
中国 美国
中国 美国
1拍=100万G,
相当于100万部电影的大小
2009
美国政府建立数据开放门 户网站Data.Gov ,全面开 放政府所拥有的公共数据 ,一年后,开放数据总数 达到27万项
2011
国际上成立了“开放政府 联盟”,先后有31个国家
/地区建立了公共数据的开 放网站(包括香港、新加 坡、韩国)
政府主导,向全社会开放的公共数据,成为社会创新的一 个平台。美国data.gov网站中 25%的数据分析工具由社会 力量自发开发,并得到广泛应用。例如航班延误分析系统 、商品召回手机查询系统等。
餐结束时间,周末凌晨0点到们3点驾次车是致是出泡命星行时吧期最段天活结,。跃束其的次是星 时间,许多人容易酒驾导致致时命段交。期通六事的同故一发时段 生。交警部门有针对性地在这两个时间段开 展每天查各时酒间驾段致行命交动通事,故可数据以分析有效预防事故的发生, 达一到一周周事时事间半故段数发功比生对倍事故的数据效比对果。
中国人口是美国的4.56倍,互联网用户是美国的2倍,手机用户是美国
3
的3倍,但新增数据量却只是美国的7%、欧洲的12%、日本的62%。
当今世界的大数据浪潮
与互联网的发明一样,大数据浪潮绝不仅是信息技术领域的革命,更是 在全球范围启动透明政府、加速企业创新、引领社会变革的利器。
数据
30是个数据
赋予背景
8
8
让数据说话--数据可视化
基础信息资源库
数据可视化
对海量的数据进行分 析和建模,发现数据 之间隐藏的关系、模 式和趋势,为决策者 提供依据。
以电子地图为基础,直 观展示人口、法人、房 屋(城市部件)等公共 基础信息及事件情况, 为各级各部门科学决策 提供数据支撑和依据。
查询 服务
统计 服务
专题 应用
➢ 城市人群的即时定位窗口
我们通过网络搜索分析人们在公众媒体上传的信息,根据信息分类直
观展示不同人群的地理分布位置。
Live Streams
让数据说话--数据可视化案例
➢ 关系可视化
将人与人、人与房、人与法人之间的关系进行可视化呈现。
数据开放是世界的潮流和趋势
2004
民间首个公共数据开放网 站,主要是国会立法法案 数据库
分析 服务
9
让数据说话--数据可视化案例
一份图表催生了一座医院,改变了一个制度
1850年代的克里米亚战争期间,现代护 理业之母--南丁格尔根据战场死亡情况的统 计进行数据可视化的探索,自行设计了历史 上第一份“极区图”,清晰地反映了“战斗 死亡”和“非战斗死亡”两种原因死亡人数 的悬殊对比,强烈的视觉效果引起了英国社 会的极大反响,直接促成了英国政府出台建 立野战医院的决定。
数据仓库
将各个不同系统的数 据,按统一定义的格 式提取出来,通过清 洗、转换、集成,最 后百流归海。
数据挖掘
对海量的数据进行分 析和建模,发现数据 之间隐藏的关系、模 式和趋势,为决策者 提供依据。有了数据 仓库的依托,数据挖 掘犹如“巧妇”走进 了“米仓”。
数据可视化
把复杂的数据之间的关 系和发展趋势,用更为 直观的图形、地图、动 画等方式,呈现给最普 通的用户,让数据成为 贴近大众生活、浅显易 懂、人皆可用的工具和 手段