大数据相关知识及政策PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
谷歌搜索和Google Maps背后的Google Cloud平台正和遗传 数据机构合作推广成立Google Genomics项目,打造遗传分 析云服务。
云服务的分析工具可以在基因组数据中预测疾病风险的 DNA变异。未来,医生可以定期进入云服务,了解病人基
因信息引起各类疾病的风险,或者选择适合病人的治疗方
2020/3/12
10
何谓大数据
2020/3/12
11
何谓大数据
2020/3/12
12
大数据的4V特征
2020/3/12
13
大数据的4V特征
大量化(Volume):企业面临着数据量的大规模增长。例如,IDC最近的报告预 测称,到2020年,全球数据量将扩大50倍。目前,大数据的规模尚是一个不 断变化的指标,单一数据集的规模范围从几十TB到数PB不等。简而言之,存 储1PB数据将需要两万台配备50GB硬盘的个人电脑。此外,各种意想不到的 来源都能产生数据。
乔布斯在与癌症斗争的过程中采用了不同的方式,成为世 界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔 布斯为此支付了几十万美元的费用。医生们可以根据乔布 斯特定的DNA为他设计药物,并观察药效,如果由于癌症 的病变导致药物失效,医生可以及时的更换药物,以免延 误最佳治疗期。
实际上大数据在DNA领域的应用早已展开.
2020/3/12
5
引例4---Target怀孕预测指数
美国一名男子闯入他家附近的一家美国零售连锁超市 Target店铺(美国第三大零售商塔吉特)进行抗议: “你们竟然给我17岁的女儿发婴儿尿片和童车的优惠 券。”店铺经理立刻向来者承认错误,但是其实该经 理并不知道这一行为是总公司运行数据挖掘的结果。
15
大数据的4V特征
快速化(Velocity):高速描述的是数据被创建和移动的速度。在高速网络时代, 通过基于实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成 为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、 分析并返回给用户,以满足他们的实时需求。根据IMS Research关于数据创建 速度的调查,据预测,到2020年全球将拥有220亿部互联网连接设备。
维基百科:Big data is a broad term for data sets so large or complex that traditional data processing applications are inadequate. Challenges include analysis, capture, data curation, search, sharing, storage, transfer, visualization, querying and information privacy.
如果不是在拥有海量的用户交易数据基础上实施数据 挖掘,Target不可能做到如此精准的营销。
20ቤተ መጻሕፍቲ ባይዱ0/3/12
6
何谓大数据
2020/3/12
7
何谓大数据
2020/3/12
8
何谓大数据
2020/3/12
9
何谓大数据
大数据(big data)是指无法在可承受的时间范围内用 常规软件工具进行捕捉、管理和处理的数据集合。 从某种程度上说,大数据是数据分析的前沿技术。
案。
2020/3/12
4
引例3—谷歌预测流感
2009年,Google通过分析 5000万条美国人最频繁检索 的词汇,将之和美国疾病中 心在2003年到2008年间季节 性流感传播时期的数据进行 比较,并建立一个特定的数 学模型。最终google成功预 测了2009冬季流感的传播甚 至可以具体到特定的地区和 州。
第一章 走进大数据时代
2
1
主要内容
引例 何谓大数据 大数据的4V特征 大数据带来的思维变革 相关案例
2020/3/12
2
引例1---电影《点球成金》
布拉德.皮特主演的《点球成金》是一部 美国奥斯卡获奖影片,所讲述的是棒球队 总经理利用计算机数据分析,对球队进行 了翻天覆地的改造,让一家不起眼的小球 队能够取得巨大的成功。
一个月后,这位父亲来道歉,因为这时他才知道他的 女儿的确怀孕了。Target比这位父亲知道他女儿怀孕 的时间足足早了一个月。
Target能够通过分析女性客户购买记录,“猜出”哪 些是孕妇。他们从Target的数据仓库中挖掘出25项与 怀孕高度相关的商品,制作“怀孕预测”指数。比如 他们发现女性会在怀孕四个月左右,大量购买无香味 乳液。以此为依据推算出预产期后,就抢先一步将孕 妇装、婴儿床等折扣券寄给客户来吸引客户购买。
基于历史数据,利用数据建模定量分析不同 球员的特点,合理搭配,重新组队。
打破传统思维,通过分析比赛数据,寻找 “性价比”最高球员,运用数据取得成功。
2020/3/12
3
引例2—乔布斯抗癌
乔布斯早在20多岁时就已患癌症并开始扩散,其元凶很可 能是电子行业的有毒化学物质。而在他生命的末期,就曾 经利用大数据尝试为自己延长寿命。
2020/3/12
14
大数据的4V特征
价值密度低(Value) 价值 密度的高低与数据总量的 大小成反比。以视频为例, 一部1小时的视频,在连 续不间断的监控中,有用 数据可能仅有一二秒。如 何通过强大的机器算法更 迅速地完成数据的价值 “提纯”成为目前大数据 背景下亟待解决的难题。
2020/3/12
17
大数据带来的思维变革
2020/3/12
18
大数据带来的思维变革
大数据时代,我们需要什么样的“新理 念”?
在思考问题和解决问题的方法上有什么新 的特点?
2020/3/12
19
大数据带来的思维变革---数据思维
量化 决策 整合
2020/3/12
16
大数据的4V特征
数据类型繁多(Variety) 这种类型的多样性也让数据被分为结构化数据和非结构化数据。 相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络 日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提 出了更高要求。
2020/3/12
云服务的分析工具可以在基因组数据中预测疾病风险的 DNA变异。未来,医生可以定期进入云服务,了解病人基
因信息引起各类疾病的风险,或者选择适合病人的治疗方
2020/3/12
10
何谓大数据
2020/3/12
11
何谓大数据
2020/3/12
12
大数据的4V特征
2020/3/12
13
大数据的4V特征
大量化(Volume):企业面临着数据量的大规模增长。例如,IDC最近的报告预 测称,到2020年,全球数据量将扩大50倍。目前,大数据的规模尚是一个不 断变化的指标,单一数据集的规模范围从几十TB到数PB不等。简而言之,存 储1PB数据将需要两万台配备50GB硬盘的个人电脑。此外,各种意想不到的 来源都能产生数据。
乔布斯在与癌症斗争的过程中采用了不同的方式,成为世 界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔 布斯为此支付了几十万美元的费用。医生们可以根据乔布 斯特定的DNA为他设计药物,并观察药效,如果由于癌症 的病变导致药物失效,医生可以及时的更换药物,以免延 误最佳治疗期。
实际上大数据在DNA领域的应用早已展开.
2020/3/12
5
引例4---Target怀孕预测指数
美国一名男子闯入他家附近的一家美国零售连锁超市 Target店铺(美国第三大零售商塔吉特)进行抗议: “你们竟然给我17岁的女儿发婴儿尿片和童车的优惠 券。”店铺经理立刻向来者承认错误,但是其实该经 理并不知道这一行为是总公司运行数据挖掘的结果。
15
大数据的4V特征
快速化(Velocity):高速描述的是数据被创建和移动的速度。在高速网络时代, 通过基于实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成 为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、 分析并返回给用户,以满足他们的实时需求。根据IMS Research关于数据创建 速度的调查,据预测,到2020年全球将拥有220亿部互联网连接设备。
维基百科:Big data is a broad term for data sets so large or complex that traditional data processing applications are inadequate. Challenges include analysis, capture, data curation, search, sharing, storage, transfer, visualization, querying and information privacy.
如果不是在拥有海量的用户交易数据基础上实施数据 挖掘,Target不可能做到如此精准的营销。
20ቤተ መጻሕፍቲ ባይዱ0/3/12
6
何谓大数据
2020/3/12
7
何谓大数据
2020/3/12
8
何谓大数据
2020/3/12
9
何谓大数据
大数据(big data)是指无法在可承受的时间范围内用 常规软件工具进行捕捉、管理和处理的数据集合。 从某种程度上说,大数据是数据分析的前沿技术。
案。
2020/3/12
4
引例3—谷歌预测流感
2009年,Google通过分析 5000万条美国人最频繁检索 的词汇,将之和美国疾病中 心在2003年到2008年间季节 性流感传播时期的数据进行 比较,并建立一个特定的数 学模型。最终google成功预 测了2009冬季流感的传播甚 至可以具体到特定的地区和 州。
第一章 走进大数据时代
2
1
主要内容
引例 何谓大数据 大数据的4V特征 大数据带来的思维变革 相关案例
2020/3/12
2
引例1---电影《点球成金》
布拉德.皮特主演的《点球成金》是一部 美国奥斯卡获奖影片,所讲述的是棒球队 总经理利用计算机数据分析,对球队进行 了翻天覆地的改造,让一家不起眼的小球 队能够取得巨大的成功。
一个月后,这位父亲来道歉,因为这时他才知道他的 女儿的确怀孕了。Target比这位父亲知道他女儿怀孕 的时间足足早了一个月。
Target能够通过分析女性客户购买记录,“猜出”哪 些是孕妇。他们从Target的数据仓库中挖掘出25项与 怀孕高度相关的商品,制作“怀孕预测”指数。比如 他们发现女性会在怀孕四个月左右,大量购买无香味 乳液。以此为依据推算出预产期后,就抢先一步将孕 妇装、婴儿床等折扣券寄给客户来吸引客户购买。
基于历史数据,利用数据建模定量分析不同 球员的特点,合理搭配,重新组队。
打破传统思维,通过分析比赛数据,寻找 “性价比”最高球员,运用数据取得成功。
2020/3/12
3
引例2—乔布斯抗癌
乔布斯早在20多岁时就已患癌症并开始扩散,其元凶很可 能是电子行业的有毒化学物质。而在他生命的末期,就曾 经利用大数据尝试为自己延长寿命。
2020/3/12
14
大数据的4V特征
价值密度低(Value) 价值 密度的高低与数据总量的 大小成反比。以视频为例, 一部1小时的视频,在连 续不间断的监控中,有用 数据可能仅有一二秒。如 何通过强大的机器算法更 迅速地完成数据的价值 “提纯”成为目前大数据 背景下亟待解决的难题。
2020/3/12
17
大数据带来的思维变革
2020/3/12
18
大数据带来的思维变革
大数据时代,我们需要什么样的“新理 念”?
在思考问题和解决问题的方法上有什么新 的特点?
2020/3/12
19
大数据带来的思维变革---数据思维
量化 决策 整合
2020/3/12
16
大数据的4V特征
数据类型繁多(Variety) 这种类型的多样性也让数据被分为结构化数据和非结构化数据。 相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络 日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提 出了更高要求。
2020/3/12