大数据云平台地理信息系统平台与人工智能终版
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
易智瑞地理信息系统平台 与人工智能
易智瑞中国信息技术有限公司 刘升容
目录
1. GIS与人工智能概述(5mins)
人工智能发展概述 人工智能在GIS中的应用
2. 易智瑞地理信息系统和机器学习(20mins)
机器学习算法及应用
3. 易智瑞地理信息系统与深度学习(20mins)
易智瑞地理信息系统对深度学习的产品支持及应用
– 基于视角的领域情感分析
– 监控场景下的行人精细化识别
– 用户评分预测
– 微额借款用户人品预测
图 片
– 汽车4S店邮件营销方案
来 源
– ……
于 网
络
易智瑞地理信息平台提供的分类算法
•最大似然分类 •随机森林 •支持向量机 •图像分割
最大似然法分类的工作原理
• 原理:概率大的事件在一次观测中更容易发生;在 一次观察中发生的事件其概率应该大
已分割的彩色红外 WorldView-2 (DigitalGlobe)
基于 WorldView-2 的分割影像。它对区域Fra Baidu bibliotek 行了概化以使所有要素可作为较大的连续区域。
回归
• 回归技术预测的数据对象是连续值。
• 回归模型包括一元回归和多元回归,线性回归和非线性回归
• 典型应用场景:
– 机场客流量分布预测
– 基于用户位置信息的商业选址 – 中文地址标准化处理 – 国家电网用户画像 – 非人恶意流量识别 – 求职信息完善 – 搜索引擎查询聚类以进行流量推荐 – 生物种群固有结构认知 – 保险投保者分组 – 网站关键词来源聚类 – 图像分割 – ……
A:某图片分享类媒体 整体用户画像
B:某图片分享类媒体 细分用户特征
典型应用包括垃圾邮件识别、医学成像,信用评分等:
– O2O优惠券使用预测
– 市民出行选乘公交预测
– 待测微生物种类判别
– 广告点击行为预测
– 基于文本内容的垃圾短信识别
– P2P网络借贷平台的经营风险量化分析
– 国家电网客户用电异常行为分析
– 自动驾驶场景中的交通标志检测
– 大数据精准营销中用户画像挖掘
图片来源于网络
易智瑞地理信息平台提供的聚类算法
•多元聚类 •空间约束多元聚类 •基于密度的聚类 •热点分析 •聚类和异常值分析 •时空挖掘分析
基于密度的聚类
• 最常用 • 优势:可以在有噪音的数据中发现各种形状和各种大小的簇。 • DBSCAN(Ester, 1996)是该类方法中最典型的代表算法之一
口统计特征并且在空间上相邻的城市区域。 – ……
时空挖掘分析,即空间-时间的聚类
• 数据具有空间和时态背景:所有事件均具有一个发生地点和发生时间。
通过时空立方体热点分析发现交通事故的聚集区
演示:基于机器学习进行聚类与预测
易智瑞地理信息系统平台与机器学习
分类
•最大似然分类 •随机森林 •支持向量机 •图像分割
4. 总结
一、GIS与人工智能概述
探索:我们生活和工作中有哪些人工智能的应用?
人工智能,跌宕起伏的发展历程
探索:人工智能在GIS中的应用方向
① 影像分类
② 自动化目标检测
③ 无人车驾驶
④ 社交数据预测分析 ⑤ 地名地址信息识别
北京
南京
⑥更多……
二、易智瑞地理信息平台 和机器学习
易智瑞地理信息平台与人工智能的关系
– 货币基金资金流入流出预测
– 电影票房预测
– 农产品价格预测分析
– 基于多源数据的青藏高原湖泊面积预测
– 微博传播规模和传播深度预测
– 网约车出行流量预测
– 搜索引擎的搜索量和股价波动
– 中国人口增长分析
– 农村居民收入增长预测
– 房地产销售影响因素分析
– 股价走势预测
– 全国综合运输总量预测
图
– 地震预报
人工智能
视频游戏行为 人工智能
自然语言处理
易智瑞地理信息系统
计算机视 觉
机器
机器人
学习
Theano
Keras
CNTK TensorFlow
IBM Watson
深度
scikit-learn
学习
易智瑞地理 信息系统
集成
机器学习方法
机器学习
有监督学习 无监督学习
分类 回归 聚类
分类
分类技术预测的数据对象是离散值。分类模型将输入数据分类。
片
– ……
来 源
于
网
络
易智瑞地理信息平台提供的回归算法
•经验贝叶斯克立金 •面插值(2D和3D) •EBK 回归预测 •普通最小二乘回归 •广义线性回归 •地理加权回归 •基于随机森林的分类与回归
基于森林的分类与回归
• 一种新兴、高度灵活的机器学习方法,基于决策树的集成算法(Bagging类型) • 使用率高、使用面广 • 训练集大小为N,随机且有放回的从训练集中抽取n个训练样本,样本维度M,随机取m
通过聚类查找易发生交通事故的十字路口
空间约束多源聚类
• 空间约束参数可以确保生成的聚类在空间上相邻。 • 应用此工具的一些方法如下:
– 生物学家:了解鲑鱼在不同生命阶段的聚集地点和时间,可以帮助您规划保护区,以帮助确保 成功繁育。
– 农学家:使用空间约束多元聚类可以帮助识别出明显的、空间上相邻的土壤类型的聚类。 – 城市规则师:对城市街区和人口统计特征使用空间约束多元聚类,可以确定具有相似物理和人
个子集,每次树进行分裂时,从这m个特征中选择最优的。
图 片 来 源 于 网 络
演示:海草适宜性生长预测
聚类
• 聚类算法用于在数据中寻找隐藏的模式或分组。 • 聚类算法构成分组或类,类中的数据具有更高的相似度。 • 聚类建模的相似度衡量可以通过欧几里得距离、概率距离或
其他指标进行定义。
• 典型应用场景:
• 利用已知的样本结果,反推最有可能(最大概率) 导致这样结果的参数值。
• 示例:使用最大似然法分类工具将多波段栅格监督 分类为5个土地利用类型。
显示为假彩色影像的 4、3 和 2 波段 Landsat TM
影像示例
定义了五个土地利用类以生成训练样本,完成分类
支持向量机
• 是深度学习出现之前,机器学习中表现最好的算法 • SVM 分类器是一种功能强大的监督分类方法 • 本质是二分类算法,寻找一个超平面,将训练数据分为2
类。
图像分割
• 将图像分块(分割),且将紧密邻近且具有相似光谱特性的像素分组到同一分割中 • 图像分割基于Mean Shift算法:聚类、分割、影像平滑、追踪…… • 该技术使用移动窗口来计算平均像素值以确定每个分割中应该包括的像素。 • 影像分割的特征取决于三个参数:光谱详细级别、空间详细级别和最小分割大小。
易智瑞中国信息技术有限公司 刘升容
目录
1. GIS与人工智能概述(5mins)
人工智能发展概述 人工智能在GIS中的应用
2. 易智瑞地理信息系统和机器学习(20mins)
机器学习算法及应用
3. 易智瑞地理信息系统与深度学习(20mins)
易智瑞地理信息系统对深度学习的产品支持及应用
– 基于视角的领域情感分析
– 监控场景下的行人精细化识别
– 用户评分预测
– 微额借款用户人品预测
图 片
– 汽车4S店邮件营销方案
来 源
– ……
于 网
络
易智瑞地理信息平台提供的分类算法
•最大似然分类 •随机森林 •支持向量机 •图像分割
最大似然法分类的工作原理
• 原理:概率大的事件在一次观测中更容易发生;在 一次观察中发生的事件其概率应该大
已分割的彩色红外 WorldView-2 (DigitalGlobe)
基于 WorldView-2 的分割影像。它对区域Fra Baidu bibliotek 行了概化以使所有要素可作为较大的连续区域。
回归
• 回归技术预测的数据对象是连续值。
• 回归模型包括一元回归和多元回归,线性回归和非线性回归
• 典型应用场景:
– 机场客流量分布预测
– 基于用户位置信息的商业选址 – 中文地址标准化处理 – 国家电网用户画像 – 非人恶意流量识别 – 求职信息完善 – 搜索引擎查询聚类以进行流量推荐 – 生物种群固有结构认知 – 保险投保者分组 – 网站关键词来源聚类 – 图像分割 – ……
A:某图片分享类媒体 整体用户画像
B:某图片分享类媒体 细分用户特征
典型应用包括垃圾邮件识别、医学成像,信用评分等:
– O2O优惠券使用预测
– 市民出行选乘公交预测
– 待测微生物种类判别
– 广告点击行为预测
– 基于文本内容的垃圾短信识别
– P2P网络借贷平台的经营风险量化分析
– 国家电网客户用电异常行为分析
– 自动驾驶场景中的交通标志检测
– 大数据精准营销中用户画像挖掘
图片来源于网络
易智瑞地理信息平台提供的聚类算法
•多元聚类 •空间约束多元聚类 •基于密度的聚类 •热点分析 •聚类和异常值分析 •时空挖掘分析
基于密度的聚类
• 最常用 • 优势:可以在有噪音的数据中发现各种形状和各种大小的簇。 • DBSCAN(Ester, 1996)是该类方法中最典型的代表算法之一
口统计特征并且在空间上相邻的城市区域。 – ……
时空挖掘分析,即空间-时间的聚类
• 数据具有空间和时态背景:所有事件均具有一个发生地点和发生时间。
通过时空立方体热点分析发现交通事故的聚集区
演示:基于机器学习进行聚类与预测
易智瑞地理信息系统平台与机器学习
分类
•最大似然分类 •随机森林 •支持向量机 •图像分割
4. 总结
一、GIS与人工智能概述
探索:我们生活和工作中有哪些人工智能的应用?
人工智能,跌宕起伏的发展历程
探索:人工智能在GIS中的应用方向
① 影像分类
② 自动化目标检测
③ 无人车驾驶
④ 社交数据预测分析 ⑤ 地名地址信息识别
北京
南京
⑥更多……
二、易智瑞地理信息平台 和机器学习
易智瑞地理信息平台与人工智能的关系
– 货币基金资金流入流出预测
– 电影票房预测
– 农产品价格预测分析
– 基于多源数据的青藏高原湖泊面积预测
– 微博传播规模和传播深度预测
– 网约车出行流量预测
– 搜索引擎的搜索量和股价波动
– 中国人口增长分析
– 农村居民收入增长预测
– 房地产销售影响因素分析
– 股价走势预测
– 全国综合运输总量预测
图
– 地震预报
人工智能
视频游戏行为 人工智能
自然语言处理
易智瑞地理信息系统
计算机视 觉
机器
机器人
学习
Theano
Keras
CNTK TensorFlow
IBM Watson
深度
scikit-learn
学习
易智瑞地理 信息系统
集成
机器学习方法
机器学习
有监督学习 无监督学习
分类 回归 聚类
分类
分类技术预测的数据对象是离散值。分类模型将输入数据分类。
片
– ……
来 源
于
网
络
易智瑞地理信息平台提供的回归算法
•经验贝叶斯克立金 •面插值(2D和3D) •EBK 回归预测 •普通最小二乘回归 •广义线性回归 •地理加权回归 •基于随机森林的分类与回归
基于森林的分类与回归
• 一种新兴、高度灵活的机器学习方法,基于决策树的集成算法(Bagging类型) • 使用率高、使用面广 • 训练集大小为N,随机且有放回的从训练集中抽取n个训练样本,样本维度M,随机取m
通过聚类查找易发生交通事故的十字路口
空间约束多源聚类
• 空间约束参数可以确保生成的聚类在空间上相邻。 • 应用此工具的一些方法如下:
– 生物学家:了解鲑鱼在不同生命阶段的聚集地点和时间,可以帮助您规划保护区,以帮助确保 成功繁育。
– 农学家:使用空间约束多元聚类可以帮助识别出明显的、空间上相邻的土壤类型的聚类。 – 城市规则师:对城市街区和人口统计特征使用空间约束多元聚类,可以确定具有相似物理和人
个子集,每次树进行分裂时,从这m个特征中选择最优的。
图 片 来 源 于 网 络
演示:海草适宜性生长预测
聚类
• 聚类算法用于在数据中寻找隐藏的模式或分组。 • 聚类算法构成分组或类,类中的数据具有更高的相似度。 • 聚类建模的相似度衡量可以通过欧几里得距离、概率距离或
其他指标进行定义。
• 典型应用场景:
• 利用已知的样本结果,反推最有可能(最大概率) 导致这样结果的参数值。
• 示例:使用最大似然法分类工具将多波段栅格监督 分类为5个土地利用类型。
显示为假彩色影像的 4、3 和 2 波段 Landsat TM
影像示例
定义了五个土地利用类以生成训练样本,完成分类
支持向量机
• 是深度学习出现之前,机器学习中表现最好的算法 • SVM 分类器是一种功能强大的监督分类方法 • 本质是二分类算法,寻找一个超平面,将训练数据分为2
类。
图像分割
• 将图像分块(分割),且将紧密邻近且具有相似光谱特性的像素分组到同一分割中 • 图像分割基于Mean Shift算法:聚类、分割、影像平滑、追踪…… • 该技术使用移动窗口来计算平均像素值以确定每个分割中应该包括的像素。 • 影像分割的特征取决于三个参数:光谱详细级别、空间详细级别和最小分割大小。