数据分析与机器学习

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

IoT是一个新的转折点

硬件成本降低连接遍布四周开发更加容易

递增需求带来

的巨大收益创新的场景

物联网数据走向智能

机器学习与离

线分析

Churn

analysis

Social network

analysis

Recommenda-

tion engines

Location-

based

tracking and

services

Weather

forecasting

business

planning

Fraud

detection

Equipment

monitoring

Personalized

Insurance

云计算提供

实时分析能力

数据在增长

Cortana Intelligence Suite 大数据存储Azure SQL Data Warehouse

Azure Data Lake 信息管理机器学习Azure Data Factory

Azure Data Catalog Azure Event Hub Azure Machine Learning 人工智能

Cortana Bot Framework Cognitive Services 可视化Power BI 智能

高级分析Azure HDInsight (Hadoop)

Data Lake Analytics Azure Stream Analytics 智能数据展示

典型IoT流模式

索引数据库Cortana

认知服务

Stream Analytics

▪定义

高效实时的复杂事件处理引擎

▪输入输出

输入:Storage Blob / Event Hub / IoT Hub

输出:SQL DB / Blob / T able / Document DB

Event Hub / Queue / T opic

Power BI

▪数据实时分析手段

类SQL的查询:在线编写脚本

直连机器学习Web服务

▪处理能力

事件吞吐量1GB/s

输入输出

复杂时间处理器

Stream

Analytics

Data

Stores

Event

Hub

Data Stores

仪表板

传感器和设备

Event

Hub

Machine

Learning

SQL查询

SELECT time, temp, dspl INTO output

FROM input where dspl=“sensorA”

管道

过滤网流流

自主发现隐藏规律无需干预的行为预测

针对海量数据应用更智能•定义

使用计算机运行算法模型

从海量数据中发掘隐藏规律

预测未来行为和趋势•优势

针对海量数据

很多问题无法通过显性指令集解决,机器学习可以

效率几何倍数提高

自我学习,不断提高

名字

账单欺诈Smith

$2,600.45否Potter $2,294.58是

Peters

$1,003.30是Adams

$8,488.32否名字

账单颁发地消费地年龄欺诈Smith $2,600.45

美国美国22否Potter $2,294.58

美国俄罗斯29是Peters $1,003.30

美国俄罗斯25是Adams $8,488.32

法国美国64否Pali $200.12

澳大利亚日本58否Jones $3,250.11

美国俄罗斯43否Hanfor d $8156.20

美国俄罗斯27是Marx

$540.00

英国德国32否Norse

$7,475.11美国俄罗斯27否信用卡欺诈行为检测:

这是个椅子吗?

原始数据库

全托管整合最优算法分钟级部署

无软件安装,硬件管理,只需网站简单的拖拉拽,连接数据

接口,无需为通用任务编

程。.

基于最优实现的各类算

法. 支持R和Python扩展。

点击即可操作模型,在

Machine Learning

Marketplace内收费。

Azure Machine Learning Service 数据-> 预测模型-> 分钟级可操作Web API

Blobs and Tables

Hadoop (HDInsight)

关系型DB (Azure SQL DB)数据客户端

可调用的

Web

服务

通过marketplace 消费API

API

机器学习开发环境

ML STUDIO

异常检测回归聚类

多类分类

两类分类设备有

无故障

信用卡

欺诈

用电量估算顾客行为分类

糖尿病

分类

其他功能模块

机器学习评估

交叉验证/参数扫描/模型评估

数据处理

滤波/采样/归一化

特征选择

主成分分析/Fisher线性判别/相关性/排序其他模块

OpenCV/统计/文本分析

相关文档
最新文档