Pentaho培训(概要)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Pentaho是一个基于java平台的商业智能(Business Intelligence)套件。它的出现,使得 一系列面向商业智能的独立产品如Kettle、Report ,Mondrian,Dashboard等,能够 集成在一起,构成了一个由web server平台和多个工具软件:报表,分析,图表,数 据集成,数据挖掘等的完整商业智能解决方案。
pentaho框架图
Pentaho的业务流程
数据源
ETL工具
数据仓库
报表
仪表盘 多维分析
业务流程
数据源 ETL工具 数据仓库 报表 仪表盘
数据挖掘
Pentaho业务流程
Pentaho用户控制台
启动BI-SERVER,在网址中输http://localhost:8080/pentaho
选择Joe管理员登录
Pentaho Report:报表设计工具,支持各种类型的报表设计开发工作,并能输出各 种格式的文件。
Pentaho Dashboard:仪表盘报表开发工具。
pentaho框架图
其他组件:
工作流引擎:JaWE (基于Java的图形化工作流编辑器) 数据库:MySQL/Oracle…… 集成管理和开发环境:Eclipse OLAP展示:Jpivot (JSP 自定制的标签库,可以绘制一个OLAP表格和图表) 数据挖掘组件:Weka 应用服务器:Tomcat , Jboss 单点登陆服务:CAS 自定义脚本支持:Javascript脚本处理器
Pentaho的优点
流程即Action序列,是Solution的基本组成单位,它由多个以某种顺序执行的Action 组成。Action是Pentaho平台所提供的最基本的BI操作,大到生成一个报表,小到打
印一行字,都可以是一个Action。Action之间可以顺序执行,也可以有分支戒循环。
Pentaho平台的“以流程为中心”是指整个平台的工作核心就是如何解释执行一个个 Action序列的描述文件。用户在做具体的BI应用开发时,也应当把精力集中在描述 Action序列上。
Pentaho平台提供一种戒几种“Action”,每个Action有自己的输入和输出,多个
Action连接起来就构成了Action序列,完成一个较复杂的功能。Pentaho平台负责在 各个Action之间传递参数,这样多种不同的BI产品便能够协同工作了。
Pentaho的优点
所谓解决方案(Solution),是基于Pentaho平台的一个具体的BI应用。Solution与 Pentaho平台的关系和Web应用与应用服务器之间的关系十分类似。如图 1所示,
苏州百咨信息技术有限公司
http://www.bisolutions.cn
什么是pentaho?
Pentaho是一个以流程为中心,面向解决方案(Solution),可扩展的商业智能平台 (BI套件)。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,
方便商业智能应用的开发。
Pentaho用户控制台
展示区
方案
序列,报表戒 仪表盘文件
Pentaho平台展示
OLAP案例
Fra Baidu bibliotek
Report案例
Pentaho DashBoard工具
DashBoard执行效果
DashBoard案例
DashBoard案例
DashBoard案例
DashBoard案例
管理员用户控制台
启动administration-console,在网址中输 http://localhost:8099
所谓集成化,是指将众多不同的BI产品集成到一个统一的框架中来,使之可以相互协 作。以往的BI产品,往往只丏注于BI的某一特定领域,如Report主要关注报表的生成, Weka主要进行数据的挖掘等等。然而一个完整的BI应用往往需要这些BI产品能够相互 协作。Pentaho通过引入“Action”的概念,提供了一个让多种BI产品协作的机制。 “Action”是Pentaho平台提供的最基本的操作单元,它类似于一种编程语言的基本 语句。所有完成具体功能的BI产品作为“揑件”集成到Pentaho平台中,每种揑件为
础件,借助他可以集成其他BI产品,如Dashboard.他包括用户控制台( Pentaho BIServer)和管理员控制台(Pentaho Admin Console)
Design Studio :开发工具,它能以一定的顺序执行一系列的动作,从而能完成各种 复杂程度的BI工作。
Kettle :可对复杂数据进行清洗,处理并得到我们有用的数据。 Mondrian:高性能的OLAP引擎,它用MDX语言实现查询,从关系数据库(RDBMS) 中读取数据。然后经过Java API用多维的方式对结果进行展示。
用户名:admin 密码:password
管理员控制台-设置权限
管理员控制台-设置用户
管理员控制台-数据库权限
管理员控制台-清理缓存
管理员控制台-定时器
苏州百咨信息技术有限公司 http://www.bisolutions.cn
Pentaho是一个偏向于与业务流程相结合的BI解决方案,侧重于大中型企业应用。它 允许商业分析人员戒开发人员创建报表,仪表盘,分析模型,商业规则和 BI 流程。
Pentaho的定义:
Pentaho的优点?
一:“集成化” 二:“面向解决方案” 三:“以流程为中心”
Pentaho的优点
Pentaho平台将BI业务逻辑的开发以Solution的形式与系统的其它部分独立开来,使 得用户可以随心所欲的综合运用各种不同的BI产品为自己服务。
Pentaho的优点
Pentaho框架图
pentaho框架图
BI平台:Businesss Intelligence Server,商业智能服务器。是整个Pentaho平台的基
Pentaho平台本身作为一个Web应用部署在应用服务器上,而Solution又作为一个
“Pentaho应用”,部属在Pentaho平台上。Solution本身实质上是一系列Action序 列的集合,这些序列在网页上如何显示,如何被调用,功能如何实现完全由Pentaho 平台来管理,这使得Solution的开发者,也就是Pentaho的使用者,可以将开发工作 集中于具体的BI业务逻辑的开发上,而不用去关心网页的设计、服务器的部署等等细 节。