计算机工程应用实践(实习)实施计划表--文思海辉

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

河北工业大学

计算机科学与软件学院计算机工程应用实践(实习)实施计划表

实习单位:文思海辉技术有限公司

2014年10月21日

周次工

实习岗位及内容安排备注

第五周第一阶段:数据库基础

关系理论

SQL程序设计

数据库日常管理

数据库事务机制

数据库备份和恢复

MPP体系架构

掌握数据库基本理论,掌

握常用SQL语句,对MPP

海量并行处理的体系架构

有基本了解

第六周--第八周第二阶段:Teradata数据仓库引擎

Teradata基本框架、组件介绍

Teradata SQL

Teradata索引机制

Teradata文件系统介绍

Teradata数据加载工具

Teradata空间管理

Teradata用户管理

Teradata系统安全与审计

Teradata性能监控

Teradata系统优化

上机实验

通过理论学习和上机掌握

Teradata数据仓库引擎的

语法、日常管理和优化

第九周--第十周第三阶段:数据仓库理论

企业级信息架构

数据仓库和ODS

数据仓库与数据集市

数据仓库实施方法论

元数据管理

数据质量管理

数据标准管理

ETL

通过学习了解数据仓库的

基本理论和实施方法论,

建立起关于对于数据仓库

和联机分析系统相关知识

的系统框架。

第十一周--第十五周第四阶段:数据模型、ETL和报表设计

ERWin工具的使用

金融行业逻辑数据模型介绍

协议主题

当事人主题

产品主题

事件主题

资产主题

内部机构主题

地址主题

营销主题

渠道

财务主题

建模工作模板介绍及使用

代码整合原则

实体及信息项整合原则

逻辑模型和物理模型差异

逻辑数据模型的物理化

ETL基本理论

常用ETL工具介绍

ETL标准算法

ETL调度

Cognos工具体系架构

Cognos Reportstudio介绍

Cognos Querystudio介绍

掌握数据仓库建模工具的

使用,了解数据仓库十大

主题模型的特性及准入原

则,能够进行简单的模型

设计。

掌握ETL的设计理解,掌

握常用ETL加工算法,完

成简单的ETL脚本开发。

掌握cognos报表开发工

具,能够完成简单的报表

开发。

第十六周--第十九周第五阶段:数据仓库项目开发

承建XX银行的数据仓库系统,满足上级监管单位的要求,并且为

下一年度的经营分析提供决策支持。

XXX银行数据仓库系统的核心功能是提供业务用户对各类数据分

析报表的支持。项目建设至少包括如下部分:

1. 数据模型建设

通过本项目的实施,完成数据仓库的基础层模型建设。本期项目要

求至少完成当事人、协议、内部机构三个主题。每个主题中具体的

实体数目不限。

数据模型要求包括逻辑模型和物理模型。逻辑模型要求使用

ERWIN工具,物理模型的工具不作限制,可以使用ERWIN或者

excel。

2. 物理数据库设计

根据数据仓库的数据架构中不同的区域,设计不同的模式对数据进

行存放,要求对模式进行相应的说明。

3. ETL脚本开发

1)针对仓库临时层的样本数据,开发加载脚本将样本数据加载到

PG数据库中。

要求使用PG的加载工具进行加载。

2)针对仓库的基础层数据模型,开发转换脚本将数据转换到基础

层模型中。要求针对不同的模型表,选择相应的ETL算法。要求

至少实现三种ETL算法。

脚本具体的技术形式不限,可以使用存储过程,也可以Perl嵌套

SQL或者其他手段。

3)针对报表展现部分,要求根据报表的加工逻辑开发ETL脚本对

数据进行加工,供报表展现使用。

4. ETL调度设计(可选)

本项目中没有采用现成的ETL调度工具,因此需要对本项目中ETL

提交物要求:

《XXX银行数据仓库项

目计划》。要求使用project

或excel,对项目进行子任

务划分,针对每一项子任

务给出任务的开始和结束

时间,投入的人员情况等。

《XXX银行数据仓库项

目需求规格说明书》。内容

包括:样本数据取值分析

报告;入仓字段选取说明;

基于样本数据对报表指标

需求满足度进行分析,包

含加工口径的确认。

《XXX银行数据仓库项

目概要设计》。内容包括:

逻辑模型设计、物理模型

设计、物理数据库设计、

ETL调度设计(可选)、

报表样式的设计等。

《各模块程序包》。内容包

括:逻辑/物理模型,DDL

建表语句、ETL脚本和报

表相关发布包等。

《XXX银行数据仓库项

目汇报材料》。内容包括整

个项目过程中的分析及设

计思路、人员分工情况、

相关文档
最新文档