审计数据预处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机辅助审计原理及应用(第二版)
5-12
@ 清华大学出版社
审计数据质量实例----不完整数据
计算机辅助审计原理及应用(第二版)
5-13
@ 清华大学出版社
审计数据质量实例----不完整数据
计算机辅助审计原理及应用(第二版)
5-14
@ 清华大学出版社
审计数据质量实例----不一致的数据
计算机辅助审计原理及应用(第二版)
5-15
@ 清华大学出版社
审计数据质量实例----不正确的数据
计算机辅助审计原理及应用(第二版)
5-16
@ 清华大学出版社
审计数据质量实例----重复的数据
计算机辅助审计原理及应用(第二版)
5-17
@ 清华大学出版社
审计数据预处理的意义

为下一步的审计数据分析提供准备 帮助发现隐含的审计线索 降低审计风险
唯一性(Uniqueness)
唯一性是指数据源中记录以及编码是否唯一;


适时性(Timeliness)
适时性是指在所要求的或指定的时间提供一个或多个数据项的程度;
有效性(Validity)
有效性是指维护的数据足够严格以满足分类准则的接受要求。
计算机辅助审计原理及应用(第二版)
5-6
@ 清华大学出版社
可能存在的数据质量问题

重复的数据 不完整的数据
不正确的数据
无法理解的数据值 不一致的数据
计算机辅助审计原理及应用(第二版)
5-7
@ 清华大学出版社
数据质量问题分类
模式级问题 缺乏完整性约 束、差的模式 设计 唯一值 参照完整性
. . .
单 数 据 源 问 题 数 据 质 量 问 题 多 数 据 源 问 题
(3)审计数据预处理工具使用不合适。
(4)审计数据预处理过程不规范,没有日志记录。 根据以上分析,每一步预处理工作都有可能影响到数据的完整性 和正确性,所以在这一阶段进行数据验证也是很必要的。
计算机辅助审计原理及应用(第二版)
5-25
@ 清华大学出版社
审计数据预处理阶段数据验证的内容和方法
审计数据验证的主要内容
了解其它一些数据预处理方法
计算机辅助审计原理及应用(第二版)
5-2
@ 清华大学出版社
本章主要内容

概述


审计数据预处理理论分析
审计数据预处理应用实例


审计数据预处理阶段的数据验证
其它数据预处理方法介绍
计算机辅助审计原理及应用(第二版)
5-3
@ 清华大学出版社
审计数据预处理理论分析

不完整数据的清理
相似重复记录的清理
计算机辅助审计原理及应用(第二版)
5-27
@ 清华大学出版社
思考题

为什么要对被审计数据进行审计数据预处理? 什么是数据质量? 常见审计数据质量问题有哪些?
计算机辅助审计原理及应用(第二版)
5-28
@ 清华大学出版社
相关参考书
计算机辅助审计原理及应用(第二版)
计算机辅助审计原理及应用(第二版)
5-23
@ 清华大学出版社
数据预处理应用实例----采用AO
采用AO中的常规数据整理功能
计算机辅助审计原理及应用(第二版)
5-24
@ 清华大学出版社
审计数据预处理阶段数据验证的重要性
在审计数据预处理过程中,审计人员会将原始电子数据中表名、 字段名、记录值代码以及表表关联的经济含义明确标识出来,这需要进 行大量的查询、替换修改、插入数据、删除数据等操作;另外,要对电 子数据进行修改错误值、替换空值、消除冗余数据、保证数据值落入定 义域等数据操作,以提高数据质量,为下一步的审计数据分析做好准备。 在审计数据预处理过程中可能存在以下问题: (1)目标数据模式设计不合理。 (2)审计数据预处理方法不当。
计算机辅助审计原理及应用(第二版)
5-5
@ 清华大学出版社
数据质量的评价指标

准确性(Accuracy)
准确性是指数据源中实际数据值与假定正确数据值的一致程度;


完整性(Completeness)
完整性是指数据源中需要数值的字段中无值缺失的程度;
一致性(Consistency)
一致性是指数据源中数据对一组约束的满足程度;
5-9
@ 清华大学出版社
单数据源数据质量问题
计算机辅助审计原理及应用(第二版)
5-10
@ 清华大学出版社
多数据源集成时数据质量问题
当多个数据源集成时,发生在单数据源中的这些问题会更 加严重。这是因为每个数据源都是为了特定应用,单独开发、 部署和维护的,这就很大程度上导致数据管理系统、数据模 型、模式设计和实际数据的不同。每个数据源都可能含有脏 数据,多数据源中的数据可能会出现不同表示、重复、冲突 等现象。 在模式级,模式设计的主要问题是命名冲突和结构冲突。 命名冲突主要表现为不同的对象可能使用同一个命名,而同 一对象可能使用不同的命名;结构冲突存在很多种不同的情 况,一般是指在不同数据源中同一对象有不同表示,如不同 的组成结构、不同的数据类型、不同的完整性约束等。
5-20
@ 清华大学出版社
数据预处理应用实例----采用Access
名称转换
计算机辅助审计原理及应用(第二版)
5-21
@ 清华大学出版社
数据预处理应用实例----采用Access
空值处理
计算机辅助审计原理及应用(第二版)
Fra Baidu bibliotek
5-22
@ 清华大学出版社
数据预处理应用实例----采用AO
借助生成数据中间表
确信数据预处理的目标实现 确认数据预处理工作没有损害数据的完整性、正确性
审计数据验证的方法
在审计数据预处理阶段,审计人员可以根据实际情况,采用核 对总金额、保持借贷平衡、勾稽关系、审计抽样等数据验证方法来 完成审计数据验证。
计算机辅助审计原理及应用(第二版)
5-26
@ 清华大学出版社
其它数据预处理方法介绍
计算机辅助审计原理及应用(第二版)
5-11
@ 清华大学出版社
多数据源集成时数据质量问题
除了模式级的冲突,很多冲突仅出现在实例级上,即数 据冲突。由于不同数据源中数据的表示可能会不同,单数据 源中的所有问题都可能会出现,比如重复的记录、冲突的记 录等。此外,在整个数据源中,尽管有时不同的数据源中有 相同的字段名和类型,仍可能存在不同的数值表示,如对性 别的描述,一个数据源中可能用“0/1”来描述,另一个数据 源中可能会用“F/M”来描述,或者对一些数值的不同表示, 如一个数据源中度量单位制可能用美元,另一个数据源中可 能会用欧元。此外,不同数据源中的信息可能表示在不同的 聚集级别上,如一个数据源中信息可能指的是每种产品的销 售量,而另一个数据源中信息可能指的是每组产品的销售量。
数据质量 单数据源数据质量问题 多数据源集成时数据质量问题 审计数据质量实例


审计数据预处理的意义
审计数据预处理的内容
计算机辅助审计原理及应用(第二版)
5-4
@ 清华大学出版社
数据质量
什么是数据质量呢?
数据质量问题并不仅仅是指数据错误。有的文献把 数据质量定义为数据的一致性(consistency)、正确 性(correctness)、完整性(completeness)和最小 性(minimality)这4个指标在信息系统中得到满足的 程度,有的文献则把“适合使用”作为衡量数据质量的 初步标准。
第5章 审计数据预处理
www.tup.tsinghua.edu.cn
5-1
本章学习目标

理解审计数据预处理的重要性

理解数据质量、审计数据质量问题;掌握审计数
据预处理的意义以及审计数据预处理的内容


结合应用实例熟悉审计数据预处理的基本方法
理解审计数据预处理阶段数据验证的重要性、熟
悉审计数据预处理阶段数据验证的内容和方法
计算机辅助审计原理及应用(第二版)
5-18
@ 清华大学出版社
审计数据预处理的内容

数据转换 数据清理
计算机辅助审计原理及应用(第二版)
5-19
@ 清华大学出版社
数据预处理的内容
脏数据 手工清理 自动清理 数据清理 清理规则
业务知识 清理算法
满足数据质量 要求的数据 图5.7 数据清理原理
计算机辅助审计原理及应用(第二版)
5-29
@ 清华大学出版社
相关参考书
计算机辅助审计原理及应用(第二版)
5-30
@ 清华大学出版社
拼写错误 实例级问题 数据输入错误 重复的数据 冲突的数据
. . .
模式级问题 异构的数据模 型和模式设计
命名冲突 结构冲突
. . .
实例级问题 冲突和不一致 的数据
不一致的汇总 不一致的时间选择
. . .
计算机辅助审计原理及应用(第二版)
5-8
@ 清华大学出版社
单数据源数据质量问题
计算机辅助审计原理及应用(第二版)
相关文档
最新文档