《大数据专业英语》课件—04ETL
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[kənˈvɜ:t]
analyze alternate
['ænəlaɪz] [ɔ:lˈtɜ:nət]
[ˈɔ:ltɜ:neɪt]
database consolidate
[ˈdeɪtəbeɪs] [kənˈsɑlɪdeɪt]
n.集成,整合,一体化 vt.转换,改变,变换
n.负荷;装载;工作量 vi.加载;装载
vt.混合;(使)调和;协调 n.混合ห้องสมุดไป่ตู้混合物
vt.(使)转变 vi.经过转变;被改变 vt.分析,分解,解释
adj.交替的,代替的 n.候补者;替换物 vi.交替;轮流 vt.使交替;使轮流 n.数据库
vt.把…合成一体,合并 vi.统一;合并;联合
New Words
toolbox initiative
[mɜ:dʒ] [pri:'bɪlt] [hʌb] [ˌprepəˈreɪʃn]
n.工具箱
n.主动性;主动精神 adj.自发的;创始的
n.代码 vt.编码,加密 vi.为…编码 n.脚本 n.精确(性),准确(性) adv.有规律地;整齐地;不断地;定期地 vi.迁移,移动 vt.收集 adj.众包的 vt.&vi.(使)混合;相融,融入 v.预建,预置 n.中心 n.准备,预备
业务决策,商业决策 流数据 与...合作 数据质量 数据治理 竞争优势 服务器日志 空间坐标数据 众包数据 与...相互配合,与...相互影响 花...在... 按比例提高,按比例增加 数据清理
Phrases
data mapping data lineage business rule data feed time stamp customer relationship management batch process staging area batch window staging table dynamic data masking hashing function sensitive data event stream processing
数据映射 数据沿袭 业务规则,商业规则 数据馈送 时间戳 客户关系管理 批处理 临时区域 批处理窗口
临时表 态数据屏蔽 散列函数; 杂凑函数; 哈希函数 敏感数据 事件流处理
Abbreviations
ELT (Extract, Load, Transform) BI (Business Intelligence) MDM (Master Data Management) SQL (Structured Query Language)
New Words
nontechnical agility burden trustworthy lineage track instruction website scene individually platform programmatic complementary standalone
[nɒn'teknɪkl] [ə'dʒɪlɪtɪ] [ˈbɜ:dn] [ˈtrʌstwɜ:ðɪ] [ˈlɪnɪɪdʒ] [træk] [ɪnˈstrʌkʃn] ['websaɪt] ['si:n] [ˌɪndɪˈvɪdʒʊəlɪ] [ˈplætfɔ:m] [ˌprəʊgrəˈmætɪk] [ˌkɒmplɪˈmentərɪ] ['stændəˌləʊn]
adj.非技术性的 n.敏捷,灵活 n.负担,包袱;责任,义务 adj.值得信赖的,可靠的 n.血统,世系 vt.跟踪,追踪 n.指令 n.网站 n.背景,场景 adv.分别地,各个地,各自地 n.平台
adj.程序化的 adj.互补的,补充的,补足的
n.脱机 adj.单独的
New Words
procedure duplication synchronize
大数据专业英语教程
Unit 4
ETL
Contents
New Words Abbreviations
Phrases 参考译文
New Words
integration transform load
[ˌɪntɪˈgreɪʃn] [trænsˈfɔ:m] [ləʊd]
blend
[blend]
convert
n.程序,过程 n.重复;复制
vt.使同步;使同时 vi.同时发生;共同行动 n.功能;功能性 n.亚秒 n 虚拟化 n.随机化,随机选择
Phrases
business decision streaming data in tandem with ... data quality data governance competitive edge server logs spatial data crowdsourced data interact with ... spent ...on scale up data cleansing
[prəˈsi:dʒə] [ˌdju:plɪ'keɪʃn] [ˈsɪŋkrənaɪz]
functionality subsecond virtualization randomization
[ˌfʌŋkʃəˈnælɪtɪ] [səb'sekənd] [vɜ:tʃʊəlaɪ'zeɪʃn] [ˌrændəmaɪ'zeɪʃn]
[ˈtu:lbɒks] [ɪˈnɪʃətɪv]
code
[kəʊd]
script accuracy regularly migrate collect crowdsourced merge prebuilt hub preparation
[skrɪpt] [ˈækjʊərəsɪ] [ˈregjʊləlɪ] [maɪˈgreɪt] [kəˈlekt] [ˈkraʊdsɔ:st]
提取、加载、转换
商业智能 主数据管理 结构化查询语言
Listening to Text A
参考译文
ETL
ETL是一种数据集成,指用于整合来自多个源的数据的三个步骤(提取、转 换、加载)。它通常用于构建数据仓库。在此过程中,从源系统获取(提取) 数据,将其改变(转换)为可以分析的格式,并存储(加载)到数据仓库或 其它系统中。提取、加载、转换(ELT)是一种替代而不是相关的方法,旨 在将处理推送到数据库以提高性能。