数据库和数据挖掘常用词词汇

合集下载

25个大数据专业术语入门大数据必备知识

25个大数据专业术语入门大数据必备知识

25个大数据专业术语入门大数据必备知识大数据是指跨越传统数据处理能力范围,无法使用常规数据库工具进行处理和管理的大量、高速度、多样性的结构化和非结构化数据的集合。

随着信息技术的高速发展,大数据已经成为当今社会的热门话题之一。

掌握大数据的相关专业术语对于大数据领域的从业者和对大数据感兴趣的人来说至关重要。

本文将介绍25个常见的大数据专业术语,帮助读者快速入门大数据领域。

1. 数据挖掘(Data Mining)数据挖掘是指通过分析大量数据来发现隐藏在其中的模式和关联性的过程。

通过数据挖掘技术,可以从海量数据中提取有价值的知识和信息,支持决策和业务发展。

2. 机器学习(Machine Learning)机器学习是一种人工智能的技术,通过让计算机系统从数据中学习和改进,实现自主学习和自主决策的能力。

机器学习在大数据处理中起到了重要作用,可以从大量数据中挖掘出模式和规律。

3. 云计算(Cloud Computing)云计算是一种基于互联网的计算方式,可以通过网络提供各种计算资源和服务。

云计算通过将计算任务分配给大量的计算机集群来处理大数据,提高计算效率和资源利用率。

4. 流式处理(Stream Processing)流式处理是指对实时产生的数据流进行实时分析和处理的技术。

在大数据领域,流式处理可以对海量的实时数据进行连续的计算和分析,实现实时决策和实时应用。

5. 数据湖(Data Lake)数据湖是指一个存储了各种结构化和非结构化数据的集合,可以容纳大量的原始数据。

数据湖不要求进行数据的预处理或格式转换,使得数据的获取和利用更加灵活和高效。

6. 数据仓库(Data Warehouse)数据仓库是指一个用于存储和管理各种企业数据的集中化数据存储系统。

数据仓库通过将来自不同数据源的数据进行整合和清洗,为企业决策提供可靠的数据支持。

7. 数据可视化(Data Visualization)数据可视化是指使用图表、图像和其他可视化方式将数据表达出来的过程。

关于大数据你应该知道的50个专业术语

关于大数据你应该知道的50个专业术语

关于大数据你应该知道的50个专业术语1. 大数据(Big Data)- 指的是规模庞大、复杂多变的数据集合。

它在各个领域中不断积累和产生,涵盖了结构化、半结构化和非结构化的数据。

2. 数据挖掘(Data Mining)- 是从大数据中自动发现和提取有用信息的过程。

它使用统计学、模式识别和机器学习等技术,帮助解读数据并发现隐藏的模式和规律。

3. 云计算(Cloud Computing)- 是通过互联网提供各种计算资源和服务的模式。

大数据通常需要庞大的计算和存储能力,云计算提供了弹性和可靠的资源解决方案。

4. 数据仓库(Data Warehouse)- 是用于存储和管理结构化数据的集中式系统。

它经过数据清洗和整合,方便用户进行复杂的分析和查询。

5. 数据湖(Data Lake)- 是指将各种类型和格式的数据存储在一个集中式的存储系统中。

与数据仓库不同,数据湖不需要事先定义数据模式和结构,可以更灵活地处理复杂的数据分析需求。

6. Hadoop- 是一个开源的分布式计算框架,用于处理大规模数据集。

它基于MapReduce算法,能够有效地分布和处理数据。

7. MapReduce- 是一种并行计算编程模型,用于处理大规模数据集。

它将数据分成多个小块,分发给多个计算节点进行并行计算,最终将结果合并返回。

8. Spark- 是一个快速、通用、高级的大数据处理引擎。

它支持内存计算,能够在大数据集上进行复杂的数据处理和分析。

9. 数据可视化(Data Visualization)- 是将数据以图表、图形和其他可视化形式展示的过程。

它能够帮助用户更好地理解和分析数据,发现潜在的信息和见解。

10. 数据清洗(Data Cleaning)- 是处理和修正数据中的错误、缺失和不一致之前的过程。

清洗后的数据更加准确可靠,有助于后续的分析和应用。

11. 数据集成(Data Integration)- 是将来自不同数据源的数据合并成一个统一的数据集的过程。

数据挖掘知识点归纳

数据挖掘知识点归纳

知识点一数据仓库1.数据仓库是一个从多个数据源收集的信息存储库,存放在一致的模式下,并且通常驻留在单个站点上。

2.数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造。

3.数据仓库围绕主题组织4.数据仓库基于历史数据提供消息,是汇总的。

5.数据仓库用称作数据立方体的多维数据结构建模,每一个维对应于模式中的一个或者一组属性,每一个单元存放某种聚集的度量值6.数据立方体提供数据的多维视图,并允许预计算和快速访问汇总数据7.提供提供多维数据视图和汇总数据的预计算,数据仓库非常适合联机分析处理,允许在不同的抽象层提供数据,这种操作适合不同的用户角度8.OLAP例子包括下钻和上卷,允许用户在不同的汇总级别上观察数据9.多维数据挖掘又叫做探索式多维数据挖掘OLAP风格在多维空间进行数据挖掘,允许在各种粒度进行多维组合探查,因此更有可能代表知识的有趣模式。

知识点二可以挖掘什么数据1.大量的数据挖掘功能,包括特征化和区分、频繁模式、关联和相关性分析挖掘、分类和回归、聚类分析、离群点分析2.数据挖掘功能用于指定数据挖掘任务发现的模式,分为描述性和预测性3.描述性挖掘任务刻画目标数据中数据的一般性质4.预测性挖掘任务在当前数据上进行归纳,以便做出预测5.数据可以与类或概念相关联6.用汇总、简洁、精确的表达描述类和概念,称为类/概念描述7.描述的方法有数据特征化(针对目标类)、数据区分(针对对比类)、数据特征化和区分8.数据特征化用来查询用户指定的数据,上卷操作用来执行用户控制的、沿着指定维的数据汇总。

面向属性的归纳技术可以用来进行数据的泛化和特征化,而不必与用户交互。

形式有饼图、条图、曲线、多维数据立方体和包括交叉表在内的多维表。

结果描述可以用广义关系或者规则(也叫特征规则)提供。

9.用规则表示的区分描述叫做区分规则。

10.数据频繁出现的模式叫做频繁模式,类型包括频繁项集、频繁子项集(又叫频繁序列)、频繁子结构。

数据挖掘data mining 核心专业词汇

数据挖掘data mining  核心专业词汇

1、Bilingual 双语Chinese English bilingual text 中英对照2、Data warehouse and Data Mining 数据仓库与数据挖掘3、classification 分类systematize classification 使分类系统化4、preprocess 预处理The theory and algorithms of automatic fingerprint identification system (AFIS) preprocess are systematically illustrated.摘要系统阐述了自动指纹识别系统预处理的理论、算法5、angle 角度6、organizations 组织central organizations 中央机关7、OLTP On-Line Transactional Processing 在线事物处理8、OLAP On-Line Analytical Processing 在线分析处理9、Incorporated 包含、包括、组成公司A corporation is an incorporated body 公司是一种组建的实体10、unique 唯一的、独特的unique technique 独特的手法11、Capabilities 功能Evaluate the capabilities of suppliers 评估供应商的能力12、features 特征13、complex 复杂的14、information consistency 信息整合15、incompatible 不兼容的16、inconsistent 不一致的Those two are temperamentally incompatible 他们两人脾气不对17、utility 利用marginal utility 边际效用18、Internal integration 内部整合19、summarizes 总结20、application-oritend 应用对象21、subject-oritend 面向主题的22、time-varient 随时间变化的23、tomb data 历史数据24、seldom 极少Advice is seldom welcome 忠言多逆耳25、previous 先前的the previous quarter 上一季26、implicit 含蓄implicit criticism 含蓄的批评27、data dredging 数据捕捞28、credit risk 信用风险29、Inventory forecasting 库存预测30、business intelligence(BI)商业智能31、cell 单元32、Data cure 数据立方体33、attribute 属性34、granular 粒状35、metadata 元数据36、independent 独立的37、prototype 原型38、overall 总体39、mature 成熟40、combination 组合41、feedback 反馈42、approach 态度43、scope 范围44、specific 特定的45、data mart 数据集市46、dependent 从属的47、motivate 刺激、激励Motivate and withstand higher working pressure个性积极,愿意承受压力.敢于克服困难48、extensive 广泛49、transaction 交易50、suit 诉讼suit pending 案件正在审理中51、isolate 孤立We decided to isolate the patients.我们决定隔离病人52、consolidation 合并So our Party really does need consolidation 所以,我们党确实存在一个整顿的问题53、throughput 吞吐量Design of a Web Site Throughput Analysis SystemWeb网站流量分析系统设计收藏指正54、Knowledge Discovery(KDD)55、non-trivial(有价值的)--Extraction interesting (non-trivial(有价值的), implicit(固有的), previously unknown and potentially useful) patterns or knowledge from huge amounts of data.56、archeology 考古57、alternative 替代58、Statistics 统计、统计学population statistics 人口统计59、feature 特点A facial feature 面貌特征60、concise 简洁a remarkable concise report 一份非常简洁扼要的报告61、issue 发行issue price 发行价格62、heterogeneous (异类的)--Constructed by integrating multiple, heterogeneous (异类的)data sources63、multiple 多种Multiple attachments多实习64、consistent(一贯)、encode(编码)ensure consistency in naming conventions,encoding structures, attribute measures, etc.确保一致性在命名约定,编码结构,属性措施,等等。

数据库中常用的英文单词

数据库中常用的英文单词

数据库中常用的英文单词第一篇:数据库中常用的英文单词数据库中常用的英文单词2010-06-30 16:20:05 阅读17 评论0字号:大中小订阅下列是一些数据库中经常碰到的英文单词:Access method(访问方法):此步骤包括从文件中存储和检索记录。

Alias(别名):某属性的另一个名字。

在SQL中,可以用别名替换表名。

Alternate keys(备用键,ER/关系模型):在实体/表中没有被选为主健的候选键。

Anomalies(异常)参见更新异常(update anomalies)Application design(应用程序设计):数据库应用程序生命周期的一个阶段,包括设计用户界面以及使用和处理数据库的应用程序。

Attribute(属性)(关系模型):属性是关系中命名的列。

Attribute(属性)(ER模型):实体或关系中的一个性质。

Attribute inheritance(属性继承):子类成员可以拥有其特有的属性,并且继承那些与超类有关的属性的过程。

Base table(基本表):一个命名的表,其记录物理的存储在数据库中。

Binary relationship(二元关系):一个ER术语,用于描述两个实体间的关系。

例如,panch Has Staff。

Bottom-up approach(自底向上方法):用于数据库设计,一种设计方法学,他从标识每个设计组建开始,然后将这些组件聚合成一个大的单元。

在数据库设计中,可以从表示属性开始底层设计,然后将这些属性组合在一起构成代表实体和关系的表。

Business rules(业务规则):由用户或数据库的管理者指定的附加规则。

Candidate key(候选键,ER关系模型):仅包含唯一标识实体所必须得最小数量的属性/列的超键。

Cardinality(基数):描述每个参与实体的可能的关系数目。

Centralized approach(集中化方法,用于数据库设计):将每个用户试图的需求合并成新数据库应用程序的一个需求集合Chasm trap (深坑陷阱):假设实体间存在一根,但某些实体间不存在通路。

数据分析报告常用术语

数据分析报告常用术语

数据分析报告常用术语数据分析是当今信息时代中一项重要的技能,它为企业和组织提供了对大量数据的洞察力。

而在数据分析报告中,术语的使用将帮助读者更好地理解和解释数据。

本文将介绍一些数据分析报告中常用的术语,以帮助读者更好地应用和理解这些术语。

1. 数据集(Dataset):指存储在数据库或文件中的一组相关数据。

通常,数据集是由多个数据元素组成,每个数据元素包括多个数据字段。

2. 数据字段(Data Field):也称为列或属性,是数据集中的每个列。

每个数据字段包含特定类型的数据,例如日期、姓名、成绩等。

3. 数据行(Data Row):也称为记录,是数据集中的每行数据。

每一行包含了属于数据字段的具体值,它们按照相同的顺序排列。

4. 数据清洗(Data Cleaning):是数据分析过程中的一个重要步骤,用于检测和修复数据集中的错误、缺失或不准确的数据。

数据清洗可以提高数据质量,确保数据的准确性和一致性。

5. 数据探索(Data Exploration):也称为探索性数据分析(EDA),是数据分析的第一步。

数据探索旨在通过统计和可视化方法揭示数据集的内在特征、模式和关系,以了解数据的概况。

6. 描述统计(Descriptive Statistics):是通过总结和展示数据的集中趋势、离散程度、分布形状、相关性等统计量来描述数据集的统计学特征。

常见的描述统计量包括均值、中位数、标准差、最大值和最小值等。

7. 相关分析(Correlation Analysis):用于衡量两个或多个变量之间关系的统计分析方法。

相关系数是用来度量变量之间线性相关性的指标,其范围从-1到1,其中-1代表强负相关,1代表强正相关,0代表无相关性。

8. 数据可视化(Data Visualization):通过使用图表、图形和其他可视化工具来展示数据的过程。

数据可视化有助于有效地传达和解释数据,帮助读者更好地理解数据。

9. 数据挖掘(Data Mining):通过分析和发现数据中的模式、关联和趋势,从大量数据中提取有用的信息。

数据挖掘中的名词解释

数据挖掘中的名词解释

第一章1,数据挖掘(Data Mining),就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。

2,人工智能(Artificial Intelligence)它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。

3,机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

4,知识工程(Knowledge Engineering)是人工智能的原理和方法,对那些需要专家知识才能解决的应用难题提供求解的手段。

5,信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。

6,数据可视化(Data Visualization)是关于数据之视觉表现形式的研究;其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。

7,联机事务处理系统(OLTP)实时地采集处理与事务相连的数据以及共享数据库和其它文件的地位的变化。

在联机事务处理中,事务是被立即执行的,这与批处理相反,一批事务被存储一段时间,然后再被执行。

8, 联机分析处理(OLAP)使分析人员,管理人员或执行人员能够从多角度对信息进行快速一致,交互地存取,从而获得对数据的更深入了解的一类软件技术。

8,决策支持系统(decision support)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。

它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。

常用大数据术语

常用大数据术语

常用大数据术语A聚合-搜索、收集和显示数据的过程。

算法-可以对数据执行某种分析的数学公式。

分析―发现数据蕴含的洞察力。

异常检测-搜索数据集中与预测模式或预期行为不匹配的数据项。

异常又叫outlier、exception、surprise或 contaminant,它们常常提供了关键的、可付诸行动的信息。

匿名化-使数据匿名,即移除可能表明个人身份的所有数据点。

应用程序-让计算机能够执行某项任务的计算机软件。

人工智能-研发智能机器和软件,它们能够感知周围环境,并且在需要时采取相应的动作,甚至从那些动作中学习。

B行为分析-这种分析可以表明如何、为何和什么,而不是仅仅表明是谁和何时。

它可分析数据中的人性化模式。

大数据科学家-能够开发解读大数据的算法的人。

大数据初创公司―开发新颖大数据技术的新兴公司。

生物特征识别-根据人的生物特征来识别人的身份。

波字节(BB)-约等于1000尧字节,相当于未来数字化宇宙的大小。

1波字节有27个0!商业智能-让数据易于理解的一套理论、方法和过程。

C分类分析-从数据获取重要相关信息的系统化过程,又叫元数据,即描述数据的数据。

云计算-网络上用于异地存储数据的分布式计算系统。

聚类分析-识别彼此相似的对象并聚集成类的过程,以便了解数据里面的相似之处和不同之处。

冷数据存储-将很少使用的旧数据存储在低功耗服务器上。

检索数据耗时较长。

对比分析-它确保采用逐步的比较和计算过程,以便发现非常大的数据集里面的模式。

复杂的结构化数据-由两个或多个复杂的关联部分组成的数据,它们不容易被结构化查询语言和工具来解析。

计算机生成的数据-计算机生成的数据,比如日志文件。

并发-同时运行或执行多个任务或进程。

关联分析-分析数据,以便确定变量之间的关系,确定这种关系是负关系(-1.00)还是正关系(+1.00)。

客户关系管理(CRM)-管理销售和业务流程,大数据会影响CRM 策略。

D仪表板-使用图形化显示算法执行的分析的工具。

关于大数据你应该知道的50个专业术语

关于大数据你应该知道的50个专业术语

关于大数据你应该知道的50个专业术语在当今数字化时代,大数据已经成为了企业和组织的重要资产。

掌握相关的专业术语对于了解大数据的概念、应用和影响至关重要。

本文将为您介绍50个关于大数据的专业术语,帮助您更好地理解和应对这一领域的挑战和机遇。

1. 数据科学(Data Science): 数据科学是指利用统计学、计算机科学和领域知识等多个学科的方法和技术,从大量数据中提取知识和洞见的学科。

2. 大数据(Volume): 大数据是指数据量庞大、速度快、种类多样的数据集合,无法使用传统技术进行有效处理和分析。

3. 数据挖掘(Data Mining): 数据挖掘是一种从大数据中发现模式、关系和趋势的技术和方法。

4. 数据仓库(Data Warehouse): 数据仓库是一个用于集中存储和管理企业数据的综合性数据库。

5. 数据湖(Data Lake): 数据湖是指以原始、未加工的形式存储大数据的存储系统。

6. 云计算(Cloud Computing): 云计算是一种通过互联网提供计算资源和服务的模式。

7. 机器学习(Machine Learning): 机器学习是一种通过给计算机提供数据和算法,使其能够自动学习和改进性能的技术。

8. 人工智能(Artificial Intelligence): 人工智能是指让计算机具备像人类一样思考、学习和决策的能力。

9. 可视化(Visualization): 可视化是一种通过图表、图形和地图等形式来展示数据的技术。

10. 数据清洗(Data Cleansing): 数据清洗是指对数据进行预处理,以确保其质量和一致性。

11. 数据采集(Data Collection): 数据采集是指从不同来源获取数据并将其整合到一个统一的平台或系统中。

12. 数据加密(Data Encryption): 数据加密是一种通过应用密码技术对数据进行保护的方法。

13. 非结构化数据(Unstructured Data): 非结构化数据是指没有明确结构和格式的数据,如文本、音频和视频等。

统计名词和数据挖掘术语大盘点

统计名词和数据挖掘术语大盘点

统计名词和数据挖掘术语大盘点一、数据挖掘术语【算法】指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。

【属性】也被称为“特性”、“变量”、或者从数据库的观点,是一个“域” 。

【个体】是关于一个单元的测量值的集合――例如一个人的身高、体重、年龄等等;它也被称作“记录”、或者“行”(每一行通常代表一个记录,每一列代表一个变量)。

【置信度】在形如“如果买了A和B,就要买C”的关联法则里有特定的含义。

置信度是已经买了A和B,还要买C的条件概率。

【因变量】在有约束学习里是那个被预测的变量;也被称作“输出变量”、“目标变量”、或者“结果变量”【估计】指的是预测一个连续型输出变量的值;也被称作“预测”。

【特征】也被称作“属性”、“变量”,或者从数据库的观点,称为“域”。

【输入变量】是在有约束学习里作预测的变量;也被称作“自变量”、“预测变量”。

【模型】通常指的是一个数学公式,包括为它设置的参数(许多模型具有用户可以调节的参数)。

【结果变量】在有约束学习里是那个被预测的变量;也被称作“因变量” “输出变量”、“目标变量”、或者“输出变量”。

【P(A|B)】读作“已知B已经发生,A将发生的概率”【预测】指的是预测一个连续输出变量的值;也被称作“估计”。

【记录】是关于一个单元的测量值的集合-例如一个人的身高、体重、年龄等等;它也被称作“个体”、或者“排”(每一排通常代表一个记录,每一列代表一个变量)。

【分数】指的是一个估计的值或者类。

【给新数据打分】意思是利用用训练数据得出的模型预测新数据里的输出值二、统计名词【统计】就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。

【教育统计】对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。

【教育统计学】社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物【测量】按一定规则给对象在某种性质的量尺上指定值。

大数据专业术语名词

大数据专业术语名词

大数据专业术语名词1. 云计算(Cloud Computing):指通过网络将大量的计算资源(如存储、处理能力等)提供给用户使用,以实现高效、可扩展的数据处理和存储。

2. 大数据(Big Data):指规模庞大、复杂度高、多样性丰富的数据集合,通常需要使用特定的技术和工具来处理和分析。

3. 数据挖掘(Data Mining):指从大数据中发现新的模式、关系和趋势的过程。

数据挖掘通常包括数据清洗、预处理、模型构建和结果分析等步骤。

4. 机器学习(Machine Learning):指通过计算机算法和模型,使计算机能够自动从数据中学习,并根据学习的知识做出预测和决策。

5. 数据仓库(Data Warehouse):指用于存储和管理大规模的结构化和非结构化数据的系统。

数据仓库通常具有高性能、可扩展性和安全性等特点。

6. 数据湖(Data Lake):指将各种类型和格式的数据存储在一个集中的数据库中,以便后续分析和处理。

数据湖通常支持数据的批处理和实时处理。

7. 数据可视化(Data Visualization):指使用图表、图形和其他可视化方法来呈现数据,以便更好地理解和解释数据中的模式和关系。

8. 分布式计算(Distributed Computing):指将计算任务分成多个子任务,并在多台计算机上并行地执行,以加快计算速度和提高处理能力。

9. 数据流(Data Stream):指以连续、高速和不断变化的方式产生的数据。

数据流通常需要实时处理和分析。

10. 并行计算(Parallel Computing):指将计算任务分成多个子任务,并在多个处理单元上并行执行,以加快计算速度和处理能力。

数据库常用英语词汇

数据库常用英语词汇

数据库常用英语词汇1. 数据库(Database)A structured collection of data that is organized and accessible in various ways.2. 表(Table)A collection of related data organized in a grid format of rows and columns.3. 列(Column)A vertical section of a table, also known as a field, which represents a specific attribute or characteristic.4. 行(Row)A horizontal record in a table that contains data related to the attributes defined by the columns.5. 记录(Record)A collection of related data values that pertain to a specific entity or item.6. 主键(Primary Key)A unique identifier for each record in a table, used to ensure data integrity and facilitate data retrieval.7. 外键(Foreign Key)A field in one table that references the primary key in another table, establishing a relationship between the two tables.8. 数据类型(Data Type)A classification that determines the type of data that can be stored in a column, such as text, number, or date.9. 索引(Index)A data structure that improves the speed of data retrieval by creating a reference to the specific location of data.10. 查询(Query)A request for specific information from a database, using a structured query language (SQL) or other methods.11. 更新(Update)The process of modifying or changing existing data in a database.12. 插入(Insert)The process of adding new data into a database.13. 删除(Delete)The process of removing data from a database.14. 连接(Join)15. 视图(View)16. 备份(Backup)A copy of the database or specific data created to ensure data availability and integrity in case of data loss or failure.17. 恢复(Restore)The process of restoring a backup copy of a database to recover lost or damaged data.18. 安全性(Security)The measures taken to protect a database from unauthorized access, data breaches, or other security risks.19. 触发器(Trigger)A database object that automatically executes a set of actions in response to specific events or changes in data.20. 事务(Transaction)A sequence of database operations that are treated as a single unitof work, ensuring consistency and integrity of data.以上是数据库常用英语词汇的简要介绍,希望能对您有所帮助!。

大数据专业词汇

大数据专业词汇

大数据专业词汇随着大数据技术的不断提高,大数据应用的不断普及,大数据与各行各业的关系越来越紧密。

大数据行业充斥着大量的专业词汇,准确掌握和了解这些词汇的含义,有助于更好的理解大数据,更好地利用大数据技术。

1.本地数据库(LDB/Local Data Base)本地数据库是指驻留于运行客户应用程序的机器的数据库。

本地数据库位于本地磁盘或局域网。

典型的本地数据库有Paradox、dBASE、FoxPro和ACCCSS。

2.数据采集(Data Acquisition,DAQ)数据采集又称数据获取,将被测试对象的各种参量通过各种传感器做适当转换后,再经过信号调理、采样、量化、编码、传输等步骤传递到控制器的过程。

数据采集的一般步骤:①用传感器感受各种物理量,并把它们转换成电信号;②通过A/D转换,模拟量的数据转变成数字量的数据;③数据的记录,打印输出或存入磁盘文件。

④生产厂商为该采集系统编制的专用程序,常用于大型专用系统;⑤固化的采集程序,常用于小型专用系统;⑥利用生产厂商提供的软件工具,用户自行编制的采集程序,主要用于组合式系统。

3.数据模型(data model)数据模型是现实世界数据特征的抽象,用于描述一组数据的概念和定义。

数据模型是数据库中数据的存储方式,是数据库系统的基础。

在数据库中,数据的物理结构又称数据的存储结构,就是数据元素在计算机存储器中的表示及其配置;数据的逻辑结构则是指数据元素之间的逻辑关系,它是数据在用户或程序员面前的表现形式,数据的存储结构不一定与逻辑结构一致。

4.数据整理(Data Cleansing)数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程,是数据统计分析的基础。

5.数据处理(Data Handling)数据处理是指对数据(包括数值的和非数值的)进行分析和加工的技术过程。

也就是对数据的采集、存储、检索、加工、变换和传输,将数据转换为信息的过程。

高级数据挖掘专业词汇100

高级数据挖掘专业词汇100

高级数据挖掘专业词汇100高级数据挖掘课程相关专业词汇1001.Data Mining, DM数据挖掘2.Knowledge Discover In Database, KDD数据库知识发现3.Artificial Intelligence, AI人工智能4.Business Intelligence, BI商务智能5.Pattern Recognition 模式识别6.Machine Learning 机器学习7.Data Analysis 数据分析8.Cluster Analysis 聚类分析9.Associative Analysis 关联分析10.Data Warehouse, DW数据仓库11.On-Line Analytical Processing, OLAP联机分析处理12.On-Line Transaction Processing 联机事务处理13.Classification 分类14.Forecast Inginformation预测性信息15.Artificial Neural Networks 人工神经网络16.Data Visualization 数据可视化17.Decision Tree 决策树18.Genetic Algorithms 遗传算法19.Linear Model 线性模型20.Non-Linear Model 非线性模型21.Market Basket Analysis 购物篮分析22.Social Network Analysis 社交网络分析23.Unstructured Data 非结构化数据24.Activation 激励函数25.Cross Validation 交叉验证26.Database Management Systems 数据库管理系统27.Decision Tree 决策树28.Fuzzy Logic 模糊逻辑29.K-Nearest Neighbor K最近邻算法30.Least Squares 最小二乘法31.Logisitc Regression 逻辑回归32.Overfitting 过拟合33.Empirical Risk 经验风险34.Preprocess 预处理35.Tomb Data 历史数据36.Data Dredging 数据捕捞37.Credit Risk 信用风险38.Data Mart 数据集市39.Log File 日志文件40.Data Extraction 数据提取41.Feature Representation 特征表示42.Association Rules 关联规则43.Distributed Computing 分布式计算44.Pattern Matching 模式匹配45.Context Awareness情境感知46.Data Exchange 数据交换47.Feature Extraction 体征提取48.Sampling 抽样49.Supervised Learning 监督学习50.Unsupervised Learning 无监督学习51.Semi-Supervised Learning 半监督学习52.Data Structure 数据结构53.Data Retrieval 数据检索54.Link Structure 链路结构55.Time Sequence 时间序列56.Graph Theory 图形理论57.Hierarchical Structure 分层结构58.Spatio-Temporal Data 时空数据59.Remote Monitoring 远程控制60.Data Uncertainty 数据不确定性61.Geographic Information System 地理信息系统62.Data Stream 数据流63.Optimization 优化64.Incremental Learning 增量学习65.Semi-Structured Data 半结构化数据66.Structured Data 结构化数据67.Unstructured Data 非结构化数据68.Self-Organization Data 自组织数据69.Intrusion Detection 入侵检测70.AbnormityDetection 异常检测71.Sequence Similarity 序列相似性72.Feature Weighting 特征加权73.Data Constraints 数据约束74.Dimension Reduction 降维75.Data Partitioning 数据分割76.Decision Support 决策支持77.Frequent Items 频繁项集78.Match Degree 匹配度79.Support Vector Machine 支持向量机80.Neural Network 神经网络81.Route Analysis 路径分析82.Interest Pattern 兴趣模式83.Genetic Algorithm 遗传算法84.Rough Set 粗糙集85.Data Cleaning 数据清洗86.Temporal Data 时态数据87.Cloud Computing 云计算88.CollaborativeFiltering 协同过滤89.Grid Computing 网格计算90.Parallel Computing 并行计算91.Fuzzy Clustering 模糊聚类92.Data Prediction 数据预测93.Behavior Prediction 行为预测94.Personalized Recommendation 个性化推荐95.Semantic Rule 语义规则96.Real-Time Decisioning实时决策97.Deep Learning深度学习98.Attribute 属性99.Test Data 测试数据100.Train Data 训练数据。

数据库和数据挖掘常用词词汇

数据库和数据挖掘常用词词汇

PrefaceCurriculum n.1.总课程,(学校等的)全部课程And just as important as the radical churches and the reformed sects is for Hobbes the university and its curriculumconceptn.1.概念; 观念; 想法2.总的印象;思维的产物;发明;创造adj.1.试作阶段的;新设想的;领导时代新潮流的I would suggest that it's not unlike the wedge that Hirsch drives between the concept of meaningand the concept of significanceartificialadj.1.人造的, 人工的, 假的2.虚假的, 不真挚的, 矫揉造作的3.人为的"To me it's too artificial and it's also the same story that you've seen before with indigenous groups and the white colonial forces coming to destroy them or something like that."evaluationn.1.估价,评价;估算2.<数>赋值,值的计算3.估计价值,鉴定4.【医学】诊断Mr Riggio said he wants to stay at the company whatever the outcome of the evaluation Chapter1 overviewMotivatedadj. 1.目的明确的2.激发,促进3.有动机的4.积极的What motivated data miningPerformance1.演出, 表演注解批注2.履行, 执行注解批注3.表现, 行为, 成就注解批注4.性能, 工作情况注解批注Different performance between transaction process and analysis processproblem-solving1.问题解决These exercises are meant to pull you out of your usual habits and to put you in situations that will demand resourcefulness and creative problem-solvingunsuitedadj.1.不合格的;不胜任的;不适宜的2.(人)志趣不相投的,不相配的,不般配的subtract those unsuited to government office because of their views, age, disposition or dimnesssummarizevt.1.总结, 概述orientedadj.1.导向的;面向…的2.以...为方向的,以...为目的的integratedadj.1.整体的;完全的;综合的;集成的;整合的2.结合的;连成一体的3.互相协调的4.完整的5.(各组成部分)与谐的6.[主美国英语]取消(种族)隔离的;平等对待的variantn.1.变体;变种;变型2.(词等的)变体;异读3.(书等的)不同版本;改编adj.1.不同的; 差别的; 变异的;易变的, 不定的; 各种各样的nonvolatileadj.1.(尤指物质)非挥发性的; 不挥发的1.非易失性的2.不挥发的3.非易失的4.支持访问非易变A data warehouse is a subject-oriented, i ntegrate d, time-variant, and nonvolatile(不容易丢失) collection ofdata in support of management’s decision making processprimitiveadj.1.原始的, 早期的2.发展水平低的;落后的3.原始的;人类或动物发展早期的n.1.文艺复兴前的画家或雕刻家; 早期的艺术家2.原始人, 原始事物By adding or swapping a logical primitive here or there, the entire functionality of the program shifts orenlargesextractingn.1.萃取,提取,提炼Data mining refers to extracting or “mining” knowledge from large amounts of data.patternn.1.型, 样式2.花样, 图案3.方式, 形式vt.1.模仿; 仿制2.以图案装饰3.使形成,促成(某行为模式)4.复写;复制vi.1.形成图案Extraction interesting (non-trivial(有价值的), implicit(固有的), previously unknown and potentially useful)patterns or knowledge from huge amounts of data.evaluationn.1.估价,评价;估算2.<数>赋值,值的计算3.估计价值,鉴定4.【医学】诊断Methods include evaluation measurement technique, error-proofing, sample size and frequency, control method transformationn.1.变化, 弯形, 变质, 转变2.转变实例3.<电>变换,转换4.<数>变换(式)5.<语>转换And in this way, these women enacted a lot of transformation, beautiful transformationSelectionn.1.选择, 挑选2.被挑选的人[事物]; 选萃, 选集3.可供选择的东西trivialadj.1.不重要的;琐碎的;微不足道的Nobody calls these issues trivial—but they are also among the hardest to deal withimplicitadj.1.不言明[含蓄]的2.无疑问的, 绝对的3.成为一部份的;内含的The larger, implicit point is that the threatening thing is not really that threateningpreviouslyadv.1.事先;以前2.<美><口>仓促地;不成熟地potentiallyadv.1.潜在地;可能地2.<古>强有力地;权威地adj.1.假定地Extraction interesting (non-trivial(有价值的), implicit(固有的), previously unknown and potentially useful) patterns or knowledge from huge amounts of data.alternativeadj.1.两者(或两者以上)择一的,二择其一的,可从数个中任择其一的;(两种选择中)非此即彼的2.不寻常的, 非传统性的3.非正统的4.(两者)互斥的n.1.取舍, 抉择, 可供选择的事物2.选择的余地, 可供选择的机会3.可供选择的事物;替换物,替代品An alternative to the all red bouquet is to buy some white roses and insert one red one in the center of the bunch.insurancen.1.保险2.保险业3.保险费4.保险措施, 安全保障So insurance companies can no longer drop your coverage when you get sick, which was happening scoutn.1.侦察员[机, 舰]2.童子军3.搜索, 侦察vt. & vi.1.寻找; 侦察vt.1.物色(优秀运动员、演员、音乐家等)Kerr went about this like a talent scout, and his successors have continued the practiceinventoryn.1.详细目录, 存货清单,(商店的)存货,库存2.细账;细目表;详细目录3.存货清单(或财产目录)的编制4.自然资源目录5.总结;概述vt.1.编制…的目录;开列…的清单;盘存,清查2.总结,概述vi.1.对清单上存货的估价,具有清单所示价值Replenishing inventory will be a temporary fillip without an increase in consumer demandChapter2 dw conceptsmodelingn.1.造型(术)2.(图画等的)立体感3.模特儿职业adj.1.制造模型的2.模特儿的conciseadj.1.简明的;简炼的;简洁的2.简略的;简缩的;简明的These equations represent one of the most elegant and concise ways to state the behaviour of electric andmagnetic fields and how they interact with matterparticularadj.1.特定的, 某一的2.特殊的, 特别的, 特有的3.(过分)讲究的, 挑剔的4.详细的, 详尽的5.不寻常的;格外的6.个别的;各个的,各自的;独自的,个人的7.精密的;细致的8.分项的;列举的9.【逻辑学】特称的;特殊的n.1.[常作复数] (消息或情报等的)详情;细目2.详细资料;详细介绍材料3.(总体中的)一项;一条;一点;一部分;一个细节4.特殊情况;个别情况Deep drilling poses particular problems of high pressure and temperatureissues1.债券1.争点3.配置与操作说明provide a simple and concise view around particular subject issues by excluding data that are not useful in the decision support process.excludingprep.1.除…外, 不包括Excluding certain items, Oracle earned 54 cents per share, more than Wall Street was expectingmultipleadj.1.多重的, 多种多样的2.多个的;由多个组成的;重合的;多数的;多层次的;多次的3.复杂的4.多人参加的;多人享有的5.多功能的6.倍数的,多倍的n.1.〈数〉倍数2.【电工学】并联,复联;多路系统,多次线路3.连锁商店,联号The team developed a method of analysing genes in multiple ageing tissue types in both animals and humans heterogeneousadj.1.多种多样的;混杂的The Data Transformation Services Import/Export Wizard allows you to import and transform heterogeneous dataconsistencyn.1.一致性, 连贯性2.坚实度, 浓度, 黏稠度To this end, and to ensure consistency and repeatability, protocols for each of the key measurements were producedconventionn.1.(某一职业、政党等的人士召开的)大会, 集会2.习俗, 惯例, 常规3.协议, 协定, (国家或首脑间的)公约,(换俘等)协定,协议4.【桥牌】叫牌的一套常规5.(美国)全国代表大会;政党代表大会The letter urged the government to ratify the Convention at the earliest possible opportunity encodingn.1.编码,译码ensure consistency in naming conventions,encoding structures, attribute measures, etcattributevt.1.认为…是; 归因于…2.认为某作品出自某人之手3.认为某事[物]属于某人[物]4.把…归于;把…归因于,把…归咎于,把(过错的责任等)归于,诿于(to)5.把…品质归于某人,认为某人具有…品性,认为(品性、特征)属于…6.确定…产生的时间、时期或地点等n.1.属性, 特性2.价值3.(人或物的)特征、品性,品质4.(文艺作品中人、物、职务等的)象征,标志5.【语法学】定语,修饰语,限定词(在名词短语中修饰名词的形容词)6.【逻辑学】属性,性质ensure consistency in naming conventions,encoding structures, attribute measures, etchorizonn.1.地平线2.范围, 界限, 眼界3.天球地平圈,真正平圈4.水平(线)5.(测量高度用的)人工地平6.(透视)视平线7.可望见的东西8.眼界,视线;(知识、阅历、兴趣等的)范围;见识significantlyadv.1.意味深长地2.值得注目地;显著地operationaladj.1.即可使用的2.(用于)操作的, 经营的3.军事行动的perspectiven.1.远景, 景2.前途; 希望3.透视;透视画法;中心透视4.透视图5.观点, 想法6.态度;观点;思考方法The time horizon(范围) for the data warehouse is significantly longer than that of operational systemsexplicitlyadv.1.明白地,明确地implicitlyadv.1.含蓄地;暗示地2.无疑问地;无保留地;绝对地Contains an element of time, explicitly or implicitlymapping1.映射,绘制…的地图,计划logn.1.原木, 木材, 木料2.(某时期事件的)正式记录, 日志;(尤指)航海日志, 飞行日志vt. & vi.1.砍伐vt.1.把…记入航海日志; 把…载入正式记录; 记录2.航行(…距离), 飞行(…小时); 行驶,行进(若干距离或时间)To get started mind mapping a meeting, get the agenda ahead of time if possiblesummarizationn.1.摘要,概要As we know, notes are the summarization, the core content, our understanding and the abbreviations of the booksrefreshingadj.1.耳目一新的;新颖的;新鲜的2.使人精神焕发的;使恢复精神的3.使人凉爽的granularityn.1.间隔尺寸,粒度The beauty of the technique is that it encompasses both granularity and generalityChapter 3 Data Warehouse Modelsconceptualadj.1.概念(上)的;观念(上)的conceptual modelmetadatan.1.元数据granularityn.1.间隔尺寸,粒度metadata model and granularity modelentityn.1.实体, 独立存在体, 实际存在物.统一性Entity-relationship modelcommodityn.1.商品, 货物2.有用的东西3.农产品;矿产品4.有价值的物品Time is the most valuable commodity one can have, according to the doctrine of the time worshippers Multidimentional 1.而呈现多维scheman.1.概要, 计划, 图表Multidimentional modelsnowflaken.1.雪花,雪片Snowflake schemaconstellationn.1.星座2.一群杰出人物3.一系列(相关的想法、事物);一群(相关的人)Fact constellationdimensionn.1.尺寸, 度量2.方面, 部分3.规模, 程度4.(长、宽、高的)量度;面积6.…维的;…度空间的7.特点,特征adj.1.(木料、石料等做成)规格的vt.1.把…刨成(或切削成)需要的尺寸2.在…上标出(或测出)尺寸[通常用于过去分词]Dimension tabledynamicadj.1.有活力的, 强有力的2.不断变化的3.动力的, 动态的4.充满活力的;精力充沛的5.发展变化的n.1.(人或事物)相互作用的方式,动态2.力学;动力学3.动力4.力度;力度变化This reflects the dynamic growth of the physics discipline during this centuryinvestmentn.1.投资2.投资额;投资物3.值得买的东西;有用的投资物4.(时间、精力的)投入Return on investment & Risk Analysisbrieflyadv.1.短暂地2.简单地说;简洁地;简短地Write a reader's report on the book. Tell the story briefly and then explain why you did or did not enjoy it.Chapter 4 OLAP technologyconsolidationn.1.巩固,加强,强化2.联合,统一;合并3.变坚固aggregationn.1.聚集,集成;集结2.聚集体,集成体is an analysis technique, with functionalities such as summarization, consolidation, and aggregation, as well as the ability to view information from different angles.trendline1.趋势线histogramn.1.柱状图n.1.圆形分格统计图表scattervt. & vi.1.(使)散开, (使)分散; 驱散vt.1.撒n.1.散落;三三两两;零零星星plotn.1.故事情节2.(秘密)计划, 密谋3.小块地皮4.基址,地基5.小区,小地段vt.1.把…分成小块; 划分2.绘制; 标出3.密谋;策划vt. & vi.1.密谋vi.1.设计作品情节2.标绘;作图;用坐标确定位置,坐标显示Scatter plothierarchyn.1.等级制度2.统治集团, 领导层3.层次体系The hierarchy of dimensionarrayn.1.展示, 陈列, 一系列2.衣服, 服装3.数组, 阵列4.大堆;大群;大量vt.1.部署兵力,配置兵力; 排列, 整队,布置2.盛装, 打扮, 装饰Multidimensional arraysortn.1.群; 种类; 类别2.某种人3.分类;排序4.品级5.品质;性质;性格vt. & vi.1.分类; 整理vt.1.妥善处理;把…整理好(或安排妥当)2.挑选,拣出,区分(常与out连用)3.把…归类(常与with, together连用)4.【计算机】(根据指令的模式)把…分类,把…排序vi.1.[英国方言]交往;友好往来(with)Human records, however, are not the only sort availableperspectivesn. 1.透视,远景,看法;2.构面;观点展示(perspective的复数形式)Dimensions are the perspectives or entities with respect to which an organization wants to keep recordsChapter 5classificationn.1.分类, 分级2.类别, 种类, 门类3.(动植物等的)分类学,分类法Different views,different classficationspatialadj.1.空间的, 立体空间的, 三维空间的This area is involved in some sensory understanding and spatial recognition, as well as language, reading and vision.temporaladj.1.时间的2.暂存的,短暂的,非永恒的3.世俗的;现世的n.1.暂存的事物,世间的事物vt.1.使世俗化n.1.俗人The fact that pontiffs wear two hats, temporal and spiritual, gives them, and their interlocutors, a certain flexibi heterogeneousadj.1.多种多样的;混杂的The albumins contain the majority of the cellular enzymes and are thus extremely heterogeneouslegacyn.1.遗产, 遗赠物2.遗留之物3. 遗留问题;后遗症Race remains a prominent and sensitive issue in the United States, which has struggled to overcome a legacy of slavery, segregation and discriminationChapter 6 Data preprocessingreductionn.1.减少, 缩小; 减少的量, 降价2.(照片、地图、图片等的)缩图,缩版3.【生物学】减数分裂4.【摄影术】减薄5.【数学】约简6.【化学】还原7.降低;降级;降职8.归纳;总括;简化9.浓缩变稠10.稀释It is part of the method of explanation by way of reduction, or deduction from hypothesesIdentify1.认出, 识别2.支持, 同情3.辨认;识别;认出;鉴定;验明;确定4.使等同于;把…看做一致(常与with连用5.使支持;使参与,使关系密切(常与with连用vt. & vi1.等同于; 有关联vi.1.同情;跟…发生共鸣;支持(常与with连用))Identify outliers and smooth out noisy dataincompleteadj.1.不完全的, 不完整的,不完善的,未完成的n.1.(学业成绩评分)未修毕,未完成Therefore our knowledge of the core is quite incomplete.occupationn.1.工作; 职业2.消遣, 业余活动3.占领, 侵占,占领期4.(土地、房屋、建筑等的)使用,居住,占用The happiness and satisfaction we can get from occupation and work are much more than most of us expect inconsistentadj.1.(思想、意见等)不一致的, 不协调的2.易变的, 不稳定的, 反复无常的3.不一致;相矛盾4.不符合(某套标准、思想等)5.反覆无常的;没有常性的This may seem to imply the charge that historicism is inconsistenttuplen.1.元组,数组attributesn.1.属性;特性,特质many tuples have no recorded value for several attributes, such as customer income in sales data randomadj.1.随意的, 任意的, 无计划的, 未经事先考虑的, 胡乱的2.(统计)随机的variancen.1.差异,不同;不一致;不相符合2.变化; 变动; 变异;变化幅度;差额3.不与;有分歧4.<数>方差5.( 与… )有矛盾,不一致measuredadj.1.仔细斟酌的,慎重的2.缓慢而又有节奏的Noise is a random error or variance in a measured variable.binningn.1.装箱,进仓Binning methodclusteringn.1.聚类regressionn.1.衰退2.(尤指因催眠或精神疾患,或为逃避目前忧虑)回到从前,回归3.(统计学) 回归The regression on tensile strength with portland cement mixed with fiber was derived using orthogonal inspectionn.1.检查,视察2.检验;审视3.检阅4.(巡官的)巡区;检查员(或督察员)的管辖区5.视察;检阅;参观They are using sensors and a camera at the end of the shuttle's robot arm for the inspection will take about5hoursmedianadj.1.在中间的;通过中点的2.中间值的;中间的n.1.中位数2. (三角形的)中线Smoothing by bin medianssuspiciousadj.1.猜疑的, 疑心的2.可疑的3.表示怀疑的4.不信任的;持怀疑态度的We are concerned with any suspicious activity in light of the recent media attentionredundancyn.1.过多,过剩,多余2.(尤指文字)冗长,累赘3.(机器的)多余度,冗余;(自动)重复4.(因劳动力过剩而造成的)裁员,解雇1.备份One way around this redundancy problem would be to administer a cocktail of inhibitory molecules that targetsmultiple pain mechanismsnormalizationn.1.常态化;正常化;正规化decimaladj.1.十进位的, 小数的n.1.小数min-max normalizationscalingn.1.缩放比例respectivelyadv.1.分别;各自;顺序为;依次为normalizationn.1.常态化;正常化;正规化normalization by decimal s calingaggregationn.1.聚集,集成;集结2.聚集体,集成体Data cube aggregationdiscretizationn.1.离散化By use of the super-club data and entropy of the information table, the discretization of continuous attributes was implementedheuristicadj.1.(教学或教育)启发式的This article reviews the applications of heuristic didactics to pharmacology teachingcompressionn.1.挤压,压缩2.(内燃机的)压缩冲程3.压抑;压制To specify set a compression exception for a folder, click Folder, and then type the folder name componentsn.1.(机器、设备等的)构成要素;零件;成分adj.1.组成的;构成的The three components of body build are type, size and compositionsegmentationn.1.分割In the segmentation process we take an explained variabledistinctadj.1.截然不同的, 完全分开的2.清晰的, 明白的, 明显的3.清楚的,一清二楚的,显著的;不会搞错的;能清楚地识别(或认识)的;线条分明的4.不同的,个别的,各别的;有区别的,差异的;单独的,独立的,独特的5.性质(或种类)不同的,不同性质的,不同种类的,不相似的In the medium term, a sharp rise in inflation is a distinct possibilityChapter 7 Mining association rules in large databases associationn.1.协会, 社团2.联合, 结合, 交往3.联系;关联;交往,交际,结交4.友谊;伙伴(或合伙、合作、合股)关系5.团体,会,社,学会,联合会;联盟,同盟6.(思想、感觉、记忆等的)联想;思想(或观念)的联系association rule mining: basic conceptscorrelationn.1.相互的关系Association rule mining finds interesting association or correlation relationships among a large set of dataitems.implicationn.1.卷入, 牵连,牵涉2.含义, 暗示, 暗指3.可能的影响(或作用、结果)4.含蓄;含意;5.【逻辑学】蕴涵But the other implication is not so easily provedthresholdn.1.门槛; 门口〈喻〉开始; 开端; 起点; 入门2.阈;界限;起始点3.【物理学】临界值4.【地质学】海底山脊,海槛adj.1.阈值的,临界值的2.[英国英语]按物价指数变动工资的,工资极限的,级限的Rules that satisfy both a minimum support threshold and a minimum confidence threshold are calledstrong.occurrencen.1.发生, 出现2.事件; 发生的事The occurrence frequency of an itemsetalgorithmn.1.运算法则2.算法;演算法;计算程序3.演示Apriori algorithmcandidaten.1.申请求职者, 候选人2.报考者3.攻读学位者4.最后命运或结局如何已显然可见者vi.1.成为牧师候选人The defeated candidate demanded a recount of the votesabstractionn.1.抽象,抽取2.抽象化;抽象过程3.抽象概念;抽象名称4.抽象性,抽象的特征5.出神;心不在焉6.不切实际的想法,空想;幻想的事物Statics, the physicist knows, is only an abstraction from dynamicsChapter 8 classification and predictionpredictionn.1.预言;预言的事物;预测classification and predictionbackpropagationn.1.反向传播(B-P),可以用来表示一种神经网络算法,例如:B-P网络。

大数据技术术语

大数据技术术语

以下是一些常见的大数据技术术语: 1. 数据仓库:用于存储和管理大量结构化数据的系统。

2. 数据湖:一种存储大量原始数据的系统,包括结构化、半结构化和非结构化数据。

3. 数据挖掘:从大量数据中提取有用信息和知识的过程。

4. 机器学习:使用算法从数据中学习并做出预测或决策的方法。

5. 数据分析:对数据进行检查、转换、清理和建模,以提取有用信息和支持决策制定的过程。

6. 数据治理:确保数据质量、安全性和合规性的一套策略、流程和技术。

7. 数据隐私:保护个人数据不被未经授权的第三方访问或使用的做法。

8. 云计算:通过互联网提供计算资源(如服务器、存储和应用程序)的模型。

9. 大数据处理:处理和分析大量数据的过程,通常涉及分布式计算和存储技术。

10. 数据科学:结合统计学、计算机科学和领域专业知识来理解和分析数据的跨学科领域。

这些只是大数据领域中的一些常见术语,随着技术的发展,新的术语和概念还在不断涌现。

如果你对特定的大数据技术术语有更多疑问,我可以为你提供更详细的信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

PrefaceCurriculum总课程,(学校等的)全部课程1.n.And just as important as the radical churches and the reformed sects is for Hobbes the universityand its curriculumconcept想法观念;n.1.概念;总的印象;思维的产物;发明;创造2.试作阶段的;新设想的;领导时代新潮流的1.adj.I would suggest that it's not unlike the wedge that Hirsch drives between the of meaning conceptand the of significance conceptartificial假的人工的,1.人造的,adj.矫揉造作的不真挚的,2.虚假的,人为的3.To me it's too and it's also the same story that you've seen before with indigenous groups artificialand the white colonial forces coming to destroy them or something like桴瑡尮evaluation估算;估价,评价n.1.值的计算,数>赋值2.<估计价值,鉴定3.【医学】诊断4.Mr Riggio said he wants to stay at the company whatever the outcome of the evaluationChapter1overviewMotivated1.目的明确的2.激发,促进3.有动机的4.积极的.adj What motivated data mining Performance表演注解批注,1.演出执行注解批注,2.履行成就注解批注行为,3.表现,工作情况注解批注.性能,4Different between transaction process and analysis process performanceproblem-solving问题解决1.to pull and in that will demand situationsput you habitsusualyourofmeantareexercisesThese outyoutoand solvingproblem-resourcefulnesscreativeunsuited1.ocollectio oshiftprogra2.图案2.花样,形式3.方式,仿制1.模仿;vt.以图案装饰2.使形成,促成(某行为模式)3.复写;复制4.形成图案1.vi.potentially and,previously unknowninteresting(non-trivial(有价值的),implicit(固有的)Extraction data.of huge amountsuseful)patterns or knowledge from evaluation估算;,评价n.1.估价值的计算赋值,<2.数>估计价值,鉴定3.【医学】诊断4.,,,methodcontrolfrequency sample sizeand Methods include evaluation measurement technique error-proofing transformation转变,,变质n.1.变化,弯形转变实例2.转换,变换<电>3.)式>变换(4.<数转换>5.<语And,of,transformation transformation beautifulenacted these women a lot in thisway Selection挑选选择,n.1.选集选萃,[事物];2.被挑选的人可供选择的东西3.trivial不重要的;琐碎的;微不足道的adj.1.—to with the among hardestdealthese calls issues trivial theybut are alsoNobody implicit的]不言明[含蓄adj.1.绝对的无疑问的,2.成为一部份的;内含的3.The larger,point is that the threatening thing is not really that threatening implicitpreviously以前;1.事先adv.不成熟地仓促地;美><口>2.<potentially 可能地;1.潜在地adv.权威地;古>强有力地<2.假定地1.adj. 3.potentiall centeth o happenin4.Chapter2dw conceptsmodeling)术1.造型(n.立体感)(图画等的2.模特儿职业3.制造模型的1.adj.模特儿的2.concise简明的;简炼的;简洁的1.adj.简略的;简缩的;简明的2.one and to state andelectric behaviour of represent elegant of the most the concise waysThese equationsmatterwith interact fields and how theymagneticparticular某一的,adj.1.特定的特有的特别的,特殊的2.,挑剔的)讲究的,3.(过分详尽的4.详细的,不寻常的;格外的5.个别的;各个的,各自的;独自的,个人的6.精密的;细致的7.分项的;列举的8.特殊的;9.【逻辑学】特称的详情;细目)(消息或情报等的1.[常作复数]n.详细资料;详细介绍材料2.一项;一条;一点;一部分;一个细节)(总体中的3.特殊情况;个别情况4.temperatureand high pressure poses particular problems of Deepdrillingissues债券1.争点1.配置与操作说明eful notdata that areissuesaround particular subject by excluding viewandaprovide simple conciseprocess.support the decision inexcluding不包括外除…,prep.1.certain items,Oracle earned54cents per share,more than Wall Street was expecting Excluding multiple多种多样的,多重的1.adj.多个的;由多个组成的;重合的;多数的;多层次的;多次的2.5.复杂的3.多人参加的;多人享有的4.多功能的5.倍数的,多倍的6.〈数〉倍数1.n.【电工学】并联,复联;多路系统,多次线路2.连锁商店,联号3.developed in both humans and animalstypes multiple ageing tissueThe team method a of analysing genes in heterogeneous多种多样的;混杂的1.adj.The/Wizard to heterogeneous transform import allows youand Data Transformation Services Import Export data consistency连贯性,n.1.一致性黏稠度,坚实度,浓度2.,and,for were measurements key each to ensure consistency and repeatabilityof protocolsTo this end theproduced集会)大会,n.1.(某一职业、政党等的人士召开的常规惯例,2.习俗,(换俘等)协定,协议(国家或首脑间的)公约,, 3.协议,协定【桥牌】叫牌的一套常规4.全国代表大会;政党代表大会)(美国5.The letter urged the government to ratify the at the earliest possible opportunity Conventionencoding译码编码,n.1.etc attribute measures,naming conventions,encoding structures,inensure consistencyattribute…归因于是;vt.1.认为…认为某作品出自某人之手2.]物属于某人[3.认为某事[物](to))归于,诿于…归咎于,把(过错的责任等把4.…归于;把…归因于,把…属于(品性、特征)品质归于某人,认为某人具有5.把……品性,认为产生的时间、时期或地点等…6.确定特性,属性n.1.价值2.特征、品性,品质)3.(人或物的象征,标志文艺作品中人、物、职务等的)(4.)在名词短语中修饰名词的形容词5.【语法学】定语,修饰语,限定词(【逻辑学】属性,性质6.6.conventions,naming consistency inensure etcmeasures,structures,attribute encodinghorizon地平线n.1.眼界,范围,界限2.天球地平圈,真正平圈3.)(线4.水平人工地平测量高度用的)5.(视平线透视)6.(可望见的东西7.范围;见识知识、阅历、兴趣等的)8.眼界,视线;(significantly意味深长地adv.1.值得注目地;显著地2.operational即可使用的1.adj.经营的)操作的,2.(用于军事行动的3.perspective景1.远景,n.希望前途;2.透视;透视画法;中心透视3.透视图4.想法观点,5.态度;观点;思考方法6.The time horizon(范围)for the data warehouse is significantly longer than that of operationalsystemsexplicitly明确地明白地,adv.1.implicitly暗示地;1.adv.含蓄地无疑问地;无保留地;绝对地2.implicitly ortime,of explicitlyContains anelement mapping计划,…的地图1.映射,绘制log木料,原木,木材n.1.飞行日志;(尤指)航海日志,(某时期事件的)正式记录2.,日志砍伐1.vi.vt.&记录…载入正式记录;把vt.1.…记入航海日志;把行驶,行进(若干距离或时间)小时(距离(2.航行…),飞行…);7.started,of time possible if get the agenda To getahead mind mapping a meeting summarization概要,1.摘要n.,,the,the the of abbreviations our understanding notes are the summarization and core content As we know booksrefreshing新鲜的新颖的;1.耳目一新的;adj.使恢复精神的使人精神焕发的;2.使人凉爽的3.granularity粒度间隔尺寸,n.1.The both generality granularity encompasses and itbeauty of the technique is that Chapter 3Data Warehouse Models概念(上)的;观念(上)的1.adj.model conceptual metadata元数据1.n.granularity粒度,1.间隔尺寸n.model granularity model and metadata entity统一性实际存在物.独立存在体,n.1.实体,modelrelationship Entity-commodity货物1.n.商品,有用的东西2.农产品;矿产品3.有价值的物品4.,the worshipperstime theaccording to doctrine of Timeis themost valuable commodity onecan have1.而呈现多维Multidimentionalschema图表计划,n.1.概要,model Multidimentional snowflake雪片,n.1.雪花schema Snowflake constellation.星座1n..一群杰出人物28.diit enjoodino9.变坚固3.aggregation集结集成;n.1.聚集,集成体聚集体,2.theas well and aggregation,as technique,with functionalities such as summarization, consolidation,analysisis anangles.from differentto view information ability trendline趋势线1.histogram柱状图1.n.1.圆形分格统计图表n.scatter驱散分散;,(使)vt.&vi.1.(使)散开撒1.vt.散落;三三两两;零零星星1.n.plot故事情节1.n.密谋,(2.秘密)计划小块地皮3.基址,地基4.小区,小地段5.划分;把…分成小块vt.1.标出;2.绘制密谋;策划3.密谋1.&vi.vt.设计作品情节1.vi.标绘;作图;用坐标确定位置,坐标显示2.plot Scatter hierarchy等级制度1.n.领导层统治集团,2.层次体系3.dimensionof The hierarchyarray一系列陈列,1.n.展示,服装衣服,2.阵列,数组3.大堆;大群;大量4.整队,布置排列,vt.1.部署兵力,配置兵力;装饰打扮,,2.盛装array Multidimensional10.sort类别种类;n.1.群;某种人2.分类;排序3.品级4.品质;性质;性格5.整理分类;&vi.1.vt.整理好(或安排妥当)…1.妥善处理;把vt.)连用out挑选,拣出,区分(常与2.)连用常与with,together3.把…归类(排序分类,把…根据指令的模式)把…4.【计算机】((with)]交往;友好往来vi.1.[英国方言,,the available sort are notonly Human recordshowever perspectives透视,远景,看法;1.n.的复数形式)perspective2.构面;观点展示(keep wants towhich an organization perspectives or entities with respect to Dimensions aretherecordsChapter5classification分级分类,n.1.门类种类,2.类别,(动植物等的)分类学,分类法3.classfication views,differentDifferent spatial三维空间的,空间的,立体空间的1.adj.is in,,reading and languageas well some sensory understandingand spatial recognitionasThis area involved.vision temporal时间的1.adj.非永恒的,,短暂的2.暂存的现世的;3.世俗的世间的事物暂存的事物,n.1.使世俗化vt.1.俗人n.1.,,,,certain flexibiinterlocutors a themgives hatstwowearpontiffsthatfactThe temporal andspiritual andtheir heterogeneous多种多样的;混杂的1.adj.11.and heterogeneous extremely are of the cellular enzymesthuscontainThe albumins the majority legacyn.1.遗产,遗赠物2.遗留之物3.遗留问题;后遗症in,a overcomestruggled to States which remains a prominent andsensitive issuehas the United Race,discrimination and segregation legacy of slavery Chapter6Data preprocessingreduction降价,;减少的量n.1.减少,缩小(照片、地图、图片等的)缩图,缩版2.【生物学】减数分裂3.【摄影术】减薄4.【数学】约简5.【化学】还原6.降低;降级;降职7.归纳;总括;简化8.浓缩变稠9.稀释10.is way of,hypotheses fromexplanation by or reduction deductionItofpart of the methodIdentify识别,认出1.同情,2.支持辨认;识别;认出;鉴定;验明;确定3.连用with使等同于;把…看做一致(常与4.连用with(常与5.使支持;使参与,使关系密切vi vt.&有关联1.等同于;vi.))连用with(1.同情;跟…发生共鸣;支持常与datanoisy out smooth Identify outliers and incomplete未完成的不完善的,不完整的,adj.1.不完全的,(学业成绩评分)未修毕,未完成1.n.core.incomplete is Thereforeour knowledgeof thequite occupation职业工作;n.1.业余活动消遣2.,侵占,占领期占领3.,12.expecuthamosomor datisaleincom orthogonausin13.的管辖区)(或督察员4.(巡官的)巡区;检查员视察;检阅;参观5.at the of the's for5about will cameraarmtake endthe inspection shuttle robot sensorsThey are using and a hours median在中间的;通过中点的adj.1.中间值的;中间的2.中位数1.n.(三角形的)中线2.medians bin by Smoothing suspicious疑心的,adj.1.猜疑的可疑的2.表示怀疑的3.不信任的;持怀疑态度的4.attention recent media of the with any suspicious activity in light We areconcerned redundancy多余,,过剩n.1.过多累赘,)冗长2.(尤指文字重复);(自动)多余度,冗余3.(机器的因劳动力过剩而造成的)裁员,解雇(4.备份1.a cocktail that targetsmolecules inhibitory ofadministerproblemaround this redundancy would be to wayOne mechanisms multiple pain normalization正规化;;正常化n.1.常态化decimal小数的十进位的,adj.1.小数n.1.normalization max min-scaling缩放比例n.1.respectively分别;各自;顺序为;依次为1.adv.normalization正规化;;正常化n.1.常态化caling s by decimalnormalization aggregation集结集成,;n.1.聚集集成体,2.聚集体aggregation Datacube14.discretization离散化1.n.was continuous attributes discretization of entropy of the information table,the By use of thesuper-club data and implemented heuristic(教学或教育)启发式的1.adj.of teaching pharmacology heuristic didacticsarticle reviews the applications to This compression压缩,1.挤压n.压缩冲程)(内燃机的2.压制;3.压抑a a,click,namefolder type the Folderspecify set compression exception forandfolder then Tocomponents成分零件;机器、设备等的)构成要素;n.1.(构成的组成的;adj.1.The are,compositionand build size type three components of body segmentation分割1.n.variable an explainedprocess we take In the segmentationdistinct完全分开的1.截然不同的,adj.明显的明白的,清晰的2.,的;线条分明的)(或认识3.清楚的,一清二楚的,显著的;不会搞错的;能清楚地识别不同的,个别的,各别的;有区别的,差异的;单独的,独立的,独特的4.不同的,不同性质的,不同种类的,不相似的)(或种类5.性质the,a in possibility distinct is sharp riseaIn medium terminflationChapter7Mining association rules in large databases association社团,n.1.协会交往,结合2.联合,联系;关联;交往,交际,结交3.关系)(或合伙、合作、合股4.友谊;伙伴团体,会,社,学会,联合会;联盟,同盟5.的联系或观念))联想;思想(思想、感觉、记忆等的6.(concepts mining:basic association rulecorrelation相互的关系1.n.data ofsetlargeaamongrelationships correlation orassociationinterestingfindsminingruleAssociation 15.items.implication牵涉牵连,1.卷入,n.暗指,含义,暗示2.可能的影响(或作用、结果)3.含蓄;含意;4.【逻辑学】蕴涵5.the provedeasily so other implication isBut notthreshold入门起点;门口〈喻〉开始;开端;;n.1.门槛阈;界限;起始点2.【物理学】临界值3.【地质学】海底山脊,海槛4.阈值的,临界值的1.adj.按物价指数变动工资的,工资极限的,级限的]2.[英国英语called are confidence threshold support threshold anda minimum Rulesthat satisfy both aminimum strong.occurrence出现,n.1.发生发生的事;2.事件itemsetan of occurrence The frequency algorithm运算法则n.1.算法;演算法;计算程序2.演示3.algorithm Apriori candidate候选人1.申请求职者,n.报考者2.攻读学位者3.最后命运或结局如何已显然可见者4.成为牧师候选人1.vi.a the votes ofdefeated candidate demanded recountTheabstraction抽取,n.1.抽象抽象化;抽象过程2.抽象概念;抽象名称3.抽象性,抽象的特征4.出神;心不在焉5.不切实际的想法,空想;幻想的事物6.,the,from dynamics knowsStaticsphysicist isonlyan abstraction16.learninowou17.induction以数据表示的统计学的统计的1.adj.,,就职仪式接纳会员,,入伍,n.1.就职吸入2.感应电或磁的)3.()(法4.归纳催产;催生5.data statisticalmultilayer多层n.1.拓扑学布局;1.拓扑,n.house apartment a triplex multilayer ofWe live in a initial最初的;开始的;第一的1.adj.原始的;初期的;2.【语音学】声母的,首音的3.首字母)复数](姓名或组织名称等的n.1.[首字母)2.(词的minimize]程度减至最低数量[vt.1.把…]重要性的价值[极力贬低(某事物)某事物2.对()作最低估计;And,without green laws,they try to their impact on their surroundings anyway minimizeiteration反复n.1.重述;重述的事2.循环]3.[计算机scalability可伸缩性,n.1.可量测性interpretability and robustness,scalability,speed,Chapter9Cluster Analysisoutlier外露层局外人,1.露宿者,n.离群值,异常值。

相关文档
最新文档