大数据专业英语教程-词汇总表
PPT u8-大数据专业英语教程-张强华-清华大学出版社
v.(使)净化,清除
New Words
out-of-date unrecoverable inefficient update
misspell integration time-consuming involved incompatible reformat connection
[❖] [❖] [] [] [] [] [] [] [❖❖] [ ] [ ] []
[ ] [] [ ] [ ] [] [❖] [] [] []
vt.预加工,预处理 vt.转换,改变;使...变形
vi.改变,转化,变换 adj.可以理解的,可懂的 adj.不完全的,不完善的 adj.正确的,精确的 n.精确性,正确度 n.一致性 vt.检验,校验 n.打字稿 v.贴错标签 n.净化,清除
vt.分发,分配,分布,分类,分区 adv.不断地,频繁地 n.合作者 adj.字母的 adv.实验上,用实验方法 vt.单一化,简单化 n.工具,手段,器具 v.比较 n.观察,观测,观察资料(或报告) n.现象 adj.平滑的,平稳的,流畅的 vt.使光滑
vi.变平滑
New Words
interpolation astronomy satellite megapixel megabyte magnitude downlink encompass factor
PPT u5-大数据专业英语教程-张强华-清华大学出版社
We asked the professor to speak louder so that we could hear him. 我们请教授讲话声再大一些,以便让我们能听清。(目的状语从句) Mary didn’t plan her time well, so that she didn’t finish the work in time. 玛利没有把时间计划好,结果没有按时完成这项工作。(结果状语从句)
本句中,to organize data to suit a specific purpose so that it can be accessed and worked with in appropriate ways 是一个动词不定式短语,作目的状语,修饰 is designed。在该短语中, to suit a specific purpose 也是一个动词不定式短语,作目的状语,修饰 to organize,so that it can be accessed and worked with in appropriate ways 是一个目的状语从句。
consistent accessible manipulation advent emphasis imply suffix prescribe define length row
[] [] [] [ ❖] [] [] [] [] [] [] []
adj.一致的,调和的,相容的 adj.易接近的,可访问的,易受影响的 n.处理,操作 n.出现,到来 n.强调,重点 vt.暗示,意味 n.后缀;下标 v.指示,规定 vt.定义,详细说明 n.长度 n.行,排
大数据技术词汇表
大数据技术词汇表Anomaly:见异常值词条。
Apache Software Foundation(ASF):专门为支持开源软件项目而办的一个非盈利性组织。
ARPU(Average revenue per user):每个用户的平均收入。
Artificial neural network:人工神经网络,通常简称神经网络。
Avro:一个在Hadoop上的数据序列化系统,设计用于支持大批量数据交换应用。
宝贝:淘宝和天猫网上商城对于网店商品的专门用语。
贝叶斯分析方法(Bayesian Analysis):提供了一种计算假设概率的方法,这种方法是基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身而得出的。
bounce rate:见跳出率词条。
B2C:英文Business-to-Consumer的缩写,其中文含义为企业对消费者。
CART:Classification and Regression Trees的英文首字母缩写,或者称分类与回归树,是一种决策树分类算法。
CBL(China Black List):中国垃圾邮件黑名单。
Cluster(类或簇的英文):是一个数据对象的集合。
Cookie: 指的是指网站为了辨别用户身份而储存在用户本地终端浏览器上的一类数据。
CRM(用户关系管理,Customer Relationship Management)指的是公司对客户和潜在客户的管理模式。
Direct Marketing:见直效行销词条。
Discriminant analysis:见判别分析词条。
DSS(Decision Support System):决策支持系统的缩写,是辅助决策者通过数据、模型和知识,进行半结构化或非结构化决策的计算机应用系统。
独立访客:指在一天之内(00:00-24:00)访问网站的上网电脑数量(以cookie为依据)。
EB:计算机存储单位,1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes(字节),或是2的60次方字节。
大数据专业英语名词解释
大数据专业英语名词解释Big Data Terminology Explanation in English.In the rapidly evolving field of big data, it is essential to understand the key terminology that drives the industry forward. This article aims to provide a comprehensive overview of some of the most important big data terms, explaining their meanings and applications in the context of modern data analytics and management.1. Big Data:Big data refers to the vast amount of structured, semi-structured, and unstructured data that is generated, collected, and processed by organizations on a daily basis. It encompasses a wide range of data types, including transactional data, sensor data, social media content, and more. Big data analytics allows organizations to extract insights and make informed decisions based on this vast amount of information.2. Data Analytics:Data analytics is the process of examining raw data with the purpose of drawing conclusions about that information. It involves the application of statistical, quantitative, and qualitative techniques to identify patterns, trends, and relationships within the data. Data analytics is a crucial component of big data, as it enables organizations.。
常见的大数据术语表(中英文对照版)
常见的大数据术语表(中英文对照版)A聚合(Aggregation) - 搜索、合并、显示数据的过程算法(Algorithms) - 可以完成某种数据分析的数学公式分析法(Analytics) - 用于发现数据的内在涵义异常检测(Anomaly detection) - 在数据集中搜索与预期模式或行为不匹配的数据项。
除了"Anomalies",用来表示异常的词有以下几种:outliers, exceptions, surprises, contaminants.他们通常可提供关键的可执行信息匿名化(Anonymization) - 使数据匿名,即移除所有与个人隐私相关的数据应用(Application) - 实现某种特定功能的计算机软件人工智能(Artificial Intelligence) - 研发智能机器和智能软件,这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习B行为分析法(Behavioural Analytics) - 这种分析法是根据用户的行为如"怎么做","为什么这么做",以及"做了什么"来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式大数据科学家(Big Data Scientist) - 能够设计大数据算法使得大数据变得有用的人大数据创业公司(Big data startup) - 指研发最新大数据技术的新兴公司生物测定术(Biometrics) - 根据个人的特征进行身份识别B字节(BB: Brontobytes) - 约等于1000 YB(Yottabytes),相当于未来数字化宇宙的大小。
1 B字节包含了27个0!商业智能(Business Intelligence) - 是一系列理论、方法学和过程,使得数据更容易被理解C分类分析(Classification analysis) - 从数据中获得重要的相关性信息的系统化过程;这类数据也被称为元数据(meta data),是描述数据的数据云计算(Cloud computing) - 构建在网络上的分布式计算系统,数据是存储于机房外的(即云端)聚类分析(Clustering analysis) - 它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。
大数据专业英语教程 Unit 12 How to Manage Big Data’s Big
Notes
[3] The variety, velocity and volume of big data amplify the security management challenges that are addressed in traditional security management.
v.制作 adj.巨大的,庞大的 n.无效率,无能 adj.整理过的;统一的;加固的 adj.诱惑人的 n.攻击者
New Words
ቤተ መጻሕፍቲ ባይዱ
recognition devastating amplify deposit
dataset regulatory adequate workflow adversary configuration authenticate
Phrases
consumer need share with crown jewels trade secret upwards of financial institution government regulation come into play on a case-by-case basis data transfer distributed environment
New Words
node vulnerability straightforward
patch
automation framework uniform deactivate inactive probability offensive
prudent
[] [❖] [ ]
[ ]
[] [ ] [] [ ❖] [ ❖] [] [❖]
[t]
n.节点 n.弱点,攻击 adj.坦率的,简单的,易懂的,直截了 当的
大数据专业英语教程 Unit 1 Big Data
普遍的;一般的;整体的 依照 立刻, 马上 标准差,标准偏差 按比例增加,按比例提高 迷上,沉溺于 简而言之,一言以蔽之 过度分析 由...代替 与...一致 来自,源于 从...抽取 构成,组成 客户联络中心,客户服务中心
New Words
contender volatility variability cornerstone viability gigantic proportion
[] [❖] [❖] [] [❖] [ ] []
guzzle fascinate
[] [ ]
fad funnel
[ ] []
n.竞争者 n.波动率;波动性;波动 n.变异性;可变性 n.奠基石,基础,最重要部份 n.可行性,切实可行,能办到;生存能力 adj.巨人般的,巨大的 n.比例;均衡;部分 vt.使成比例;使均衡,分摊
Phrases
big data capitalize on holy grail
extracted ... from data warehouse business intelligence tool information explosion be superseded by … wake up invade into unstructured text underlying data pertain to in the attempt to
adv.极端地,非常地 adj.基础的,基本的 n.基本原则,基本原理 adj.能证实的 adj.诚实的,说实话的 vt.违犯,冒犯,干扰;违反 adj.悲惨的,灾难的 adj.看得见的,明显的,显著的 n.可见物 vt.超越,胜过 n.边界,分界线 adj.全能的,无所不能的 n.可视化
常见的大数据术语表(中英对照简版)
常见的大数据术语表(中英对照简版)大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。
因此,我们通过本文给出一个常用的大数据术语表,抛砖引玉,供大家深入了解。
其中部分定义参考了相应的博客文章。
当然,这份术语表并没有100%包含所有的术语,如果你认为有任何遗漏之处,请告之我们。
A聚合(Aggregation) –搜索、合并、显示数据的过程算法(Algorithms) –可以完成某种数据分析的数学公式分析法(Analytics) –用于发现数据的内在涵义异常检测(Anomaly detection) –在数据集中搜索与预期模式或行为不匹配的数据项。
除了“Anomalies”,用来表示异常的词有以下几种:outliers, exceptions, surprises, contaminants.他们通常可提供关键的可执行信息匿名化(Anonymization) –使数据匿名,即移除所有与个人隐私相关的数据应用(Application) –实现某种特定功能的计算机软件人工智能(Artificial Intelligence) –研发智能机器和智能软件,这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习B行为分析法(Behavioural Analytics) –这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式大数据科学家(Big Data Scientist) –能够设计大数据算法使得大数据变得有用的人大数据创业公司(Big data startup) –指研发最新大数据技术的新兴公司生物测定术(Biometrics) –根据个人的特征进行身份识别B字节 (BB: Brontobytes) –约等于1000 YB(Yottabytes),相当于未来数字化宇宙的大小。
1 B字节包含了27个0!商业智能(Business Intelligence) –是一系列理论、方法学和过程,使得数据更容易被理解C分类分析(Classification analysis) –从数据中获得重要的相关性信息的系统化过程; 这类数据也被称为元数据(meta data),是描述数据的数据云计算(Cloud computing) –构建在网络上的分布式计算系统,数据是存储于机房外的(即云端)聚类分析(Clustering analysis) –它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。
常用大数据词汇中英文对照表
常用大数据词汇中英文对照表A聚合(Aggregation)–搜索、合并、显示数据的过程算法(Algorithms)–可以完成某种数据分析的数学公式分析法(Analytics)–用于发现数据的内在涵义异常检测(Anomaly detection)–在数据集中搜索与预期模式或行为不匹配的数据项。
除了“Anomalies”,用来表示异常的词有以下几种:outliers, exceptions, surprises, contaminants.他们通常可提供关键的可执行信息匿名化(Anonymization)–使数据匿名,即移除所有与个人隐私相关的数据应用(Application)–实现某种特定功能的计算机软件人工智能(Artificial Intelligence)–研发智能机器和智能软件,这些智能设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习B行为分析法(Behavioural Analytics)–这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式大数据科学家(Big Data Scientist)–能够设计大数据算法使得大数据变得有用的人大数据创业公司(Big data startup)–指研发最新大数据技术的新兴公司生物测定术(Biometrics)–根据个人的特征进行身份识别B字节(BB: Brontobytes)–约等于1000 YB(Yottabytes),相当于未来数字化宇宙的大小。
1 B字节包含了27个0!商业智能(Business Intelligence)–是一系列理论、方法学和过程,使得数据更容易被理解C分类分析(Classification analysis)–从数据中获得重要的相关性信息的系统化过程;这类数据也被称为元数据(meta data),是描述数据的数据云计算(Cloud computing)–构建在网络上的分布式计算系统,数据是存储于机房外的(即云端) 聚类分析(Clustering analysis)–它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。
大数据方向统计学英文词汇
大数据方向统计学英文词汇English:In the field of big data, statistical knowledge is crucial for analyzing and interpreting large amounts of data. Some key terms in statistics that are important in the big data field include descriptive statistics, inferential statistics, probability distributions, hypothesis testing, regression analysis, and model building. Descriptive statistics are used to summarize and describe the main features of a dataset, while inferential statistics are used to make inferences or predictions about a population based on a sample. Probability distributions are used to model the likelihood of different outcomes, while hypothesis testing is used to make decisions about a population parameter based on sample data. Regression analysis is used to identify and analyze the relationship between variables, and model building involves creating mathematical or computational models to represent and understand data patterns. Understanding these statistical concepts and techniques is essential for professionals in the big data field in order to effectively analyze and make sense of large and complex datasets.中文翻译:在大数据领域中,统计知识对于分析和解释大量数据至关重要。
大数据专业词汇英语
大数据专业词汇英语Key Terminology in Big Data Analytics.In the realm of big data analytics, a comprehensive understanding of key terminology is paramount toeffectively navigate and harness the vast sea of data.Here's a glossary of essential terms that will empower youto engage confidently in big data discussions and endeavors:Data Analytics: The systematic examination and interpretation of data to extract meaningful insights and patterns.Hadoop: An open-source software framework thatfacilitates distributed data processing, enabling the efficient handling of vast datasets across clusters of computers.Cloud Computing: A model for delivering computing services, including servers, storage, databases, networking,software, analytics, and intelligence, over the internet ("the cloud") to offer flexible and scalable access to computing resources.Data Lake: A centralized repository for storing vast volumes of raw, unstructured data in its native format, enabling flexible exploration and analysis.Data Warehouse: A structured repository of data, typically consisting of historical data, organized and optimized for querying and reporting purposes.Data Mining: The process of extracting hidden patterns and insights from large datasets through automated or semi-automated techniques.Machine Learning: A subset of artificial intelligence that enables computers to learn from data without explicit programming by identifying patterns and making predictions.Artificial Intelligence (AI): The simulation of human intelligence processes by machines, encompassing learning,reasoning, and problem-solving capabilities.NoSQL: A non-relational database management system designed to handle large volumes of unstructured or semi-structured data, offering flexibility and scalability.Hadoop Distributed File System (HDFS): A distributed file system that enables the storage of large data files across multiple commodity servers, providing fault tolerance and high availability.MapReduce: A programming model for processing and generating large datasets that is used in conjunction with Hadoop, where data is processed in parallel and aggregated to produce the final result.Business Intelligence (BI): A set of techniques and technologies used to transform raw data into meaningful and actionable information for business decision-making.Apache Spark: A fast and versatile open-source distributed computing engine that supports a wide range ofbig data processing tasks, including real-time stream processing.Extract, Transform, Load (ETL): The process of extracting data from disparate sources, transforming itinto a consistent format, and loading it into a target system for analysis.Data Governance: The policies, processes, and practices that ensure the reliability, integrity, and security of data throughout its lifecycle.Data Visualization: The graphical representation of data to facilitate the identification of patterns, trends, and insights.Data Scientist: A professional who possesses expertise in data analysis, machine learning, and statistical modeling, responsible for extracting insights and building predictive models from large datasets.Big Data: A term used to describe extremely large andcomplex datasets that traditional data processing softwareis inadequate to handle.Data Quality: The degree to which data conforms to predefined standards of completeness, accuracy, consistency, timeliness, and validity.Data Security: The measures and practices implementedto protect data from unauthorized access, use, disclosure, disruption, modification, or destruction.Open Data: Data that is made freely available to the public without any copyright, patent, or other restrictions, promoting transparency and innovation.Data Privacy: The regulations and ethicalconsiderations governing the collection, storage, use, and disclosure of personal data to protect individuals' privacy rights.Data Curation: The selection, acquisition, preservation, and documentation of data to ensure its availability,usability, and authenticity over time.Data Lakehouse: A unified data management platform that combines the scalability and flexibility of a data lakewith the structure and governance of a data warehouse, enabling both operational and analytical workloads.Modern Data Stack: A collection of cloud-based toolsand technologies that facilitate the collection, storage, transformation, and analysis of big data in a scalable and cost-effective manner.Data Fabric: An architectural approach that enables the integration and interoperability of data across diverse systems and environments to provide a unified andconsistent data experience.By understanding these key terms, you'll be well-equipped to navigate the ever-evolving world of big data analytics and leverage its transformative potential todrive informed decisions and achieve organizational success.。
PPT u3-大数据专业英语教程-张强华-清华大学出版社
Unit 3
Operating System
Contents
New Words Phrases
Abbreviations Notes
参考译文
New Words
core install translate response smoothly transparent mention mistake
[] [] [ ] [] [] [ ] [] []
release control instability unstable freezing
[] [] [] [] []
n.核心 vt.安装,安置 vt.翻译,解释,转化 n.回答,响应,反应 adv.平稳地 adj.透明的,显然的,明晰的 n.& v.论及,提及 n.错误,过失 v.弄错,误解 vt.& n.发布 n.& vt.控制,支配 n.不稳固,不稳定 adj.不牢固的,不稳定的 adj.冻结的
本句中,The operating system 作主语,makes 作谓语,these interfacing functions along with its other functions 作宾语,operate smoothly 是一个不带 to 的动词不定式短语,作宾语补足 语。
英语中,当 make、let、have、see、hear、watch、notice、feel 等动词后面用不定式作 宾语补足语时,不定式都不带 to。这一点特别重要。请看下例:
interrupt
[]
preemptive multitasking slice
[❖] [] []
multithreadi ng thread embedded autonomy compact definitely batch interactive absence
大数据英语词汇
兴趣图谱interest graph大众分类法folksonomy分类法taxonomy流streamOGP开放图协议open graph protocol团分析clique analysis图谱 API 管理工具Graph API Explorer字段扩展和嵌套field expansion and nesting代码库repository布局算法layout algorithm档案字段profile field字段选择器field selector国防情报defense intelligence欺诈检测fraud detection统计地图cartogram地理聚合泡泡图Dorling Cartogram自然语言工具natural language toolkit NLKT编辑距离edit distance levenshtein聚合agglomerate聚类算法clusteringalgorithm层次聚类hierarchical clustering信息检索information retrieval IR非结构化数据分析Unstructured Data Analysis UDA 环聊hangouts动态activities生活片段moments句子切分sentence segmentation分词 tokenization单词组合word chunking实体检测entity detection搭配检测collocation detection停用词stop word解释器会话interpreter session向量空间模型vector space model原始频率raw frequency雅卡尔系数 Jaccard Index似然率likelihood ratio二项分布binomial distribution逐点互信息pointwise mutual information, PMI卡方检验Chi-square样板boilerplateGoogle知识图谱google ’sknowledge graph句子解析器sentence tokenizer交叉验证cross-validation标签云tag cloud文摘摘要自动生成 the automatic creation of literature abstracts “词袋”模型“Bag of Words ”model贝叶斯分类器Bayesian classifier广度优先搜索breadth-first search置信区间 confidence interval监督式机器学习supervised machine learning线程词 thread pool图灵测试turning test拉取请求pull request点度中心度degree centrality中介中心度 betweenness centrality接近中心度closeness centrality分页的开发者文档developer documentation for pagination 被加星的库列表list repositories being starred延迟迭代lazy iterator超图 hypergraph超边 hyperedges中心度量centrality measure社交图谱social graph轴辐式图hub and spoke graph最小生成树minimum spanning tree。
PPT u9-大数据专业英语教程-张强华-清华大学出版社
Unit 9
Data Mining
Contents
New Words Phrases
Abbreviations Notes
参考译文
New Words
behavior discover dig proactive time-consumin g scour expectation similarity vein probe transportation aerospace sift
New Words
pinpoint
[]
nonintuitive possibility earn halve indebtedness mail-order uncover drug treatment prescription profitable niche
[❖] [] [] [❖] [] [-] [❖] [] [] [] [] []
Notes
[2] An example of pattern discovery is the analysis of retail sales data to identify seemingly unrelated products that are often purchased together.
n.关系,关联 n.不规则,异常的人或物 adj.不引人注意的,被忽视的 vt.认出,发现 n.分割 v.流失 adj.欺诈的,欺骗性的 n.破产
v.扫过,掠过 adv.表面上地 adj.不规则的,反常的 n.食品杂货店,食品店,杂货铺 v.嘎扎嘎扎的咬嚼,压碎,扎扎地踏 过
New Words
ห้องสมุดไป่ตู้
feat discern occupation budget
《大数据专业英语》课件—01What Is Big Data
New Words
storage compute
[ˈstɔrɪdʒ] [kəmˈpju:t]
precise insightful predict predictive indication maximize
[prɪˈsaɪs] [ˈɪnˌsaɪtfʊl] [prɪˈdɪkt] [prɪˈdɪktɪv] [ˌɪndɪˈkeɪʃn] [ˈmæksɪˌmaɪz]
format engine on-demand gradually popularity clarity explore discover
[ˈfɔrmæt] [ˈɛndʒɪn] [ɒn-dɪˈmɑ:nd] [ˈɡrædʒʊəlɪ] [ˌpɒpjuˈlærɪtɪ] [ˈklærɪtɪ] [ɪkˈsplɔ:] [dɪsˈkʌvə]
memory disk type
[memərɪ] [dɪsk] [taɪp]
traditional
[trəˈdɪʃənl]
adj.低密度的 adj.无结构的,未组织的 adj.可移动的 abbr.应用程序(Application) n.设备,装备 n.太字节(信息量度单位,240 字节) n.拍字节(信息量度单位,250 字节) n.速度;比率;等级 vt.估价;值得;定级 n.存储器,内存 n.磁盘 n.类型 vt.按类型把…归类 adj.传统的;惯例的
interdependenc y institution decision financial
[ɪntədɪ'pendənsɪ]
[ˌɪnstɪˈtju:ʃn] [dɪˈsɪʒən] [faɪˈnænʃəl]
adj.监管的,调整的 v.训练,教育,培养 n.影响 vt.对…产生影响 vi.产生影响 vt.评估 n.反馈,反应 n.改革,创新;新观念,新发明,新设施 vi.改革,创新 vt.引入(新事物、思想或方法 n.相互依赖,相互依存;相互依赖性;依 赖关系 n.机构 n.决定 adj.财政的,财务的,金融的
《大数据专业英语》课件—06Database Basic Concept
specific employee developer search
[spəˈsɪfɪk] [ɪmˈplɔɪi:] [dɪˈveləpə] [sɜ:tʃ]
pointer define prevent duplicate
[ˈpɔɪntə] [dɪˈfaɪn] [prɪˈvent] [ˈdju:plɪkɪt]
New Words
increasingly dialect
[ɪnˈkri:sɪŋlɪ] [ˈdaɪəlekt]
approve approved version official distribute reside worksite distributive replication complicated
金融服务经理 多达 实例变量 静态字段 数据结构 排序 类似于 关系图 扩散 在...的控制之下,受...控制 附加到 耗费时间的 取决于 另一方面
Abbreviations
SEQUEL (Structured English QUEry Language) SAG SQL (SQL Access Group)
[əˈpru:v] [ə'pru:vd] [ˈvɜ:ʃn] [əˈfɪʃl] [dɪˈstrɪbju:t] [rɪˈzaɪd] ['wɜ:ksaɪt] [dɪˈstrɪbjʊtɪv] [ˌreplɪ'keɪʃn] [ˈkɒmplɪkeɪtɪd]
adv.日益,愈加 n.方言,土语;语调;[语]语支;专业用 语 vt.同意,认可 adj.经核准的,被认可的 n.版本 adj.官方的,法定的 vt.分布,分发 vi.住,居住,驻留,驻在 n.工作场所 adj.分布的 n.复制 adj.复杂的,难解的
Phrases
大数据行业 英语
大数据行业(Big Data Industry)在英语中通常使用一系列专业术语和行业名词。
以下是一些与大数据相关的英语词汇和短语:1. Big Data(大数据):指的是超过传统数据处理软件能够处理的数据规模和复杂性的数据集。
2. Data Analytics(数据分析):使用各种技术和方法,包括统计分析、机器学习等,对大数据进行分析,以提取有价值的信息。
3. Data Mining(数据挖掘):利用统计学、机器学习和数据库技术,从大量数据中发现未知的、先前未察觉到的模式。
4. Data Warehouse(数据仓库):存储和管理大量结构化和非结构化数据的集中式存储系统,支持数据分析和报告。
5. Data Integration(数据集成):将来自不同来源的数据整合到一个单一的视图或数据存储中,以支持分析和决策。
6. Hadoop:开源框架,用于分布式存储和处理大规模数据集,特别适用于大数据应用。
7. Machine Learning(机器学习):一种人工智能技术,使计算机能够通过经验学习并改进性能。
8. Predictive Analytics(预测分析):使用统计算法和机器学习技术来识别未来可能发生的事件。
9. Cloud Computing(云计算):通过互联网提供计算服务,包括存储、计算、数据库等,以支持大数据处理。
10. IoT(Internet of Things,物联网):指连接到互联网的设备和传感器,产生大量实时数据。
11. Data Scientist(数据科学家):专业人员,负责从大数据中提取洞察和知识,通常具备统计学、编程和领域专业知识。
12. Data Governance(数据治理):确保数据的质量、安全性和合规性的管理实践。
13. Data Quality(数据质量):衡量数据的准确性、完整性、一致性和可靠性。
14. Real-time Analytics(实时分析):即时处理和分析数据,以在数据生成的同时获取有用的信息。
大数据专业英语教程-词汇总表
8b
n.账,账目;存款
6a
n.积累;累积量;堆积物
12a
n.精确(性),准确(性)
2b
n.精确(性),准确(性)
4a
adj.精确的,准确的;正确无误的
8b
adv.正确无误地,准确地;精确地
5a
vt.取得,实现,成功vi.达到预期的目的,实现预期的结果
1b
vt.承认
12a
n.行动,活动;功能,作用;手段
2b
n.复杂性
3a
n.合规
1a
adj.遵从的;依从的;(与系列规则相)符合的;一致的
3b
adj.复杂的,难解的
6a
n.纠纷;混乱
7b
n.部件,组件;要素,成分adj.组成的;构成的;成分的
5b
n.分量方式,分量形式
5b
vt.理解,领会
11a
n.推导式
5a
adj.广泛的;综合的
10b
n.压缩
3b
第 4 页,共 38 页
5a
n.基数
2a
n.统计地图
11a
vt.为…编目录;登记分类
7a
adj.分类的,按类别的
8a
n.种类,类别
1b
vt.满足需要,适合
12a
vt. 集聚,集中
6b
adj.集中的,中央的,中心的
11b
n.质心,矩心
9b
n.挑战;质疑vt.质疑;向…挑战vi.提出挑战
3a
第 3 页,共 38 页
channel characteristic cheap cholesterol chunk clarity clarity
atomicity attached attempt attractive attributable attribute
PPT u6-大数据专业英语教程-张强华-清华大学出版社
结构化查询语言 国际商用机器公司 美国国家标准协会 国际标准化组织 数据库管理系统 关系型数据库管理系统 面向对象的数据库管理系 统 信息管理系统 客户信息管理系统 分布式数据库管理系统
Notes
[1] A relational database is a collection of data items organized as a set of formally-described tables from which data can be accessed or reassembled in many different ways without having to reorganize the database tables.
[] [ ] [] [] [] [] []
vt.删除 adv.自动地 v.反射,反映,表现 n.域 n.主题,题目 n.连续,系列 adj.完备的,完全的,完成的
Phrases
tabular database distributed database customer profile find out
[] [] [ ] [] [] [ ]
distributed disperse congruent aggregation catalog
[] [] [] [ ] [ ]
n.数据库 v.组织 vt.分类,分等 adj.目录的 n.方法,步骤,途径,通路
adj.制成表的,扁平的,表格式的,平坦 的 vi.列表,排成表格式 adj.分布式的 v.(使)分散,(使)散开 adj.(与 with 连用) 一致的,适合的 n.集合,集合体,聚合
Lecturer: Zhang
Unit 6
Basic Concepts of Database
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《大数据英语教程》词汇总表(张强华编著)
n.匿名;作者不详;匿名者;无名者
12a
adj.匿名的
5b
vt.预感,预见,预料
12b
abbr.应用程序(Application)
1a
vi.有吸引力
1b
adj.适当的;可应用的
8a
n.应用,适用
2b
n. 方法,步骤,途径
6a
adj.适当的;恰当的;合适的
11a
单词
adopter absolutely abstract abstraction accelerate acceleration access accessibility accessible accomplished account accumulation accuracy accuracy accurate accurately achieve acknowledge action actionable activity ad hoc adaptability adapter address adequate adjust adjustment admissible adoption advancement affect affluent aforementioned agency aggregate aggregation agility alarmingly algorithm allocation alteration alternate alternative ambiguity analog analogous analyze analyzing ancestor
3b
adj.可归因于…的;由…引起的
2a
n.属性,性质,特征vt.把…归于
7a
adj. 音频的,声频的
6b
vt.增强,加强;增加;(使)扩张,扩大n.增加,补充物
12b
adj.可信的,可靠的;认证了的
12a
n.身份验证;认证;证明,鉴定
12a
adv.自动地
8b
n.自动化(技术),自动操作
5a
adv.自主地,独立地
9a
adj.可行动性;可执行的
9a
n.活动
12a
adj.特别的;临时的;特设的adv.特别地
8b
n.适应性;合用性
2b
n.适配器;改编者
10b
v.处理n.地址
1a
adj.足够的;适当的
3b
v.(改变…以)适应;调整,校正
12b
n.调整
12b
adj.可容许的
8a
n.采用
1b
n.前进,进步;提升,升级
1b
vt. 影响
6b
adj.富裕的,富足的n.富裕的人
11b
adj.上述的,前述的
12a
n.代理;机构
7b
vt.使聚集,使积聚
12a
n.聚集;集成;集结
7a
n.敏捷,灵活
4a
adv.让人担忧地
12a
n.算法
1b
n.配给,分配
11b
n.变化,改变;变更
11b
adj.交替的,代替的vi.交替;轮流vt.使交替;使轮流;n.候补 4a
8b
n.账,账目;存款
6a
n.积累;累积量;堆积物
12a
n.精确(性),准确(性)
2b
n.精确(性),准确(性)
4a
adj.精确的,准确的;正确无误的
8b
adv.正确无误地,准确地;精确地
5a
vt.取得,实现,成功vi.达到预期的目的,实现预期的结果
1b
vt.承认
12a
n.行动,活动;功能,作用;手段
adv.适当地
3b
vt.同意,认可
6a
adj. 经核准的,被认可的
6a
adj.随意的,随心所欲的
10b
adj.任意的,随意的
5a
n.建筑师,设计师
10b
adj.建筑的;结构的
7a
பைடு நூலகம்
v.存档n.档案文件
3b
n.档案保管员
8b
vt.坚决主张;提出理由证明;说服,劝告;表明,证明vi.争 3a
论 n.参;数提出理由
atomicity attached attempt attractive attributable attribute
audio augment authentic authentication automatically automation autonomously auto-tiering auxiliary availability available awaken awareness
5b
n.算法
5a
vt.排列;把…(系统地)分类;整理
3a
n.数组
2a
n.箭头记号
2a
v.集合,收集
9a
n.断言;声明
2a
vt.评估
1a
vt.分配,分派,选派
5b
n.赋值
5b
n.帮助,援助
8a
n.假定,假设
9b
adj.原子的;极微的
7a
n.原子性
6b
adj.附加的,附属的
5a
vt.试图;尝试
5b
adj.有魅力的;引人注目的;迷人的;招人喜爱的
2b
v.自动分级
12a
adj.辅助的;附加的;副的n.辅助设备
8b
n.有效;有益;可利用性
2b
adj.可利用的;可获得的;能找到的
7b
vt.& vi.唤醒,觉醒;(使)意识到
1b
n.察觉,觉悟,意识
12b
第 2 页,共 38 页
back-end backslash backup balance bandwidth bankrupt battle behavior behavioral benefit bibliographic bidirectional binary bind binding biometric blend block blog blueprint boolean boot bottom-up
者 adj;.替替代换的物;备选的
2b
n.含糊,意义不明确
8b
n.模拟adj.模拟的
8a
adj.相似的,可比拟的
5a
vt.分析,分解, 解释
4a
v.& n.分析
1a
n.祖先;原型
5b
第 1 页,共 38 页
anonymity anonymous anticipate app appeal applicable application
《大数据英语教程》词汇总表(张强华编著)
词性与意义
单元
n.(新技术) 采用者
10a
adv.绝对地;完全地;毫无疑问地
3a
adj. 抽象的vt. 提炼,抽象化
6b
n.抽象,抽象概念,抽象化
2a
v.增速,加速
3b
n.加速
3b
vt.存取,访问
6a
n.可访问性,可存取性
4b
adj.可访问的
7b
adj.技艺高超的;熟练的