阿里数据整合及数据管理体系解读
“NASA”计划背后,阿里巴巴大数据系统架构概述

“NASA”计划背后,阿里巴巴大数据系统架构概述本文章来自于阿里云云栖社区摘要: DT时代,人们比以往任何时候都收集到更多的数据。
据IDC报告,预计到2020年,全球数据总量将超过40ZB(相当于40万亿GB),这一数据量是20 11年的22倍!正在“爆炸式”增长的数据,其潜在巨大价值有待发掘。
免费开通大数据服务:https:///product/odpsDT时代,人们比以往任何时候都收集到更多的数据。
据IDC报告,预计到2020年,全球数据总量将超过40ZB(相当于40万亿GB),这一数据量是2011年的22倍!正在“爆炸式”增长的数据,其潜在巨大价值有待发掘。
它作为一种新的能源,正在发生聚变,变革着我们的生产和生活,催生了当下大数据行业的热火朝天。
但是我们如果不能对这些数据进行有序、有结构的分类组织和存储,如果不能有效利用并发掘产生价值,那么它也是一个数据灾难,它犹如堆积如山的垃圾,给我们企业带来的是极大的成本。
现实情况是:阿里集团的数据存储已经逼近EB级别,部分单张表每天的数据记录数高达几千亿条;阿里内部,离线数据处理每天面对的是百万级规模的作业,每天有数千位活跃的工程师在进行数据处理工作,加上阿里大数据的井喷式爆发,给数模型、数据研发、数据质量和运维保障工作增加了更高的难度。
面对阿里内部成千上万对数据有着深刻需求的员工,以及外部千万级对数据有迫切渴望的商家和合作伙伴,如何有效满足他们的需求,提高他们对数据使用的满意度,是数据服务、数据产品面临的更大挑战。
注:阿里巴巴数据体系架构图上图是阿里巴巴数据体系架构图,可以清晰地看到我们的数据体系主要分为数据采集、数据计算、数据服务和数据应用四大层次。
1数据采集层阿里巴巴是一家多业态的互联网公司,几亿规模的用户(如商家、消费者、商业组织等)在平台上从事商业、消费、娱乐等活动,每时每刻都在产生海量的数据,数据采集作为阿里数据体系第一环尤为重要。
因此阿里巴巴建立了一套标准的数据采集体系方案,并致力全面、高性能、规范地完成海量数据的采集,并将其传输到大数据平台。
阿里云新型互联网架构介绍

DevOps 管理
容器服务
• Docker企业版(国内独家) • 支持Kubernates
云效:持续开发持续集成( DevOps ) 的管理软件
Aliware (分布式企业中间件): 大规模验证的 Java 中间件
新型应用 第三方应用 存量IT系统
CSB云服务总线
能力开放运营
用户中心 资源中心
API管理运营 共享服务层
客户和场景:互联网金融生产环境(含大数据) 关键产品:IAAS+大数据+
中间件(含docker)+高级版云盾
平台特性:等保三级,两地三中心 客户和场景:央企,互联网中台+大数据
V2.0 (2016.05)
关键产品:IAAS+大数据+中间件 平台特性:统一运维管理,管控节点压缩
满足生产级可靠性和 安全合规的要求
统一的管理运维系统, 和企业现有IT管理系统 无缝对接
向混合云 平滑演进
飞天平台整体架构
淘宝、天猫、支付宝、高德、菜鸟网络、阿里音乐等事业部 PaaS服务 微服务开发 框架服务 分布式数据 库服务 分布式消息 中间件服务 云服务总线 服务 数据交换服 务 DaaS服务 数据治理服 务 数据开放服 务 数据可视化 服务
解决数据 长效保存 及采集问题
解决数据 规范问题
解决数据 交换及安全问题
解决技术 转化输出问题
飞天平台:由实践锤炼而来
天猫 支付宝
17.5万笔/秒订单
12万笔/秒支付
2017天猫 11.11 购物狂欢节 1682亿元总成交额
阿里云专有云:让每个企业都拥有自己的飞天
专有云 公共云
北京,杭州,上海,青岛 深圳,香港,新加坡
阿里大数据平台

阿里大数据平台阿里大数据平台是阿里巴巴集团旗下的一项重要业务。
它是一个基于大数据技术的创新平台,旨在帮助企业根据大数据分析和洞察,提升业务运营效率和决策能力。
阿里大数据平台的核心优势在于深度挖掘和分析海量数据,为企业提供全面的数据支持和洞察解决方案。
通过阿里大数据平台,企业可以实现对销售数据、用户行为数据、供应链数据等多维度的深入分析和挖掘。
依靠强大的计算和分析能力,阿里大数据平台能够将大数据转化为有价值的商业洞察,并为企业提供精细化的业务决策支持。
阿里大数据平台提供的主要功能包括数据采集、数据处理、数据存储和数据分析。
通过数据采集,平台可以自动收集和整合来自多个数据源的数据,并实现对数据的实时更新和同步。
数据处理功能可以对数据进行清洗、转换和加工,保证数据的准确性和可用性。
数据存储功能提供了多种存储方式,包括关系型数据库、分布式文件系统等,以满足不同业务需求的数据存储需求。
数据分析功能则提供了多种分析算法和模型,帮助企业从数据中发现关键业务规律和趋势。
阿里大数据平台还提供了可视化的数据展示和报表功能,使企业能够直观地了解和分析数据。
通过数据报表,企业可以实时监控业务运营情况、产品销售情况等重要指标,及时调整业务策略和决策。
阿里大数据平台的优势不仅在于其强大的数据处理和分析能力,还在于其丰富的业务解决方案和行业经验。
阿里巴巴集团在多个行业都有丰富的数据积累,能够根据行业特点和需求,为企业提供个性化的数据分析和洞察解决方案。
此外,阿里大数据平台还积极与各大智能硬件厂商、传感器厂商等合作,实现对物联网数据的集成和分析,为企业提供更加完整的大数据解决方案。
总之,阿里大数据平台是阿里巴巴集团在大数据领域的重要业务,通过深度挖掘和分析海量数据,为企业提供全面的数据支持和洞察解决方案。
它不仅拥有强大的数据处理和分析能力,还提供丰富的业务解决方案和行业经验,为企业提供精细化的业务决策支持。
阿里“小前台+大中台”背后的逻辑是什么?有用吗?

阿里“小前台+大中台”背后的逻辑是什么?有用吗?时间 2015-12-11 11:23:10近日,阿里巴巴集团CEO发出了内部信,宣布组织结构全面升级,建设整合阿里产品技术和数据能力的强大中台,进而形成“大中台,小前台”的组织和业务体制。
同时,让集团更多优秀的年轻人承担起更大的责任。
据了解,“小前台+大中台”的运营模式,就是美军的“特种部队+航母舰群”的组织结构方式。
十几人甚至几人组成的特种部队在战场一线,可以根据实际情况迅速决策,并引导精准打击。
而精准打击的导弹往往是从航母舰群上发射而出。
看起来,阿里集团变革的决心可谓巨大。
不过,值得思考的是,目前阿里内部部门日渐臃肿,内容竞争激烈,且公司整体迭代缓慢、灵活性不够。
在这样的情况下,能否彻底将这种运营模式贯彻,以及,这种模式是否真的有用?对此,网友们也有一些精彩的讨论,一起来看看。
以下内容精选自知乎问题《如何看待阿里巴巴最新的「大中台,小前台」组织架构?》的回答。
@Journals Tang互联网公司在发展初期受益于灵活多变的组织形态,但随着业务和组织的膨胀,就会因为组织架构与管理机制的不协调而催生很多乱象——从这个意义上讲,看上去很高大上的互联网公司其实本质上和草莽期的一般民营企业并无二致。
对很多民营企业而言,经过十几年的高速发展,组织已经庞大而复杂,业务也不像当初那么单一而独立。
同时,整个行业的成熟也倒逼企业与企业之间的竞争提升到“向管理要效率”的高度,再像过去那样靠着奇谋伎俩、混沌不羁轻易取胜已经几乎不可能了。
言归正传,说到所谓的“前台-中台-后台”的概念,其实在金融、制造、零售等领域已经实行了多年,愈是大型的组织愈是依赖这种三层架构。
其中,“前台”最贴近用户服务,强调创新灵活多变;“中台”和“后台”更贴近组织管理,突出规划控制协调。
具体到阿里巴巴的例子,其“前台”就是贴近最终用户/商家的业务部门,包括零售电商、广告业务、云计算、物流以及其它创新业务等;而“中台”则是强调资源整合、能力沉淀的平台体系,为“前台”的业务开展提供底层的技术、数据等资源和能力的支持,用张勇的话来说就是“中台将集合整个集团的运营数据能力、产品技术能力,对各前台业务形成强力支撑”。
大数据系统架构概述

✓ 阿里云对象存储(OSS) - 阿里云对象存储 (Object Storage Service, OSS)是阿里云对外提供
的海量、安全、低成本、高可靠的云存储服务
✓ 表格存储 (Table Store) - 它是构建在阿里云飞天分布式系统之上的NoSQL数据存储服务,提
大数据系统架构概述
• 总体架构设计原则
总体架构概述
✓ 满足大数据的V3要求
▪ 大数据容量的加载、处理和分析 - 要求大数据应用平台经过扩展可 以支持 GB、TB、PB、EB甚至ZB规模的数据集
▪ 各种类型数据的加载、处理和分析 - 支持各种各样的数据类型,支持
处理交易数据、各种非结构化数据、机器数据以及其他新数据结构
供海量结构化数据的存储和实时访问
✓ 大数据计算服务(MaxCompute) - 大数据计算服务(MaxCompute,原名 ODPS)是一种快速、
完全托管的TB/PB级数据仓库解决方案
阿里云飞天的特色
• 阿里云飞天 OpenStack 和 Hadoop 的不同
✓ OpenStack和 Hadoop是软件,它们并没有解决客户的CAPEX 投入问题、运维人员投
阿里云飞天系统体系架构
• 飞天(Apsara)是由阿里云自主研发、服务全球的超大规模通用计算操作系统 • 它可以将遍布全球的百万级服务器连成一台超级计算机、以在线公共服务的方
式为社会提供计算能力
• 飞天已经为全球200多个国家和地区的创新创业企业、政府、机构等提供服务
阿里云飞天系统体系架构
• 阿里云飞天整体架构 - 飞天平台的体系架构如图所示,整个飞天平台包括
3)OTS和ODPS可以配合使用,前者支持大规模并发的日常访问(例如铁路 售票前台系统),然后每隔24小时就把交易数据推入ODPS支撑的数据仓库,利 用后者进行进一步的业务分析。
阿里中台实施方案

阿里中台实施方案在当前快速发展的互联网时代,企业面临着日益激烈的市场竞争和不断变化的商业环境。
作为一家领先的互联网科技公司,阿里巴巴深知中台战略的重要性,并通过不断优化和完善中台实施方案,不断提升自身的竞争力和创新能力。
首先,阿里中台实施方案的核心在于构建统一的数据中台。
通过整合各个业务线的数据资源,构建统一的数据标准和数据治理体系,实现数据的共享和互通。
这不仅可以降低数据孤岛的存在,提高数据利用率,还可以为企业决策提供更加准确和全面的数据支持。
其次,阿里中台实施方案还包括构建统一的技术中台。
通过统一的技术架构和平台,实现各个业务线之间的技术资源共享和协同开发。
这不仅可以降低技术重复建设的成本,提高技术开发效率,还可以推动企业技术创新和产品迭代的速度。
另外,阿里中台实施方案还注重构建统一的业务中台。
通过统一的业务流程和规则,实现各个业务线之间的业务协同和协作。
这不仅可以降低业务碎片化的存在,提高业务运营效率,还可以为企业提供更加一体化和个性化的服务。
最后,阿里中台实施方案还需要注重组织架构和文化的变革。
只有通过全员参与和共建共享的方式,才能真正落地中台战略,实现中台的价值最大化。
因此,企业需要不断优化组织结构,培养中台思维,推动中台文化的建设,打造具有强大凝聚力和执行力的中台团队。
综上所述,阿里中台实施方案是一个系统工程,需要全面考虑数据、技术、业务和组织文化等方面的因素。
只有通过不断优化和完善中台战略,才能推动企业实现数字化转型和商业模式创新,赢得在激烈市场竞争中的优势地位。
希望企业能够充分重视中台战略,积极落地中台实施方案,实现企业的可持续发展和长期竞争优势。
阿里tmf原理

阿里tmf原理摘要:1.阿里tmf 简介2.阿里tmf 原理3.阿里tmf 应用场景4.阿里tmf 优势与不足5.结论正文:阿里tmf,全称为“阿里旅行分销平台”,是阿里巴巴旗下的一款在线旅游产品。
它基于大数据和云计算技术,为消费者提供个性化、智能化的旅游服务。
本文将详细介绍阿里tmf 的原理、应用场景及其优势与不足。
1.阿里tmf 简介阿里tmf 是阿里巴巴集团旗下的在线旅游平台,成立于2010 年。
它以“让旅行更简单”为使命,为消费者提供全球范围内的一站式旅游服务,包括国内游、出境游、自由行、跟团游等。
同时,阿里tmf 还为旅游行业合作伙伴提供分销、营销和资源整合等服务,助力整个旅游行业的转型升级。
2.阿里tmf 原理阿里tmf 的运作原理可以概括为大数据驱动的智能化服务。
具体来说,阿里tmf 通过以下几个方面实现其原理:(1)数据挖掘与分析:阿里tmf 通过收集、整合来自各个渠道的旅游相关数据,包括用户行为数据、消费数据、行业数据等。
利用大数据技术对这些数据进行挖掘与分析,以发现潜在的旅游需求和市场趋势。
(2)个性化推荐:基于用户的历史行为数据、消费偏好等,阿里tmf 采用机器学习算法,为用户推荐合适的旅游产品。
这种个性化推荐能够提高用户的满意度和黏性。
(3)智能搜索:阿里tmf 利用自然语言处理技术,实现对用户搜索意图的智能理解。
用户输入关键词后,系统能够快速、准确地为其推荐相关旅游产品,提高搜索效率。
(4)资源整合:阿里tmf 通过与全球各地的旅游资源供应商、地接社、导游等建立合作关系,实现资源的整合与优化配置。
这有助于提高行业整体的运营效率和服务质量。
3.阿里tmf 应用场景阿里tmf 广泛应用于各种旅游场景,包括:(1)个人旅游:用户可以通过阿里tmf 预订机票、酒店、景点门票等,享受一站式旅游服务。
(2)团队旅游:企业、学校等团体可以通过阿里tmf 预订团队行程,方便组织与管理。
阿里云数据中台架构介绍

智能化消除重复实体 ID效率提升1倍以上
标签开发和管理效率 提升
OneService统一数据服务
OneService
智能化构建数据服务 效率提升1倍以上
API开发和管理理效率 提升
数据来源:阿里云数据中台;整理
36
Quick Audience:智能用户增长
◆ Quick Audience 以消费者运营为核心,通过丰富的用户洞察模型和便捷的策略配置,帮助企业实现商业智能,助力用户增长:集成 成熟的用户洞察模型(AIPL15)、便捷的规划策略配置、快速的人群圈选能力、多渠道营销投放、一键贯穿线上线下的一体化运营平台。
高端婴配奶粉 普通婴配奶粉
臻爱倍护(2012年)、臻爱飞帆(2012 年)、精粹益加(2012年)
星阶优护(2014年)、飞帆(2007年)、 贝迪奇(2011年)
营业补充品
Vitamin world
4,000 3,000 2,000 1,000
0
飞鹤分布广泛的渠道和触点
(单位:家/个)
终端销售点数目 58,000
经销商数目
零售商数目
67,000
90,000 109,000
1,737
1,159 578 2015年
1,684
1,139 545 2016年
1,639
1,167 472 2017年
1,703
1,131 572 2018年
1,824
1,166 658 2019年H1
飞鹤多样化营销模式
面对面研讨会
妈妈的爱、嘉年华、秀、 一年举办30万场线下活动
营销分析
从活动前 – 活动中 – 活动后,全链路以及营销单品/工 具角度进行监控和分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
前段时间给大家推荐了《大数据之路--阿里巴巴大数据实践》,这本书确实内容非常详实,全是干货,值得反复品味。
刚刚看完第9章,讲的是数据整合及管理体系,觉得非常好,设计得非常精妙,只看看觉得还不能深刻理解,遂做个读书笔记按照自己理解重构整理一遍,同时补充上自己的解读分享给大家,推荐给准备搭建数据产品或者数据平台的人。
传统企业的业务变化相对不快,但使用一般的表格文档来管理数据过程也已经越来越困难,更何况互联网这样迅速变化的业务,做好数据整理及管理的难度可想而知,但阿里的数据团队还是形成了完成的方法体系,并把其工具化。
也只有完备方法体系下构建的工具能满足复杂的数据管理需求。
阿里大数据建设方法论的核心就是,从业务架构设计到模型设计,从数据研发到数据服务,做到数据可管理、可追溯、可规避重复建设。
目标是建设统一的、规范的数据接入层(ODS)和数据中间层(DWD 和DWS),通过数据服务和数据产品,完成服务于阿里巴巴的大数据系统建设。
所以数据管理体系是包含具体的方法论以及相关的产品两个部分,通过产品把方法论固化为标准的流程和操作,达到数据管理的目的。
数据体系架构
数据管理体系包括了业务板块划分、数据域提炼、业务过程梳理、原子指标/度量定义、派生指标定义及管理,维度分析整理以及数据模型的设计。
通过下面的体系架构图来看看数据体系建设的过程、以及每一步做什么和如何做。
另外,如何定义每个术语的涵义,准确定义术语非常关键,有时候描述不清楚复杂的流程、场景最根本是因为对其中的一些概念没有非常很好的厘清。
业务板块:根据业务的属性划分出相对独立的业务板块,业务板块间指标和业务重叠性较低,比如电商板块涵盖淘宝、天猫、天猫国际、B2B系,金融板块涵盖支付宝、花呗、蚂蚁微贷等。
业务板块非常宏观,可以想象成贾不死的7大生态。
规范定义:结合行业的数据仓库建设经验和阿里数据自身的特点,设计出的一套过程方法和数据规范命名体系,规范定义将用于模型设计中。
规范定义指以维度建模作为理论基础,构建总线矩阵,划分和定义数据域、业务过程、原子指标/度量、修饰类型、修饰词、时间周期、派生指标规则,下图是它们之间的关系,以及具体实例。
规范定义实例
模型设计:以建模理论为基础,基于维度建模总线架构,构建一致性的维度和事实,同时设计出一套表命名规范系统。
维度建模理论很多书上都讲过,这里就不单独整理了。
术语定义及说明
我们重点说说数据域、业务过程、修饰词、原子指标、派生指标。
数据域:是面向业务分析的,将业务过程或者维度进行抽象组合的集合。
其中业务过程是一个个不可拆分的行为事件,在业务过程之下定义指标;维度是指度量的环境,如买家下单事件,买家是维度,订单数量是度量。
数据域是抽象提炼出来的,并且不轻易变动,既能涵盖当前所有业务的业务需要,又能在新业务进入时无影响的分配到已有的数据域中,如果所有分类都不合适才会扩展新的数据域。
数据域不同于产品的功能模块和业务线,是从分析的角度来组织数据指标、维度,功能模块是面向用户功能和管理功能的分类。
从下面的两个表格能很清楚的看出不同,功能模块和业务线是随时扩展的。
那么划分数据域有什么作用呢?主要是因为经过抽象后数据域相对功能模块和业务过程来说少很多,是有效归纳、组织业务过程的方式、同时方便定位指标/度量。
业务过程:指企业的业务活动事件,如下单、支付、退款都是业务过程,这里要注意,业务过程是一个不可拆分的行为事件。
修饰词:指除了统计维度以外的对指标进行限定抽象的业务场景词语,修饰词隶属于一个修饰类型,如在日志域的访问终端类型下,有修饰词PC端、无线端,有点像属性名和具体属性值的意思。
修饰类型是为了方便管理、使用修饰词。
原子指标:和度量含义相同,基于某一业务时间行为下的度量,不可拆分的指标,具有明确业务含义的名词,如支付金额。
原子指标有确定的字段名称(中英文)、数据类型、算法说明、所属的数据域和业务过程。
原子指标名称= 动作+ 度量,例如支付金额、注册用户数。
除了这些标准度量值的原子指标,还有些是为了派生指标而建的原子指标,后面讲派生规则时会说到,例如排名型的top_xxx_xxx 。
派生指标: = 一个原子指标+ 多个修饰词+ 时间周期。
可以理解为对原子指标业务统计范围的圈定,说总支付金额是个笼统的高度概括的汇总指标,其业务范围时间并不明确。
加上修饰词后的派生指标如:最近1 天北京买家支付金额(最近1天是时间周期、北京是修饰词、买家作为维度)。
派生指标的英文名= 原子指标英文名 + 时间周期修饰词+ 序号(_002);中文名由时间周期修饰词+ 【其它修饰词】+ 原子指标。
下图是常用的时间周期修饰词,整理的非常详细
最后说说派生指标的类型和不同类型指标的生成规则,这里的规则不容易理解,需要结合例子花些时间慢慢体会为什么有的是在原子指标的基础上派生,有的必须新建原子指标然后再派生。
其实规则很简单就是没有可用的原子指标或者不是简单增加限定条件的指标,需要先创建原子指标,例如排名型,TOP10并不能作为一个原子指标,其并无实际含义,但”Top_n 搜索关键词“有明确的业务涵义就可作为原子指标,然后再扩展”最近60天天猫Top_10搜索关键词“。
派生指标类型及规则
派生指标:分为事务型指标、存量型指标和复合型指标。
事务型指标是指对业务活动进行衡量的指标,一般会对应一个事件。
例如新发商品数、新增注册会员数、订单支付金额,订单支付金额对应订单支付事件,这类指标在原子指标上派生。
存量型指标是指对实体对象(商品、会员)某些状态的统计,例如商品总数、注册会员总数,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期一般为“历史截至当前某时间”。
复合型指标是组合事务型指标和存量型指标而成的,例如浏览UV-下单买家数转换率,有些创建新原子指标,有些在事务型或者存量型指标基础上增加派修饰词派生。
这里说的创建新原子指标,书上并没有讲地很清楚,理解起来也非常绕,我理解是无法从已有的原子指标派生时,比如计算方式不同,就需要新建原子指标,然后再派生,也不是直接做成原子指标,因为原子指标是无法使用限定词的。
复合型指标按照指标的计算方法又可以分为:比率型、比例型、变化量型、变化率型、统计型、排名型、对象集合型,有了详细的类型,再来考量如何派生就更容易了,而不是没有规律的没有方法的组合。
比率型:创建原子指标,然后在派生复合指标,先创建CRT,然后再有:最近一天店铺首页CTR,原子指标为CTR(点击率),时间周期为“最近1天”,修饰类型为“页面类型”,修饰词为“店铺首页”。
比例型:包含百分比、占比的都是比例型,比例型要先创建原子指标,再派生。
例如”最近1 天无线支付金额占比“,有原子指标”支付金额“,但没有原子指标”支付金额占比“,支付金额占比和支付金额的算法不同,没法从支付金额扩展,需要新创建。
假如说可以扩展,那么在”支付金额占比“上做二次扩展,就更复杂。
变化量型:不创建原子指标,增加修饰词,在此基础上创建派生指标,因为派生没有改变指标的计算规则,只是增加了限定条件。
例如:”最近1 天订单支付金额上一天变化量“,原子指标为”订单金额“,时间周期为”最近1 天“,修饰类型为”统计方法“,修饰词为”上1 天变化量“。
变化率型:创建原子指标,同比率型和比例型。
例如,”最近7天海外买家支付金额上7天变化率“。
统计型:不创建原子指标,一般可统计的指标都是数量型,所以和变化量型一样,加修饰词派生即可,例如:”最近6月月均订单支付金额“。
常用的”统计方法“类修饰词:人均、日均、商品平均、月均、90分位数、众数等。
排名型:创建原子指标,一般为top_xxx_xxx , 不同的排名业务涵义不同,需要创建不同的原子指标。
创建派生指标时可选择的修饰词有:统计方法(降序、升序),排名名次(如TOP10),排名范围(如行业、省份、一级来源等),根据什么排序(如搜索次数、PV)
对象集合型:主要是指数据产品和应用需要展现数据时,将一些对象以k-v对的方式存储在一个字段中,方便前端展现。
比如趋势图、TOP排名对象。
其定义方式是,创建原子指标,一般为xxx串。
创建派生指标
时可选择的修饰词有:统计方法(降序、升序),排名名次(如TOP10),排名范围(如行业、省份、一级来源等)。
对象集合型派生指标
为了指标体系不失控,新建原子指标和派生指标需要有专人进行审核,审核通过后才能上线使用,避免重复、定义不合标准、难于理解等问题。
良好的指标定义和体系也是后续指标计算、数据报表、数据分析产品化的基础。