淘宝开放平台架构组件体系初探
淘宝技术架构简介
• 价值
– 用同步的语义来实现异步的调用
ngx_lua原理
• 每个Nginx工作进程使用一个Lua VM,工 作进程内所有协程共享VM • 每个外部请求都由一个Lua协程处理,协程 之间数据隔离 • Lua代码调用I/O操作接口时,若该操作无 法立刻完成,则打断相关协程的运行并保 护上下文数据 • I/O操作完成时还原相关协程上下文数据并 继续运行
系统过载保护
• 判断依据
– 系统的loadavg – 内存使用(swap的比率)
• sysgurad模块
sysguard on; sysguard_load load=4 action=/high_load.html; sysguard_mem swapratio=10% action=/mem_high.html
– 防hashdos攻击 – 防SQL注入 – 防XSS
• 标准Nginx无输入体过滤器机制的问题 • 例子(防hashdos攻击)
– 如果所有POST内容都在内存中,占用内存过大 – 否则性能不高,内容可能被buffer到磁盘 – /2012/01/amechanism-to-help-write-web-applicationfirewalls-for-nginx/
ngx_lua原理
代码示例
location /http_client { proxy_pass $arg_url; } location /web_iconv { content_by_lua ' local from, to, url = ngx.var.arg_f, ngx.var.arg_t, ngx.var.arg_u local iconv = require "iconv" local cd = iconv.new(to or "utf8", from or "gbk") local res = ngx.location.capture("/http_client?url=" .. url) if res.status == 200 then local ostr, err = cd:iconv(res.body) ngx.print(ostr) else ngx.say("error occured: rc=" .. res.status) end '; }
淘宝商品体系架构的历史和演进
SDCC中国软件开发者大会电商架构专题淘宝商品体系架构的历史和演进汇报人:范围淘宝资深开发工程师目录C O N T EN T1淘宝体系架构的演进2淘宝商品架构3元数据在淘宝商品体系架构中的应用01淘宝体系架构的演进PART ONEWHY为什么要升级架构l●架构升级的目的•节约成本•提高收益l●淘宝商品体系架构随着业务的发展不断变迁•降低开发成本•提升开发效率•支持更灵活、复杂的业务电商系统发展的四个阶段WHAT石器时代单一业务系统中世纪分布式业务系统工业革命业务平台化未来业务中台化02淘宝商品架构PART TWO商品的特点1l●商品形态•实物、服务、虚拟、零售、分销、批发、供应链l●灵活的结构•基于不同的场景、视角和形态,商品千差万别l●稳定性和确定性•10亿+在线商品•亿级+条码•百万级+品牌卖家买家服务实物交易金额交易额价格交易量线上资质线下信用标签性别年龄地址商品淘宝商品结构2SPU标准产品单元Product商品SKU库存量单元营销价格库存时间地点物流市场规则规范效率个性描述描述信息特征标题多媒体图片地址库品牌库类目属性库行业属性产品要素卖家要素销售要素商品发布产品中心市场3商品生命周期前后台商品体系4商品数据流转5后台商品库后台类目标准属性……商品算法平台前台类目体系前台商品库前台类目集导购PV集……导购算法平台运营干预搜索导航用户行为配置类目属性商品发布平台治理后台类目体系运营平台数据推送服务版本化数据包前台类目属性服务数据治理服务03元数据在淘宝商品体系架构中的应用PART THREE1元数据驱动元数据•描述数据的数据元数据驱动架构•利用元数据来控制和实现应用的逻辑元数据一直都存在,并常被我们所使用•Java POJO•数据库Schema•配置信息理念-应用基础架构2•绝大多数应用采用经典Web结构•部分配置从代码中抽离出来单独管理•抽象比较好的业务提供运营平台,让运营、产品人员直接配置规则•新业务需求需要编码实现,周期以周记•通过接口接收请求、返回结果•调用初始化配置和逻辑•调用依赖应用获取数据•调用多种存储获取数据•应用根据请求执行计算逻辑,获得结果应用逻辑配置中心依赖应用依赖应用依赖应用MySql搜索KV 缓存理念-元数据驱动架构3——元数据驱动架构核心思想就是提高元数据使用比例应用逻辑配置中心依赖应用依赖应用依赖应用数据库搜索KV 缓存模型规则流程界面l 元数据包含:•模型:接口(API)、数据(DO对象)、存储(DB)•逻辑(基本能力):组件化代码片段、脚本片段、规则、规则集•流程:组件选取、执行编排•界面:UI组件管理、可视化编辑•配置:开关、业务配置4元数据驱动的思路l●未来全局架构•不同角色的运营平台•控制逻辑配置和规则抽离•业务执行系统•三类数据:控制数据,基础数据,过程数据l●好处•通过动态配置改变应用执行逻辑,提高效率•业务和技术分离,PD、运营等非技术人员可以直接参与开发•逻辑和能力可视化好元数据驱动架构平台512 3 41 2 3 4/元数据引擎6l●元数据等同于代码,元数据修改等同于开发l●特性:–需要多版本、快照–需要继承、引用–事务、数据一致性–环境隔离(沙箱)–发布、回滚Trunk项目环境预发环境生产环境项目2日常1deploydeploydeploy日常2日常3S优点T挑战通过增加动态配置的比例,提高开发效率业务和技术分离,非技术人员可以参与开发逻辑和能力可视化好学习曲线、理念上的转变对于稳定性和性能方面有较高要求需要丰富的配套工具支撑此处添加副标题汇报人:某某此处添加主标题谢谢聆听。
淘宝开放平台架构组件体系初探
/cn/news/2009/09/top-arch-components淘宝开放平台架构组件体系初探淘宝开放平台(TaoBao Open Platform,简称TOP)的整个架构体系是组件化体系架构,可以是很少的几个基础组件构成的Skeleton,也可以是融入了商业想象的Amazing Architecture。
这里就通过对于这些组件的罗列,描述出在TOP 这个大体系中,各个组件所处的地位及作用。
TOP的“兵器谱”是在现阶段商业需求及平台非业务性需求指导下形成的,未来TOP将继续发展,“兵器谱”也会不断演进。
下图是整个TOP当前的一个组件结构图:图中,红色虚线就是TOP的Skeleton。
TOP当前从业务模块功能角度来划分,可以分成三个层次:基础平台组件层,基础业务组件层,普通业务组件层。
基础平台组件层,倾向于平台级别功能满足及对平台稳定性,可用性的支持。
基础业务组件层,是介于平台服务于普通业务服务之间的组件,部分利用了平台基础组件层的组件,来抽象出一层公用业务服务组件,为业务组件提供通用的基础支持。
安全组件安全组件主要从四个角色去考虑整体的安全策略及具体的实施方案,这四个角色是:用户,应用,平台,服务。
平台本身的安全主要是基于在大并发和大流量的情况下,保证平台自身稳定性和可用性,同时也要兼顾在平台开放的服务不相互干扰和影响。
因此采取服务分流隔离机制,通过虚拟配置及软负载方式将服务请求动态分流和隔离,保证了服务之间相互的独立性,同时也充分利用TOP的能力。
频率控制及流量控制除了保护TOP自身不受到攻击,也为后端服务提供者作了天然的一个保护屏障,保证服务请求压力可以在TOP上可控,防止流量直接压倒服务提供者。
用户隐私安全在淘宝尤为重要,用户信息的安全性也在淘宝开放的过程中被放到了首位。
在开放平台设计中,除了采用普通开放平台的认证模式以外(OAuth类似流程),还在服务调用过程中通过区分应用角色来限制对于用户信息的获取和使用。
淘宝技术架构介绍, 了解淘宝,了解淘宝的架构需求
pipeline 页面布局
Screen Layout Control
多模板引擎
Jsp Velocity FreeMarker
V2.0 淘宝项目管理工具 AntX
类似maven 脚本编程语言 AutoConfig 依赖管理,冲突检测
V2.1 的需求
提高性能 增加开发效率 降低成本
V2.1 2004.10 – 2007.01
TBStore
Read/Write
Oracle Oracle Oracle Oracle
dump
Search
Read/Write
Node Node
1
2 ……
Node n
V2.1逻辑结构
表示层
Service
业务请求转发
Framework
S
UC
UC 业务流程处理 UC
UC
P
R
AO
AO
AO
AO
I
业务逻辑层
Node 1
Node 2
Node n
V2.1 TaobaoCDN
squid apache+php lighttpd 静态页面(包括php页面)、图片、描述 最初只有杭州和上海两个站点 现在发展到北京、广州、西安、天津、武
汉、济南等近10个站点 现在每天高峰期30G流量/秒
V2.1 session框架
Put/Get Data
Node 1
Node 2
Node n
V2.2 搜索引擎
垂直/水平 分割
AAPPPP
AAPPPP
Merge
Node1
Node2 ……
Node n
Col1
Node 1
淘宝网架构解密淘宝网的开源架构
淘宝网架构:解密淘宝网的开源架构疯狂代码 / ĵ:http://DataBase/Article2500.html来源: Linux论坛淘宝网,是一个在线商品数量突破一亿,日均成交额超过两亿元人民币,注册用户接近八千万的大型电子商务网站,是亚洲最大的购物网站。
那么对于淘宝网这样大规模的一个网站,我猜想大家一定会非常关心整个网站都采用了什么样的技术、产品和架构,也会很想了解在淘宝网中是否采用了开源的软件或者是完全采用的商业软件。
那么下面我就简单的介绍一下淘宝网中应用的开源软件。
对于规模稍大的网站来说,其IT必然是一个服务器集群来提供网站服务,数据库也必然要和应用服务分开,有单独的数据库服务器。
对于像淘宝网这样规模的网站而言,就是应用也分成很多组。
那么下面,我就从应用服务器操作系统、应用服务器软件、Web Server、数据库、开发框架等几个方面来介绍一下淘宝网中开源软件的应用。
操作系统我们首先就从应用服务器的操作系统说起。
一个应用服务器,从软件的角度来说他的最底层首先是操作系统。
要先选择操作系统,然后才是操作系统基础上的应用软件。
在淘宝网,我们的应用服务器上采用的是Linux操作系统。
Linux操作系统从1991年第一次正式被公布到现在已¾ ¬ 走过了十七个年头,在PC Server上有广泛的应用。
硬件上我们选择PC Server而不是小型机,那么Server的操作系统供我们选择的一般也就是Linux,FreeBSD, windows 2000 Server或者Windows Server 2003。
如果不准备采用微软的一系列产品构建应用,并且有能力维护Linux或者FreeBSD,再加上成本的考虑,那么还是应该在Linux和 FreeBSD之间进行选择。
可以说,现在Linux和FreeBSD这两个系统难分伯仲,很难说哪个一定比另外一个要优秀很多、能够全面的超越对手,应该是各有所长。
手机淘宝App技术架构
真机实验室
发布之前,通过线下自动化驱动测试保障基本稳定性和性能。 SDK在运行阶段自动收集性能、稳定性问题
1
• • •
核心SDK 能力
检测组件 Galileo
• • • •
•
移动日志 tLog
安全模式 SafeMode 安全气垫 热修复 Hotfix 开关服务 Orange
测试完毕后,进行灰度发布。通过SDK和大数 据体系评估APP的质量,性能和用户的体验, 以及在多种机型,环境上问题的暴露。
超级App“淘宝”诞生之路
手机淘宝App技术架构
淘宝的移动互联网演进史
企业级移动开发平台EMAS
阿里巴巴移动场景最佳实践
手机淘宝演进历史(2008 - )
手淘早期的技术架构
技术限制业务发展
手机淘宝泛质量管理体系
线下 自动化保障
•
自动化驱动 性能度量: OnlineMonotor 稳定性度量: CrashReport 自定义事件度量: AppMonitor
37.5
Weex开发框架
手淘Android发布频次
客户端团队
>30天 7天
2013 2014
30
22.5
15
3-4天
2015
7.5
1.7次/天
2016
0
谢谢!
4
手机淘宝整体高可用保障机制
• •
• •
• •
淘宝的移动互联网演进史
企业级移动开发平台EMAS
阿里巴巴移动场景最佳实践
淘宝的移动互联网演进史
企业级移动开发平台EMAS
阿里巴巴移动场景最佳实践
超级App的架构设计
千人千面的技术支撑
淘宝服务端技术架构详解
淘宝服务端技术架构详解目录一、前言 (3)二、单机架构 (4)三、多机部署 (4)四、分布式缓存 (5)五、Session 共享解决方案 (7)六、数据库读写分离 (9)七、CDN 加速与反向代理 (10)八、分布式文件服务器 (11)九、数据库分库分表 (11)十、搜索引擎与NoSQL (13)十一、后序 (13)一、前言以淘宝网为例,简单了解一下大型电商的服务端架构是怎样的。
如图所示最上面的就是安全体系系统,中间的就是业务运营系统,包含各个不同的业务服务,下面是一些共享服务,然后还有一些中间件,其中ECS 就是云服务器,MQS 是队列服务,OCS 是缓存等等,右侧是一些支撑体系服务。
除图中所示之外还包含一些我们看不到的,比如高可用的体现。
淘宝目前已经实现多机房容灾和异地机房单元化部署,为淘宝的业务也提供了稳定、高效和易于维护的基础架构支撑。
这是一个含金量非常高的架构,也是一个非常复杂而庞大的架构,当然这个架构不是一天两天演进成这样的,也不是一开始就设计并开发成这样的,对于初创公司而言,很难在初期就预估到未来流量千倍、万倍的网站架构会是怎样的状况,同时如果初期就设计成千万级并发的流量架构,也很难去支撑这个成本。
因此一个大型服务系统,都是从小一步一步走过来的,在每个阶段找到对应该阶段网站架构所面临的问题,然后不断解决这些问题,在这个过程中,整个架构会一直演进,同时内含的代码也就会演进,大到架构、小到代码都是在不断演进和优化的。
所以说高大上的项目技术架构和开发设计实现不是一蹴而就的,这是所谓的万丈高楼平地起。
二、单机架构从一个小网站说起,一般来说初始一台服务器就够了,文件服务器、数据库以及应用都部署在一台机器上。
也就是俗称的 allinone 架构。
这篇推荐看下:厉害了,淘宝千万并发,14 次架构演进…三、多机部署随着网站用户逐渐增多,访问量越来越大,硬盘、cpu、内存等开始吃紧,一台服务器难以支撑。
淘宝功能架构图ppt课件
淘宝直通车
淘
宝 广
广告DB
告
系
Dump数据
统
Build索引数据
广告点击消费
计费系统 JS调用广告展示
广告检索系统
DNS
ABTN网络
GTM分流 淘宝接入层
交换机 LB设备
淘宝客户群
DNS CDN系统
LB设备
站点缓存
静态页面
图片
DW部门 数据处理
TDDL/读写分 离Ibatis接口
打点/埋 点日志
SPU搜索
…搜索
1
介绍上图中提到的各个系统缩写意思
1.UIC: 用户中心(User Interface Center),提供所有用户信息相关的读写服务,如基本信息,扩展信息,社区信息,买卖家信用等级等等。 淘宝现在有两类卖家B 和C,这是通过在用户身上打不同的标签实现的,我们这次的无名良品卖家也是通过在用户身上打特殊的标签来区别于淘宝 已有的B 和C 类卖家。淘宝的TOP 平台已经开放了大部分的UIC 接口。 2.IC:商品中心(Item Center),提供所有商品信息的读写服务,比如新发商品,修改商品,删除商品,前后台读取商品相关信息等等,IC 是 淘宝比较核心的服务模块,有专门的产品线负责这块内容,IC 相关接口在TOP 中占的比重也比较大。 3.SC:店铺中心(Shop Center),类似中文站的旺铺,不过淘宝的SC 不提供页面级应用,提供的都是些远程的服务化的接口,提供店铺相关信 息的读写操作。 如:开通店铺,店铺首页,及detail 页面店铺相关信息获取,如店内类目,主营,店铺名称,店铺级别:如普通,旺铺,拓展版, 旗舰版等等。装修相关的业务是SC 中占比重较大的一块,现在慢慢的独立为一个新的服务化中心DC(design center),很多的前台应用已经通过直 接使用DC 提供的服务化接口直接去装修相关的信息。 4.TC:交易中心(Trade Center),提供从创建交易到确认收货的正 向交易流程服务,也提供从申请退款到退款完成的反向交易流程服务. 5.PC:促销中心(Promotion Center),提供促销产品的订购,续费,查询,使用相关的服务化接口,如:订购和使用旺铺,满就送,限时秒 杀,相册,店铺统计工具等等。 6.Forest:淘宝类目体系:提供淘宝前后台类目的读写操作,以及前后台类目的关联操作。 7.Tair:淘宝的分布式缓存方案,和中文站的Memcached 很像。其实也是对memcached 的二次封装加入了淘宝的一些个性化需求。 8.TFS:淘宝分布式文件存储方案(TB File System),专门用户处理静态资源存储的方案,淘宝所有的静态资源,如图片,HTML 页面,文本 文件,页面大段的文本内容如:产品描述,都是通过TFS 存储的。 9.TDBM:淘宝DB 管理中心(TB DB Manager), 淘宝数据库管理中心,提供统一的数据读写操作。 10.RC:评价中心(Rate center),提供评价相关信息的读写服务,如评价详情,DSR 评分等信息的写度服务。 11.HSF:淘宝的远程服务调用框架和平台的Dubbo 功能类似,不过部署方式上有较大差异,所有的服务接口都通过对应的注册中心(config center)获取。
淘宝开放平台API技术分析
淘宝开放API 技术分析API列表与说明TFS实现.NET数据实体Ray Zhang, 2010用户API提供了用户基本信息查询功能数据结构Location用户地址User用户UserCredit用户信用UserSubscribe用户订购信息API列表taobao.appstore.subscribe.get查询appstore应用订购关系er.get获取单个用户信息ers.get获取多个用户信息产品API提供了产品相关的发布,修改等功能数据结构Product产品结构ProductImg产品图片ProductPriceStat产品价格统计结构ProductProp属性统计结构ProductPropImg产品属性图片ProductSearch产品统计查询结果ProductStat产品统计结构API列表taobao.product.add上传一个产品,不包括产品非主图和属性图片taobao.product.get获取一个产品的信息taobao.product.img.delete删除产品非主图taobao.product.img.upload上传单张产品非主图,如果需要传多张,可调多次taobao.product.propimg.delete删除产品属性图taobao.product.propimg.upload上传单张产品属性图片,如果需要传多张,可调多次taobao.product.update修改一个产品,可以修改主图,不能修改子图片taobao.products.get获取产品列表taobao.products.search搜索产品信息类目属性API提供了标准类目,类目属性和类目属性值的查询功能数据结构Brand品牌Feature类目属性ItemCat商品类目结构PropValue属性值SellerAuthorize授权API列表taobao.itemcats.authorize.get查询B商家被授权品牌列表和类目列表taobao.itemcats.get获取后台供卖家发布商品的标准商品类目taobao.itemprops.get获取标准商品类目属性taobao.itempropvalues.get获取标准类目属性值商品API提供了商品以及商品相关的sku,邮费增加,修改功能数据结构AfterSale卖家设置售后服务对象Item Item(商品)结构ItemCategory商品查询分类结果ItemExtra商品扩展结构,通过iid和Item结构相关联ItemImg ItemImg结构ItemProp商品属性ItemSearch商品搜索Postage运费模板结构PostageMode运费方式模板收费方式PropImg商品属性图片结构Sku Sku结构SkuExtra Sku扩展表的扩展sku记录Video商品视频关联记录API列表taobao.aftersale.get查询用户售后服务模板taobao.item.add添加一个商品taobao.item.delete删除单条商品taobao.item.get得到单个商品信息taobao.item.img.delete删除商品图片taobao.item.img.upload添加商品图片taobao.item.propimg.delete删除属性图片taobao.item.propimg.upload添加或修改属性图片taobao.item.recommend.add橱窗推荐一个商品taobao.item.recommend.delete取消橱窗推荐一个商品taobao.item.sku.add添加SKUtaobao.item.sku.delete删除SKUtaobao.item.sku.get获取SKUtaobao.item.sku.update更新SKU信息taobao.item.skus.get根据卖家昵称和商品ID列表获取SKU信息taobao.item.update更新商品信息taobao.item.update.delisting商品下架taobao.item.update.listing一口价商品上架taobao.items.custom.get根据外部ID取商品taobao.items.get搜索商品信息taobao.items.inventory.get得到当前会话用户库存中的商品列表taobao.items.list.get批量获取商品信息taobao.items.onsale.get获取当前会话用户出售中的商品列表taobao.items.search搜索商品信息taobao.postage.add添加邮费模板taobao.postage.delete删除单个运费模板taobao.postage.get获取单个运费模板taobao.postage.update修改邮费模板taobao.postages.get获取卖家的运费模板taobao.skus.custom.get根据外部ID取商品SKU交易API提供了订单下载,修改收货地址、修改交易备注等功能数据结构Order订单结构PicUrl图片链接PromotionDetail交易的优惠信息详情Refund退款结构RefundMessage留言/凭证数据结构RefundRemindTimeout退款超时结构ShippingAddress收货地址数据结构Trade交易结构TradeAccountDetail淘宝卖家绑定的支付宝账户的财务明细TradeConfirmFee确认收货费用结构API列表taobao.refund.get单笔退款详情taobao.refund.refuse卖家拒绝退款taobao.refunds.apply.get查询买家申请的退款列表taobao.refunds.receive.get查询卖家收到的退款列表taobao.trade.amount.get交易订单帐务查询taobao.trade.close卖家关闭一笔交易taobao.trade.confirmfee.get获取交易确认收货费用taobao.trade.fullinfo.get获取单笔交易的详细信息taobao.trade.get获取单笔交易的部分信息(性能高) taobao.trade.memo.add对一笔交易添加备注taobao.trade.memo.update修改一笔交易备注taobao.trade.ordersku.update更新交易订单的销售属性taobao.trade.shippingaddress.update更改交易的收货地址taobao.trade.snapshot.get交易快照查询taobao.trades.bought.get搜索当前会话用户作为买家达成的交易记录taobao.trades.sold.get搜索当前会话用户作为卖家已卖出的交易数据taobao.trades.sold.increment.get搜索当前会话用户作为卖家已卖出的增量交易数据评价API提供了评价的添加和查询功能数据结构TradeRate评价列表API列表taobao.traderate.add新增单个评价taobao.traderate.list.add针对父子订单新增批量评价taobao.traderates.get搜索评价信息物流API提供了发货,物流单详情,区域地址和物流公司信息查询功能数据结构LogisticsCompany物流公司结构LogisticsPartner物流公司信息Shipping物流数据结构TransitStepInfo物流跟踪信息的一条API列表taobao.areas.get查询地址区域taobao.delivery.cod.send货到付款(cod)发货处理taobao.delivery.send发货处理panies.get查询物流公司信息taobao.logistics.orders.detail.get批量查询物流订单,返回详细信息taobao.logistics.orders.get批量查询物流订单taobao.logistics.partners.get查询物流公司信息taobao.logistics.trace.search物流流转信息查询收费API提供了B商家保证金查询功能数据结构GuarantyFund保证金Suite套餐VasProduct产品订购信息VasSignInfo代扣协议接口数据处理后的返回信息VasSignUrl客户查询是否签约的信息回馈,返回message,aplipaySignAddressAPI列表taobao.guarantyfunds.get B商家保证金查询店铺API提供了店铺查询,店铺自定义类目的查询和更新,图片空间图片的查询和删除等功能数据结构ItemVideo商品视频MediaCategory媒体文件分类MediaFile媒体文件Picture图片PictureCategory图片分类SellerCat店铺内卖家自定义类目Shop店铺信息ShopCat店铺类目ShopScore店铺动态评分信息API列表taobao.picture.category.get获取图片分类信息taobao.picture.delete删除图片空间图片taobao.picture.get获取图片信息taobao.picture.upload上传单张图片taobao.sellercats.list.add添加卖家自定义类目taobao.sellercats.list.get获取前台展示的店铺内卖家自定义商品类目taobao.sellercats.list.update更新卖家自定义类目taobao.shop.get获取卖家店铺的基本信息taobao.shop.remainshowcase.get获取卖家店铺剩余橱窗数量taobao.shop.update更新店铺基本信息taobao.shopcats.list.get获取前台展示的店铺类目分销API提供了分销商信息和采购单信息的查询以及分销产品的添加和更新等功能数据结构Distributor分销API返回数据结构FenxiaoSku分销产品ProductCat产品线PurchaseOrder采购单及子采购单信息Receiver收货人详细信息SupplierStat供应商的汇总信息。
淘宝系统架构概述
2005-工业革命(续)
表现层
基于Webx以及Service框架的Web层框架
分布式 Session
商业逻辑层
基于Spring以及Service框架的biz层框架
数据访问层
基于Spring以及DAO设计模式的数据访问框架
分布式 Cache
数据存储
搜索引擎 Oracle数据库
LDAP
淘宝系统架构概述
• 业务逻辑层使用Alibaba Service框架,并且引入 spring 框架
– Spring容器和Alibaba Service框架无缝集成 – AO,BO – 使用分布式cache缓存对象
• 数据访问层
– 透明的事务处理 – 引入Hibernate和iBatis,以淘宝iB系a统ti架s为构概主述
数据存储
搜索引擎 Oracle数据库
LDAP
淘宝系统架构概述
中世纪-工业革命原因
• Turbine的发展缓慢 • EJB配置复杂,可维护性差 • 重量级框架,业务侵入高 • 高度容器依赖,可测试性差 • CMP性能差,导致DAO和CMP并存
淘宝系统架构概述
2005-工业革命
• 表现层使用WebX和Service 框架
• EJB服务器使用Weblogic • Web服务器使用Apache
淘宝系统架构概述
2002底-中世纪(续)
表现层 商业逻辑层
基于Webx以及Service框架的Web层框架
delegate
Façade
使用SLSB实现的业务逻辑对象Controlers
数据访问层
CMP进行单条记录的增加删除,DAO对象查找
BizObj
业务逻辑方法 数据访问方法
系统架构演进过程
系统架构演进过程高大上的淘宝架构我们以淘宝架构为例,了解下大型的电商项目的服务端的架构是怎样,如图所示上面是一些安全体系系统,如数据安全体系、应用安全体系、前端安全体系等。
中间是业务运营服务系统,如会员服务、商品服务、店铺服务、交易服务等。
还有共享业务,如分布式数据层、数据分析服务、配置服务、数据搜索服务等。
最下面呢,是中间件服务,如MQS即队列服务,OCS即缓存服务等。
图中也有一些看不到,例如高可用的一个体现,实现双机房容灾和异地机房单元化部署,为淘宝业务提供稳定、高效和易于维护的基础架构支撑。
这是一个含金量非常高的架构,也是一个非常复杂而庞大的架构。
当然这个也不是一天两天演进成这样的,也不是一上来就设计并开发成这样高大上的架构的。
这边就要说一下,小型公司要怎么做呢?对很多创业公司而言,很难在初期就预估到流量十倍、百倍以及千倍以后网站架构会是什么样的一个状况。
同时,如果系统初期就设计一个千万级并发的流量架构,很难有公司可以支撑这个成本。
因此,一个大型服务系统都是从小一步一步走过来的,在每个阶段,找到对应该阶段网站架构所面临的问题,然后在不断解决这些问题,在这个过程中整个架构会一直演进。
那我们来一起看一下。
1 单服务器-俗称all in one从一个小网站说起。
一台服务器也就足够了。
文件服务器,数据库,还有应用都部署在一台机器,俗称ALL IN ONE。
随着我们用户越来越多,访问越来越大,硬盘,CPU,内存等都开始吃紧,一台服务器已经满足不了。
这个时候看一下下一步演进。
2 数据服务与应用服务分离我们将数据服务和应用服务分离,给应用服务器配置更好的CPU,内存。
而给数据服务器配置更好更大的硬盘。
分离之后提高一定的可用性,例如Files Server挂了,我们还是可以操作应用和数据库等。
随着访问qps越来越高,降低接口访问时间,提高服务性能和并发,成为了我们下一个目标,发现有很多业务数据不需要每次都从数据库获取。
淘宝网体系分析
淘宝网体系分析一、淘宝网的系统功能体系分析1、强大的管理功能。
在淘宝网的页面设计中,色彩用鲜艳的橙色、红色为主。
首页很整齐,有条理,有序,有层次感,并且体现了淘宝网的精神——简单、简约。
登陆淘宝网首页后,通过搜索引擎,可以直接又方便地在淘宝网淘到想要的宝贝;或者点击“高级搜索”,能缩小搜索范围,更方便地查找宝贝。
通过价格,通过店主名字,通过店铺名字都可以迅速找到想要的宝贝。
在后台有功能强大的二级栏目,包括我要买、我要卖、我的淘宝、社区(即互动论坛)、交易安全、帮助中心。
可以使买卖方快捷、方便交易。
正是有了强大的管理功能,所以淘宝网在面对竞争对手时,能更好地为用户服务。
2、方便的网上买卖系统。
通过电子商务平台为买卖双方提供了一个在线交易平台,卖方可以主动提供商品上网销售或拍卖,而买方可以自行选择商品进行竞价和购买,不再受时间和空间的限制,广泛方便的比价、议价、竞价过程节约了大量的市场沟通成本。
另一方面参与的群体庞大,选择的范围更广。
3、安全的支付系统——支付宝。
支付宝系统的引进在更深层次上为交易安全提供了保障。
在淘宝网的交易过程中,买家看好货物后,可以选择通过支付宝先将钱交给淘宝网,得到淘宝网确认到款后,卖家放心的向买家发货。
而淘宝网亦在买家确认商品满意度后将钱款打入卖家的帐号。
支付宝功能为监督买家和卖家的信用提供了完整的解决方案。
支付宝的实施过程中同样引入第三方监督机制,用户通过银行和淘宝网的B2C接口向淘宝网支付汇款,以银行为信用中介,淘宝网给客户提供了资金流向的监督保证。
通过与银行的携手合作,将达到客户、银行、淘宝网的三赢局面,而这种三赢,实质上就是客户、淘宝网与银行间建立的一种良性互动的诚信监督机制的外显。
据支付宝方面的统计,目前国内每100个在网上购物的人群中,平均有82个通过支付宝进行支付,高峰时这一数字达到了89个。
目前支持使用支付宝服务的外部商家数量已经超过46万家,涵盖了机票、虚拟游戏、数码通信以及商业服务等行业。
淘宝开发平台TOP API揭秘
12-21 20:31:17&v=1.0&sign=67664111FF66F4926EF416DD3F7DE73C 该链接拼装了接口的系统参数和业务参数,系统参数如:app_key(注册应用获得)、f o rmat (返 回结果格式)、met ho d(调用的接口名称)和t imest amp(调用接口时间戳);应用参数可查看具 体的接口的调用参数。 具体调用接口可查看wiki文档—Open API的调用。
l 角色分类 对应角色主要包括:
<<<<< 依次表示公开查询应用、买家应用、卖家应用、商家应用、高级应用、专业应用被授权访问A PI的 角色级别。其中公开查询应用为最低权限集合级别、专业应用为最高权限集合级别。查、买、卖接 口无需审批,仅受默认流量规则限制,商家以上接口,淘宝商城用户可以为自己申请商家应用 角色。ISV 及第三方开发者如需要申请,请看审核规则。
用户:此类型客户其业务经营规模对较大,经营的产品种类、数量较多。但同同类其他企业相比其 电子商务方面的信息化程度仍有进一步提高的空间。
市场需求: 1. 由中小网商成长起来的客户为了提高其竞争力,为客户提供独特的购物体验,逐步建立自身的品 牌优势, 希望能够建立自己的外部网店。 2. 相对规模较大的成熟企业因为希望提高市场份额、进入新的细分市场、降低销售成本等原因而希 望通过电子商务渠道对产品进行推广与销售。 3. 因为建立覆盖企业业务前端(市场、销售)到后端(采购、财务、物流)的整套电子商务系统前期投入 较大,且系统实施周期相对较长,对于销售收益前景尚不确定的企业而言是一项风险较大的投资 行为。 l 虚拟社区/网络休闲游戏应用
用户:拥有较大用户群体的论坛、社区、网络游戏。
市场需求: 1. 广大论坛、SNS社区渴望将流量变现,与此同时广大商家也期望论坛社区高价值流量能够带来成 交和新客户。 2. 厂商希望通过论坛、社区展示其商品信息和购买方式,并促进用户通过简单的操作在论坛、社区 上进行即时购买行为。 3. 厂商可以将游戏中的虚拟广告牌、路标、商品换成淘宝客商品,将网游中的道具与实际商品相 结合,进行多渠道促销。 l 买家/卖家辅助工具
淘宝技术架构演进之路
淘宝技术架构演进之路1.概述 本⽂以淘宝为例,介绍从⼀百到千万级并发情况下服务端架构的演进过程,同时列举出每个演进阶段遇到的相关技术,让⼤家对架构的演进有⼀个整体的认知,最后汇总⼀些架构的设计原则。
2.基本概念 在介绍架构之前,为了避免读者对架构设计中的⼀些概念不了解,下⾯对接个最基础的概念进⾏介绍:分布式系统中的对个模块在不同服务器上部署,即可成为分布式系统,如Tomcat和数据库分别部署在不同的服务器上,或者两个相同的Tomcat分别部署在不同的服务器上。
⾼可⽤系统中部分节点失效时,其他节点可以接替他继续提供服务,则可认为系统具有⾼可⽤性。
集群:⼀个特定领域的软件部署在多台服务器上并作为⼀个整体提供⼀类服务,这个整体成为集群;如Zookeeper中的Master和Slave分别部署在多台服务器上,共同组成⼀个整体提供⼏种配置服务。
在常见的集群中,客户端往往能链接任意⼀个节点获得服务,并且当集群中⼀个节点掉线时,其他节点往往能够接替他继续提供服务,这时候说明集群具有⾼可⽤性。
负载均衡:请求发送到系统时通过某些⽅式吧请求均匀的分发到多个节点上,使系统中每个节点能够均匀的出来请求负载,则认为系统是负载均衡的。
正向代理和反向代理:系统内部要访问外部⽹络时,统⼀通话⼀个代理服务器吧请求转发出去,在外部⽹络来看就是代理服务器发起的访问,此时代理服务器实现的是正向代理;当外部请求进⼊系统时,代理服务器吧该请求转发到系统中某台服务器上,对外部请求来说,与之交互的只有代理服务器,此时代理服务器实现的是反向代理。
简单来说,正向代理就是代理服务器代替系统内部来访问外部⽹络的过程,反向代理就是外部系统请求访问系统时通过代理服务器转发到内部服务器的过程。
3.架构演进3.1.单机架构 以淘宝为例,在⽹站最初期,应⽤数量与⽤户数量都较少,可以吧Tomcat和数据库部署在同⼀台服务器上。
浏览器往 发起请求时,⾸先经过DNS服务器(域名系统)吧域名解析转换为实际IP地址10.102.1.4,浏览器转⽽访问该IP对应的Tomcat。
淘宝开放平台API技术分析
淘宝开放API 技术分析API列表与说明TFS实现.NET数据实体Ray Zhang, 2010用户API提供了用户基本信息查询功能数据结构Location用户地址User用户UserCredit用户信用UserSubscribe用户订购信息API列表taobao.appstore.subscribe.get查询appstore应用订购关系er.get获取单个用户信息ers.get获取多个用户信息产品API提供了产品相关的发布,修改等功能数据结构Product产品结构ProductImg产品图片ProductPriceStat产品价格统计结构ProductProp属性统计结构ProductPropImg产品属性图片ProductSearch产品统计查询结果ProductStat产品统计结构API列表taobao.product.add上传一个产品,不包括产品非主图和属性图片taobao.product.get获取一个产品的信息taobao.product.img.delete删除产品非主图taobao.product.img.upload上传单张产品非主图,如果需要传多张,可调多次taobao.product.propimg.delete删除产品属性图taobao.product.propimg.upload上传单张产品属性图片,如果需要传多张,可调多次taobao.product.update修改一个产品,可以修改主图,不能修改子图片taobao.products.get获取产品列表taobao.products.search搜索产品信息类目属性API提供了标准类目,类目属性和类目属性值的查询功能数据结构Brand品牌Feature类目属性ItemCat商品类目结构PropValue属性值SellerAuthorize授权API列表taobao.itemcats.authorize.get查询B商家被授权品牌列表和类目列表taobao.itemcats.get获取后台供卖家发布商品的标准商品类目taobao.itemprops.get获取标准商品类目属性taobao.itempropvalues.get获取标准类目属性值商品API提供了商品以及商品相关的sku,邮费增加,修改功能数据结构AfterSale卖家设置售后服务对象Item Item(商品)结构ItemCategory商品查询分类结果ItemExtra商品扩展结构,通过iid和Item结构相关联ItemImg ItemImg结构ItemProp商品属性ItemSearch商品搜索Postage运费模板结构PostageMode运费方式模板收费方式PropImg商品属性图片结构Sku Sku结构SkuExtra Sku扩展表的扩展sku记录Video商品视频关联记录API列表taobao.aftersale.get查询用户售后服务模板taobao.item.add添加一个商品taobao.item.delete删除单条商品taobao.item.get得到单个商品信息taobao.item.img.delete删除商品图片taobao.item.img.upload添加商品图片taobao.item.propimg.delete删除属性图片taobao.item.propimg.upload添加或修改属性图片taobao.item.recommend.add橱窗推荐一个商品taobao.item.recommend.delete取消橱窗推荐一个商品taobao.item.sku.add添加SKUtaobao.item.sku.delete删除SKUtaobao.item.sku.get获取SKUtaobao.item.sku.update更新SKU信息taobao.item.skus.get根据卖家昵称和商品ID列表获取SKU信息taobao.item.update更新商品信息taobao.item.update.delisting商品下架taobao.item.update.listing一口价商品上架taobao.items.custom.get根据外部ID取商品taobao.items.get搜索商品信息taobao.items.inventory.get得到当前会话用户库存中的商品列表taobao.items.list.get批量获取商品信息taobao.items.onsale.get获取当前会话用户出售中的商品列表taobao.items.search搜索商品信息taobao.postage.add添加邮费模板taobao.postage.delete删除单个运费模板taobao.postage.get获取单个运费模板taobao.postage.update修改邮费模板taobao.postages.get获取卖家的运费模板taobao.skus.custom.get根据外部ID取商品SKU交易API提供了订单下载,修改收货地址、修改交易备注等功能数据结构Order订单结构PicUrl图片链接PromotionDetail交易的优惠信息详情Refund退款结构RefundMessage留言/凭证数据结构RefundRemindTimeout退款超时结构ShippingAddress收货地址数据结构Trade交易结构TradeAccountDetail淘宝卖家绑定的支付宝账户的财务明细TradeConfirmFee确认收货费用结构API列表taobao.refund.get单笔退款详情taobao.refund.refuse卖家拒绝退款taobao.refunds.apply.get查询买家申请的退款列表taobao.refunds.receive.get查询卖家收到的退款列表taobao.trade.amount.get交易订单帐务查询taobao.trade.close卖家关闭一笔交易taobao.trade.confirmfee.get获取交易确认收货费用taobao.trade.fullinfo.get获取单笔交易的详细信息taobao.trade.get获取单笔交易的部分信息(性能高) taobao.trade.memo.add对一笔交易添加备注taobao.trade.memo.update修改一笔交易备注taobao.trade.ordersku.update更新交易订单的销售属性taobao.trade.shippingaddress.update更改交易的收货地址taobao.trade.snapshot.get交易快照查询taobao.trades.bought.get搜索当前会话用户作为买家达成的交易记录taobao.trades.sold.get搜索当前会话用户作为卖家已卖出的交易数据taobao.trades.sold.increment.get搜索当前会话用户作为卖家已卖出的增量交易数据评价API提供了评价的添加和查询功能数据结构TradeRate评价列表API列表taobao.traderate.add新增单个评价taobao.traderate.list.add针对父子订单新增批量评价taobao.traderates.get搜索评价信息物流API提供了发货,物流单详情,区域地址和物流公司信息查询功能数据结构LogisticsCompany物流公司结构LogisticsPartner物流公司信息Shipping物流数据结构TransitStepInfo物流跟踪信息的一条API列表taobao.areas.get查询地址区域taobao.delivery.cod.send货到付款(cod)发货处理taobao.delivery.send发货处理panies.get查询物流公司信息taobao.logistics.orders.detail.get批量查询物流订单,返回详细信息taobao.logistics.orders.get批量查询物流订单taobao.logistics.partners.get查询物流公司信息taobao.logistics.trace.search物流流转信息查询收费API提供了B商家保证金查询功能数据结构GuarantyFund保证金Suite套餐VasProduct产品订购信息VasSignInfo代扣协议接口数据处理后的返回信息VasSignUrl客户查询是否签约的信息回馈,返回message,aplipaySignAddressAPI列表taobao.guarantyfunds.get B商家保证金查询店铺API提供了店铺查询,店铺自定义类目的查询和更新,图片空间图片的查询和删除等功能数据结构ItemVideo商品视频MediaCategory媒体文件分类MediaFile媒体文件Picture图片PictureCategory图片分类SellerCat店铺内卖家自定义类目Shop店铺信息ShopCat店铺类目ShopScore店铺动态评分信息API列表taobao.picture.category.get获取图片分类信息taobao.picture.delete删除图片空间图片taobao.picture.get获取图片信息taobao.picture.upload上传单张图片taobao.sellercats.list.add添加卖家自定义类目taobao.sellercats.list.get获取前台展示的店铺内卖家自定义商品类目taobao.sellercats.list.update更新卖家自定义类目taobao.shop.get获取卖家店铺的基本信息taobao.shop.remainshowcase.get获取卖家店铺剩余橱窗数量taobao.shop.update更新店铺基本信息taobao.shopcats.list.get获取前台展示的店铺类目分销API提供了分销商信息和采购单信息的查询以及分销产品的添加和更新等功能数据结构Distributor分销API返回数据结构FenxiaoSku分销产品ProductCat产品线PurchaseOrder采购单及子采购单信息Receiver收货人详细信息SupplierStat供应商的汇总信息。
淘宝运营管理体系架构是什么
淘宝运营管理体系架构是什么引言随着电子商务的迅猛发展,淘宝作为中国最大的在线购物平台之一,在市场中扮演着重要的角色。
淘宝的成功不仅仅依靠其庞大的用户群体和海量的商品,还有其精细的运营管理体系架构。
本文将探讨淘宝运营管理体系架构的含义以及其具体构成。
定义淘宝运营管理体系架构,简称淘宝运营架构,是指在淘宝运营活动中所建立的一套组织结构、策略规划、流程管理等框架,以支持淘宝平台的日常运营和持续发展。
该架构包括了对淘宝运营各个方面的管理和组织,如商品管理、营销活动、客户服务等。
淘宝运营管理体系架构的核心淘宝运营管理体系架构的核心是以用户为中心。
淘宝平台的发展离不开用户的支持和参与,因此,为了满足用户需求和提升用户体验,淘宝运营管理体系架构应该以用户为核心,围绕用户设计各个环节。
用户研究与分析淘宝平台采集了大量用户数据,包括用户行为、消费习惯、兴趣爱好等。
基于这些数据,淘宝进行用户研究和分析,以了解用户需求和行为模式,进而提供个性化的服务和推荐,提升用户满意度。
商品管理淘宝平台上存在大量的商品,商品管理是淘宝运营管理体系架构的重要组成部分。
淘宝通过商品分类、标签、搜索等方式,对商品进行管理和展示,使用户能够方便地找到自己想要的商品。
营销活动淘宝平台经常进行各种促销和营销活动,如双11购物节、618年中大促等。
这些活动是淘宝吸引用户和促进交易的重要手段。
淘宝运营管理体系架构需要对这些活动进行策划、执行和评估,确保其有效性和效果。
客户服务淘宝拥有庞大的用户群体,客户服务是淘宝运营管理体系架构的关键环节。
淘宝提供在线客服、投诉维权、退换货等服务,以满足用户的各种需求和问题,维护用户的权益并提升用户满意度。
淘宝运营管理体系架构的优势淘宝运营管理体系架构的建立和实施带来了许多优势,为淘宝在激烈的竞争中保持领先地位提供了强大的支持。
高效运营淘宝运营管理体系架构将运营活动规范化和标准化,通过流程管理和自动化工具,提高了运营效率。
岑文初:淘宝开放平台架构设计与实践
– 作用
• 数据操作可控,保护终端用户隐私(结合cookie和标签,控制ISV业务数据操 作尺度,提高数据安全性) • 提供标准业务流程标签,简化开发者对于业务流程理解过程。 • 标签化接口方式,完成数据获取和页面渲染,后台业务升级对ISV透明化。 • 标签获取客户端信息,将监控扩展到整个业务请求过程。 • 制定行业化标签库,形成统一开发标准
•
•
TOP商业驱动模式介绍
End User
插件分成
AppStore订购
开发者按业务分类
淘宝插件
店铺插件 淘宝SNS插件
免费TOP外部插件
社区插件 外部SNS插件
收费应用
客户端 独立WEB应用 新平台应用
自用型应用
独立网店 社区站点 导购网站
插件分成
动态广告
淘宝客API 流量收费 盈利模式
流量收费
流量收费
16
TOP架构设计实例分享
• 换个角度看问题:
Memcached cache
Config Server
支持集群 的分布式 缓存
Cluster Support Client
TOP架构设计实例分享
TOP架构设计实例分享
• • • 集群数据固化问题 – Other Server support Protocol(memcached db) – Customize Adapter 集群节点负载均衡 – 节点内与节点间负载均衡(权重,Hash算法) 集群节点数据同步 – Key node & Lazy Task Queue – Failure node recover Data (standby or active mode) 集群节点动态扩容 – Config pull or push form Config Server – Cluster data move(主动 or 被动) 性能消耗 – Local Cache + Remote Cache.(Local data clean policy) – Protocol extend support compression or incremental modify
淘宝开放平台简介20130520
4
淘宝开放平台 的用户 和价格策略
• •
Being Creative Influencer
平台 产品 平台 特点 业务 方向
即淘宝应用商店,是面向应用终端使用者的在线应用销售 平台,针对用户群体主要为:商家、卖家、买家、社区 淘宝应用商店在前期提供两种价格策略 • 免费,即用户可以无偿使用开发者所提供的应用 • 月租型付费,即用户付出一定的费用,从而可以在指定期间内享受某项服 务。并在月租型付费策略中引入了免费试用期的概念,终端用户可以在免 费试用之后再决定是否要购买某个付费产品,免费时长可以由开发者选择
11
Being Creative Influencer
淘宝开放平台对中国电信的启发(1/2)
• 资源整合的纽带 • 淘宝开放平台是一个阿里软件、淘宝用户和第三方开发者共赢的开放平台, 也是一个商务软件开发技术的交流平台 • 在阿里巴巴集团战略中扮演资源整合的纽带(事实上这个平台将淘宝网和阿 里巴巴B2B的用户资源与阿里软件以及第三方应用整合起来)和新利润区两 个重要的角色,服务于阿里巴巴。特别是对淘宝网和阿里软件来说更为重要 • 新的商业生态系统
3
淘宝开放平台Open 的合作伙 伴可分为自用型开发者和他用型开发者
Being Creative Influencer
平台 产品 平台 特点 业务 方向
• 自用型开发者 • 即使用TOP开放的服务来定制和创新自身产品的开发者,产品不对外销售, 也不提供给第三方使用。这种用户的典型例子有:大商家自定义开发自己的 店铺管理系统、自己的外部独立网店如;淘宝客开发者创建的导购 网站 • 他用型开发者 • 即将自己开发的应用程序和服务提供给他人使用(包括有偿的和无偿的), 如在淘宝应用商店进行销售
淘宝云梯分布式计算平台架构介绍
淘宝云梯分布式计算平台架构介绍目录一、系统架构 (3)1、系统整体架构 (3)2、淘宝云计算介绍 (3)二、数据同步方案 (4)1、数据同步方案——概览 (4)2、数据同步方案—— 实时同步VS非实时同步 (5)3、数据同步方案—— TimeTunnel2 介绍 (5)4、数据同步方案——Dbsync介绍 (7)5、数据同步方案——DataX介绍 (8)三、调度系统 (9)1、调度系统——生产率银弹 (10)2、调度系统——模块/子系统 (10)3、调度系统——任务触发方式 (11)4、调度系统——调度方式 (12)5、调度系统——什么是Gateway?参与天网调度的资源。
(13)6、调度系统—— Gateway规模及规划 (13)7、调度系统——gateway standardization (14)8、调度系统——Dynamic LB实现 (15)9、调度系统——优先级策略(实现) (15)10、调度系统——优先级策略(意义) (16)11、调度系统——监控全景 (17)四、元数据应用 (17)1、挖掘元数据金矿 (18)2、基于元数据的开发平台 (19)3、基于元数据的分析平台——运行分析系统 (20)4、基于元数据的分析平台——分析策略概览 (20)5、基于元数据的分析平台——运行数据收集 (21)6、基于元数据的分析平台——宏观分析策略 (21)7、基于元数据的分析平台——定位系统瓶颈 (22)8、基于元数据的分析平台——最值得优化的任务 (23)一、系统架构1、系统整体架构数据流向从上到下,从各数据源、Gateway、云梯、到各应用场景。
2、淘宝云计算介绍主要由数据源、数据平台、数据集群三部分构成。
二、数据同步方案1、数据同步方案——概览2、数据同步方案——实时同步VS非实时同步3、数据同步方案—— TimeTunnel2 介绍TimeTunnel是一个实时数据传输平台,TimeTunnel的主要功能就是实时完成海量数据的交换,因此TimeTunnel的业务逻辑主要也就有两个:一个是发布数据,将数据发送到TimeTunnel;一个是订阅数据,从TimeTunnel读取自己关心的数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
淘宝开放平台架构组件体系初探
作者岑文初发布于2009年9月29日上午11时22分
社区
Architecture,
Java
主题
平台,
企业架构
标签
基于组件的架构
淘宝开放平台(TaoBao Open Platform,简称TOP)的整个架构体系是组件化体系架构,可以是很少的几个基础组件构成的Skeleton,也可以是融入了商业想象的Amazing Architecture。
这里就通过对于这些组件的罗列,描述出在TOP这个大体系中,各个组件所处的地位及作用。
TOP 的“兵器谱”是在现阶段商业需求及平台非业务性需求指导下形成的,未来TOP将继续发展,“兵器谱”也会不断演进。
下图是整个TOP当前的一个组件结构图:
图中,红色虚线就是TOP的Skeleton。
TOP当前从业务模块功能角度来划分,可以分成三个层次:基础平台组件层,基础业务组件层,普通业务组件层。
基础平台组件层,倾向于平台级别功能满足及对平台稳定性,可用性的支持。
基础业务组件层,是介于平台服务于普通业务服务之间的组件,部分利用了平台基础组件层的组件,来抽象出一层公用业务服务组件,为业务组件提供通用的基础支持。
安全组件
安全组件主要从四个角色去考虑整体的安全策略及具体的实施方案,这四个角色是:用户,应用,平台,服务。
平台本身的安全主要是基于在大并发和大流量的情况下,保证平台自身稳定性和可用性,同时也要兼顾在平台开放的服务不相互干扰和影响。
因此采取服务分流隔离机制,通过虚拟配置及软负载方式将服务请求动态分流和隔离,保证了服务之间相互的独立性,同时也充分利用TOP的能力。
频率控制及流量控制除了保护TOP自身不受到攻击,也为后端服务提供者作了天然的一个
保护屏障,保证服务请求压力可以在TOP上可控,防止流量直接压倒服务提供者。
用户隐私安全在淘宝尤为重要,用户信息的安全性也在淘宝开放的过程中被放到了首位。
在开放平台设计中,除了采用普通开放平台的认证模式以外(OAuth类似流程),还在服务调用过程中通过区分应用角色来限制对于用户信息的获取和使用。
同时针对不同的应用类型(插件,Web应用,客户端应用,手机应用)都有各自不同的用户授权方式,保证用户的知情权。
App的安全其实也是为了保证对服务的请求及对用户信息的获取不被不法的应用信息盗取者所利用,根据应用角色及自己对于安全的需求,采取多种方式或者组合的方式来实现App信息的保密性,保护App自身安全,也保证了平台服务的数据安全。
服务安全指的是对于服务来说分成了几个层级,不同层级的服务对于安全级别的要求不同(不需要交验应用身份,需要交验应用身份,需要用户授权,用户可选择授权等),在应用访问服务的时候,就会需要根据服务级别的不同采用不同的访问控制流程。
根据上述的四个角色对于安全的考虑,通过应用角色的定义,服务虚拟组的编排,黑名单(频率控制及流量控制),多模式用户令牌等手段,形成了多种模式的安全控制流程。
服务路由组件
服务路由是开放平台最基本的功能,如果排除商业因素,那么对于TOP最基本上来看可以看作一个服务路由器,服务路由主要的功能如下图展示:
服务路由组件需要支持多服务类型的服务接入,不同服务类型主要表现在两个维度:1.服务对外的展现方式(REST OR RPC),这两种形态的服务没有任何好坏之分,只是根据各自的系统形态来选择采用哪一种模式来对外暴露,RPC比较符合过去应用开放的风格,REST比较适合面向资源的架构。
同时对于同步,异步,通知,大数据量的服务,都会有不同的接入方式和调用方式支持,满足各种业务场景的需求。
多通信协议支持,表示服务请求到了TOP以后,TOP负责将请求继续发送给服务提供者,不论服务提供者采用什么方式和TOP交互,最终将得到的结果返回给客户,服务调用者将会对后端的服务请求过程透明,同时可以使TOP很容易接入一些传统遗留系统的服务,或者是对通信有特殊需求的服务。
特性支持主要是会有对内容的一些特殊处理,例如压缩,在CS或者手机应用交互过程中,就会需要对数据量有所压缩,满足业务需求。
监控告警组件
下图是监控告警组件的基本功能图
监控和告警模块在TOP中起到越来越重要的作用,访问量逐日膨胀,运行期TOP是一个黑盒,无法知晓当前系统实际的健康状况,当出现问题以后比较难以定位。
服务监控主要是服务质量(响应时间),短时间段内的服务请求峰值,和阶段性的趋势。
系统和平台主要是对底层基础组件的监控,同时及时地通知TOP负责人处理线上即将要发生的事情。
对于应用的监控通常就是从客户端和服务端两面对于应用当前的情况作汇总分析。
当监控发现异常以后,就交由告警部分按照一定的发送策略给相关的负责人,在第一时间将问题解决。
日志组件
日志组件和其他系统的日志组件基本没有太大的区别,只是在对于海量数据写出和获取的方法做了优化(例如异步分页批量输出等)。
日志组件主要负责,打点,收集,分析,数据库记录,归档。
协议转换组件
这里谈到的协议转换指的是对于请求和返回的协议,TOP可以做适配,来满足服务调用者和服务发布者之间在服务协议失配的情况下还是能够正常通信。
当前支持JSON,XML,Atom,二进制协议之间的转换,当然转换描述文档将会配置在TOP。
同时返回的数据内容,也可以通过协议转换,返回给客户端常规的xml或者json类型的数据。
服务流程化组件
服务流程化指的是将离散的服务通过流程描述文档能够虚拟的串联成为一个新的服务,这样更加适合调用者使用,同时将服务的一些内部逻辑隐藏起来。
这很类似于SOA中的服务编排,同时也可以参看Yahoo的Pipe,那就是一种典型的服务串联,同时还提供了方便的界面直接交由用户通过手动拖拉的方式来使用服务串联。
服务流程化最大的特点就是将不同类型的服务能够根据业务场景的需求组合成简单的流程性服务,极大降低了服务开发者由于对服务流程不熟悉而犯错的几率,同时也为服务开发者提高了开发效率。
计费组件
当前计费模型主要是按流量收费和插件分成两种模式,因此计费组件还比较简单,当前就是基于日志做分析,未来会考虑在流量上的各种特殊模式(打包,优惠等等)。
容器组件(TBML)
产生原因:
∙数据隐私性
∙开发便利性
∙业务升级透明化
∙监控全局化
∙开发标准化
作用:
∙数据操作可控,保护终端用户隐私(结合cookie和标签,控制ISV业务数据操作尺度,提高数据安全性)
∙提供标准业务流程标签,简化开发者对于业务流程理解过程。
∙标签化接口方式,完成数据获取和页面渲染,后台业务升级对ISV透明化。
∙标签获取客户端信息,将监控扩展到整个业务请求过程。
制定行业化标签库,形成统一开发标准。
TBML首先需要根据业务需求及场景定义出对应的标签库,也就是制定Taobao的标签标准,最简单的获取用户信息标签,到最复杂的业务操作流程标签都会成为标签库中的一部分。
同时在服务端需要有解释引擎来翻译标签,解释引擎一方面需要去了解标签内容和含义,同时需要请求后台多个API,串联成为流程化的服务,从应用的输入,得到最后的输出,当然期间也需要处理异常的情况。
最后还需要关注的就是安全控制,在交验标签传递来的数据时,需要对数据作完整性及合法性的交验,防止通过标签数据的特殊性攻击后台服务接口。
TBQL组件
TBQL其实是一种服务调用的方式,也是通过一种程序员和开发者习惯的方式,将对资源的REST 请求转换成一种类似QL的请求,对于面向资源性的架构体系来说是十分有利的。
同时对于API 来说,使用者会更加自然的去采用连接和过滤得方式得到需要的数据。
QL解释引擎负责对于TBQL的翻译工作,数据存储的MetaData保存在数据库中,可以指导QL解释引擎翻译。
需要支持不同数据来源的连接和过滤,在获得结果以后需要做格式转换返回给服务调用者(通常就是xml)。
与容器一样,需要着重考虑安全性问题,对于传统的SQL注入就是典型攻击QL系统的案例,需要谨慎处理解析中对于字符的翻译工作。
在流程中出现异常,需要制定策略来判断是否直接返回错误还是支持部分容错。
TOPID组件
TOPID组件有点类似于Facebook的Connect,需要在淘宝和淘宝的合作开发者之间建立起双向的用户互通的标准和流程,同时也为服务互通打好基础,毕竟业务的互动需要基于可以互通的用户体系。
总结
以上仅仅只是简单的罗列了一下TOP技术体系架构中的一些组件化的内容,同时在这些组件的背后有着更多的基础性项目的支持,例如统一配置中心对于系统动态扩容的支持,分布式缓存对于监控告警的支持,分布式文件系统对于海量小文件保存和获取的支持等等。
同时以上每一个模块都有各自特殊的定制和优化,例如路由模块就需要有Lazy的服务参数解析模式来提高处理性能,安全体系中需要有动态密钥机制来保证高安全性等等。
TOP从萌芽走向成熟,不论从技术架构还是商业规划都处于不断摸索和改进的过程,当前的技术体系仅仅是现阶段的一个需求缩影,未来在市场不断成熟,开发者不断介入和反馈的情况下,TOP会走得更快更远,TOP的“兵器谱”会更加丰富,更加出彩。