CloudFabric云数据中心网解决方案-ZTP设计指南

合集下载

Cloud Fabric数据中心基础网络方案设计-基于CSS

Cloud Fabric数据中心基础网络方案设计-基于CSS

HUAWEI TECHNOLOGIES CO., LTD.
华为保密信息,未经授权禁止扩散
Page 8
数据中心网络架构设计-二层架构
核心层
接入层服务器 存储来自TOREOR/MOR

典型数据中心内网架构
层次化架构
可靠性高:汇聚区设备独立,采用冗余设计,避免单点故障。 易于扩展:易于模块化设计,汇聚区间相对独立,易于业务扩展、故障隔离和故障
HUAWEI TECHNOLOGIES CO., LTD.
华为保密信息,未经授权禁止扩散
Page 13
企业数据中心典型分区
接入区
园区/分支机构 WAN
同城/异地灾备中心
外部用户 移动办公
合作伙伴
MAN DWDM
Internet
Extranet
Intranet 接入区
数据中心 互联区
Internet 接入区 DMZ
OAM AAA
L2/L3设计
应用支撑系统
分区
路由 DNS IP规划 可靠性
数据中心互联
数据中心灾备
数据中心网络专项方案
数据中心接入
数据中心安全
统一管理运维
本胶片涉及范围
HUAWEI TECHNOLOGIES CO., LTD.
华为保密信息,未经授权禁止扩散
Page 4
目录
数据中心网络设计方法 数据中心总体架构设计
华为保密信息,未经授权禁止扩散
Page 14
政府行业数据中心典型业务
公众/个人用户
公司用户/ 业务服务单位
政务关联部门
体系内政务用户
Internet
外网业务
Internet门户/政府服务网站 前端Web

CloudFabric云数据中心网解决方案-计算联动设计指南

CloudFabric云数据中心网解决方案-计算联动设计指南

CloudFabric云数据中心网解决方案设计指南(计算联动)目录1 什么是网络虚拟化 (1)2 设计计算联动业务类型的SDN数据中心 (2)2.1 计算联动业务简介 (2)2.1.1 什么是计算联动 (2)2.1.2 计算联动方案概览 (3)2.2 计算联动方案设计 (4)2.2.1 方案架构 (4)2.2.2 业务模型介绍 (6)2.2.3 业务发放流程 (6)2.2.3.1 业务发放流程概览 (6)2.2.3.2 网络资源发放过程 (7)2.2.3.3 计算资源发放过程 (8)2.2.4 选择Network Overlay组网类型 (12)3 方案选择与特点 (14)4 参考图片 (15)1 什么是网络虚拟化网络虚拟化,一般意义上的概念是指将物理网络资源通过某种虚拟化技术,虚拟成逻辑网络资源,以提供更加灵活的网络资源调配和供给能力。

Overlay、MPLS、VPN、VLAN、Virtual router、VRF等都可以认为是网络虚拟化的某种表现形式。

新兴的网络虚拟化认为,应用本身无需关心传统意义上的网络信息和配置,比如路由协议等,这些由网络虚拟层来提供。

底层的硬件就提供转发功能,很多复杂配置由网络虚拟层来托管,和计算虚拟化类似。

另外,网络虚拟化还提供网络功能的可编程能力。

本文中提到的“网络虚拟化”,是CloudFabric云数据中心网解决方案中定义的一个场景大类,和“云网一体化”相对。

在此场景中,没有云平台的直接参与,其特点是网络业务和计算业务相互间的协同需要通过其他业务流来协同,网络管理员和计算管理员通过协同来完成新业务的部署或调整。

CloudFabric解决方案中的网络虚拟化场景又细分为机架出租子场景和计算联动子场景:●机架出租:包含iMaster NCE-Fabric控制器和网络,不含云平台,也不和虚拟机管理平台联动。

网络管理员通过iMaster NCE-Fabric提供的单独管理界面来实现对网络的统一管理。

iMaster NCE-Fabric数据中心网解决方案及应用

iMaster NCE-Fabric数据中心网解决方案及应用

20%
运维精力
网络工程师用于检查和验证网络时间占比70% 因路由变更消耗的时间占比约30% 消耗20%运维精力校验网络连通性、路由配置及变更
典型举例1:【路由配置故障】新配置1条路由,导致原有路由被激活,形成路由环路
设备已有静态路由如下,到达10.200.0.0/21有2条静态路由, 其中,10.17.43.21不可达 ip route-static 10.200.0.0 255.255.248.0 10.17.43.21 ip route-static 10.200.0.0 255.255.248.0 10.17.43.28 现配置1条静态路由如下: ip route-static 10.17.0.0 255.255.0.0 10.17.43.33 新配置的路由使用10.17.43.21可达,下一跳为10.17.43.33,导致形成路由环路
提供数据中心网络全生命生期极简自动化体验 北向抽象网络资源和服务,南向适配不同设备和网络实现
网络E2E自动部署,部署“零”等待
极速网络发放:图形化拖拽式操作,极简业务逻辑,部署效率 是业界3倍
极速容器上线:容器上线10K/min,业界领先性能 多云互联:MDC统一编排,多DC互通自动化
变更风险预评估,配置“零”差错
华为iMaster NCE全新启航(运营商版)
数据中心 NCE-Fabric *
NEW
企业园区 NCE-Campus *
SD-WAN NCE-WAN *
家庭宽带
NCE-FAN
广域传输
NCE-T
广域IP
NCE-IP
跨域
NCE-Super
iMaster NCE-Fabric提供数据中心网络全生命周期管控的极简体验

HiSec CloudFabric解决方案技术白皮书

HiSec CloudFabric解决方案技术白皮书

HiSec@CloudFabric解决方案技术白皮书目录1 方案背景 (1)1.1 云安全风险分析 (1)1.2 云计算业务特点与业务需求 (1)1.3 安全需求总结 (2)1.4 方案价值 (2)2 方案概述 (3)2.1 方案架构 (3)3 方案介绍 (5)3.1 安全服务化 (5)3.1.1 方案概述 (5)3.1.2 方案设计 (5)3.1.2.1 方案架构 (5)3.1.2.2 安全资源池 (7)3.1.2.3 租户级安全服务 (8)3.1.2.3.1 业务链编排 (8)3.1.2.3.2 V AS服务类型 (11)3.1.2.3.3 V AS服务使用场景 (11)3.2 网安一体化联动方案 (13)3.2.1 方案概述 (13)3.2.2 数据采集 (14)3.2.3 威胁检测 (16)3.2.3.1 WEB异常检测原理 (17)3.2.3.2 邮件异常检测原理 (17)3.2.3.3 C&C异常检测原理 (17)3.2.3.4 流量基线异常检测原理 (17)3.2.3.5 隐蔽通道异常检测原理 (18)3.2.3.6 恶意文件检测原理 (18)3.2.3.7 关联分析原理 (18)3.2.3.8 威胁判定原理 (19)3.2.3.9 云端威胁情报 (19)3.2.4 联动闭环 (19)3.2.4.1 保护网段 (19)3.2.4.2 威胁闭环 (19)3.2.4.2.1 主机隔离 (20)3.2.4.2.2 基于IP阻断 (20)4 典型部署场景 (21)4.1 网安一体联动典型部署场景 (21)4.2 网安一体联动(软件墙)典型部署场景 (22)1方案背景1.1 云安全风险分析1.2 云计算业务特点与业务需求1.3 安全需求总结1.4 方案价值1.1 云安全风险分析虽然云计算给用户提供了一种新型的计算、网络、存储环境,但是在系统和应用上提供的服务等方面却并未发生革命性的改变。

云数据中心项目方案建议书

云数据中心项目方案建议书

云数据中心项目方案建议书一、项目背景随着信息技术的飞速发展,企业对于数据处理和存储的需求呈指数级增长。

传统的数据中心已经难以满足企业日益增长的业务需求,云数据中心作为一种创新的解决方案,凭借其强大的计算能力、弹性扩展、高可用性和成本效益等优势,逐渐成为企业数字化转型的核心基础设施。

为了满足企业的业务发展需求,提高数据处理和存储的效率,降低运营成本,提升竞争力,我们提出了云数据中心项目方案。

二、项目目标1、构建一个高效、稳定、安全的云数据中心,满足企业当前和未来业务发展的需求。

2、实现资源的弹性扩展,根据业务负载动态调整计算、存储和网络资源。

3、提高数据的安全性和可靠性,确保数据的备份和恢复能力。

4、降低运营成本,通过资源优化和自动化管理提高效率。

三、项目需求分析1、计算资源需求根据企业业务系统的类型和规模,预估所需的 CPU 核心数、内存容量和 GPU 加速卡等计算资源。

考虑业务的增长趋势,预留一定的计算资源扩展空间。

2、存储资源需求分析企业数据的类型(结构化、非结构化)和规模,确定所需的存储容量。

考虑数据的访问频率和性能要求,选择合适的存储介质(如 SSD、HDD)和存储架构(如分布式存储、集中式存储)。

3、网络资源需求评估企业内部和外部的网络流量,确定网络带宽需求。

考虑网络的可靠性和低延迟要求,设计合适的网络拓扑结构和网络设备配置。

4、安全需求制定数据安全策略,包括访问控制、数据加密、身份认证等。

部署安全设备和软件,如防火墙、入侵检测系统、防病毒软件等。

5、管理需求建立统一的管理平台,实现对云数据中心资源的集中监控、管理和配置。

提供自动化的运维工具,提高运维效率,降低人为错误。

四、项目技术方案1、云计算平台选择对市场上主流的云计算平台(如亚马逊 AWS、微软 Azure、阿里云、腾讯云等)进行评估和比较。

根据企业的业务需求、技术实力和预算,选择合适的云计算平台。

2、计算资源架构采用虚拟化技术(如 VMware、KVM)构建服务器虚拟化环境,提高服务器资源利用率。

CloudFabric云数据中心网解决方案-机架出租设计指南

CloudFabric云数据中心网解决方案-机架出租设计指南

CloudFabric云数据中心网解决方案设计指南(机架出租)目录1 机架出租场景分析 (1)1.1 什么是机架出租 (1)1.2 应用场景分析 (2)2 机架出租方案设计 (4)2.1 方案概览 (4)2.2 组网方案 (6)2.2.1 物理组网方案 (6)2.2.2 Underlay路由设计 (8)2.2.3 部署方案 (11)2.3 业务网络方案设计 (12)2.3.1 租户自带网关场景方案设计 (17)2.3.1.1 单机房租用 (17)2.3.1.2 跨机房租用 (22)2.3.2 租用ISP网关场景方案设计 (27)2.3.2.1 单机房租用 (27)2.3.2.2 跨机房租用 (31)2.4 机架出租业务编排发放 (34)2.5 运维 (35)2.5.1 三网互视 (35)2.5.2 环路检测 (38)2.5.3 业务拨测 (40)A 参考图片 ...................................................................................... E rror! Bookmark not defined.1 机架出租场景分析1.1 什么是机架出租1.2 应用场景分析1.1 什么是机架出租机架出租从字面上理解是将机架资源出租给用户,展开来讲,被出租的资源不只是机架,还有机房、主机,除了物理资源还有安全、负载均衡、公网IP地址、接入带宽等增值服务,出租方以运营商为主,还有一些专业ISP企业。

机架出租的租户主要分布在互联网、制造业、政府、教育等行业。

机架出租业务又被分为以下几类:⚫机房出租:IDC服务商将建设好的数据中心机房整体出租给客户使用。

用户放置自备的网络设备和服务器等,管理和配置多由用户独立完成;⚫机架出租:客户租用机架的一部分空间或者整个、数个机架存放网络设备和服务器,并且租用数据中心的网络资源以及其他配套设施;⚫主机出租:IDC服务商出租服务器“使用权”而非“裸机产权”,为用户解决服务器购置、安全维护方面的巨额投入问题⚫带宽/公网IP出租:为用户在IDC的IT设备提供互联网接入、公网固定IP地址服务,带宽分为共享型和独享型,需要与主机托管、机房出租等业务组合;⚫V AS服务:在前面的业务基础上,IDC服务商为租户的数据业务提供安全、负载均衡、防病毒等增值服务。

CloudFabric云数据中心网解决方案

CloudFabric云数据中心网解决方案

中国农业银行是中国首家 商业银行,世界五百强。 CloudFabric助力业务系统 全面升级,高性能大带宽 网络满足三大数据中心、 五大业务处理中心、两万 多营业网点、数十万员工 的互联需求。
EVRY是挪威第一、北 欧第二大IT服务提供商; 4K+10GE 服务器 /POD, 14000+ 租户; 面向应用的网络自动 化,支撑业务快速上线 与百万级业务策略动态 调整。
CloudFabric 云数据中心网解决方案
华为迈入2017 Gartner数据中心网络魔力象限挑战者
Why CloudFabric?
随着企业数字化转型的深入,数据中心承载着企业的核心业务和关键数 据,已成为企业最重要的IT设施。然而,过时的数据中心网络架构面临 着如下挑战:
某ISP厂商:业务快速扩张,急需新增 1000台服务器并在1天内上线;依靠手 工部署需要7天,网络部门一筹莫展。
FW
IPS
LB
NAT
业务链
终端组
WEB
A APP
DB
全网应用流健康度监控,路径质量可视
app21 app19
From: app 9 To: app 19 Health: 40 ( buffer error )
app14 app9 app5
app1 app1
app5
app9
app14 app19 app21
缩短业务上线周期 数周=》数分钟
VPC
行业云 DCI专线
手机银行 网上银行 移动支付
自动部署
基于业务视角定义网络, 自动网络编排与策略部署
提升故障定位速度 2小时=》1分钟
精细运维
端到端业务质量检测, 分钟级故障定位
提高资源利用率 25%=》60%

云计算数据中心网络建设方案设计

云计算数据中心网络建设方案设计

云计算数据中心网络建设方案设计在当今数字化的时代,云计算已经成为企业和组织实现高效计算、存储和数据处理的关键技术。

而云计算数据中心网络作为云计算的基础设施,其建设方案的设计至关重要。

一个良好的云计算数据中心网络能够提供高带宽、低延迟、高可靠性和安全性,以满足日益增长的业务需求。

一、需求分析在设计云计算数据中心网络之前,我们首先需要对业务需求进行详细的分析。

这包括预估未来的数据流量增长、业务应用的类型和性能要求、用户的分布和访问模式等。

例如,如果数据中心主要承载大规模的视频流媒体服务,那么就需要高带宽和低延迟的网络来确保流畅的播放体验;如果是面向金融交易等对安全性和可靠性要求极高的业务,网络的容错能力和数据加密机制就显得尤为重要。

同时,还需要考虑数据中心的规模和扩展性。

随着业务的发展,数据中心可能需要不断扩充服务器和存储设备,网络架构应该能够轻松支持这种扩展,避免出现性能瓶颈或架构的重大调整。

二、网络拓扑结构选择常见的云计算数据中心网络拓扑结构有三层架构(核心层、汇聚层和接入层)和叶脊架构(LeafSpine)。

三层架构是传统的数据中心网络架构,核心层负责高速数据交换,汇聚层连接核心层和接入层,接入层则连接服务器和存储设备。

这种架构相对成熟,成本较低,但在面对大规模数据流量和复杂的业务需求时,可能会出现性能瓶颈和扩展性问题。

叶脊架构则是近年来兴起的一种架构,它由叶交换机(Leaf Switch)和脊交换机(Spine Switch)组成。

叶交换机直接连接服务器和存储设备,脊交换机则负责叶交换机之间的高速连接。

这种架构具有更高的带宽、更低的延迟和更好的扩展性,适合大规模的云计算数据中心。

在实际选择时,需要根据数据中心的规模、业务需求和预算等因素进行综合考虑。

对于中小型数据中心,三层架构可能是一个经济实惠的选择;而对于大型或超大型数据中心,叶脊架构则更能满足性能和扩展性的要求。

三、网络设备选型网络设备的选型直接影响到网络的性能和可靠性。

CloudFabric云数据中心网解决方案-ZTP设计指南

CloudFabric云数据中心网解决方案-ZTP设计指南

CloudFabric云数据中心网解决方案设计指南(ZTP)目录1 Why ZTP (1)2 方案概述 (2)2.1 ZTP组网 (2)2.2 场景分类 (4)2.3 流程概览 (4)2.4 实现原理 (6)3 ZTP介绍 (11)3.1 开局文件 (11)3.2 开局准备 (13)3.3 ZTP开局 (13)3.3.1 DHCP/SFTP服务器部署 (14)3.3.2 经典配置规划&自定义规划导入模式 (15)3.3.3 配置模板&配置文件 (20)3.4 ZTP扩容&设备替换 (23)3.4.1 ZTP扩容 (23)3.4.2 ZTP设备替换 (25)3.5 Overlay组网 (26)A 参考图片 ......................................................................................................... 错误!未定义书签。

1 Why ZTP在新建数据中心场景,主要困难在于接入交换机设备数量极大,如果这些设备均通过人工手动配置则非常容易出错,且出错后很难排查具体错误位置,进而导致数据中心业务上线延期。

在扩容数据中心场景,则可能因为配置不当而影响已经部署的业务。

针对这种设备大规模部署场景,产生了ZTP(ZTP,Zero Touch Provisioning)零配置开局技术,实现批量、自动化地为交换机下发设备程序及设备启动文件,优化开局部署流程,加快业务上线速度。

零配置开局功能可以提高设备部署、日常维护和故障处理的效率,降低人力成本。

当设备规划完成后,无需网络管理员到安装现场对设备进行软件调试,在设备空配置的情况下,设备上电后即可自动连接到指定的管理设备,加载指定的配置文件、设备软件大包、license文件等系统文件,实现设备快速部署。

iMaster NCE-Fabric实现CloudEngine系列交换机设备零配置部署,提供以下亮点特性:●即插即用●批量上线●开放可定制●设备上线可视化●设备证书认证接入高安全●链路校验减少连接错误2 方案概述2.1 ZTP组网2.2 场景分类2.3 流程概览2.4 实现原理2.1 ZTP组网CloudFabric数据中心物理组网采用Spine-Leaf架构,支持横向按需扩容,组网中包含的角色有Spine、Server Leaf、Border Leaf、Service Leaf、DCI-Gateway。

华为数据中心云化解决方案概述说明书

华为数据中心云化解决方案概述说明书

[Product Overview][Product Description]With continuous development and commercial use of technologies such as cloud computing, big data, and artificial intelligence, enterprise are deepening their digital transformation, covering various business forms including office, production, and testing. Traditional data centers can no longer catch up with development, and cloud-based transformation has become an inevitable trend. However, the current data center cloudification solutions in the industry focus on "Resource virtualization and resource utilization improvement" and "Automatic deployment and cloud-based strategies", and on the other hand overlook network management difficulties and challenges brought by the data center scale and traffic surge. Traditional manual O&M cannot effectively deal with complex application migration policies, unstable service experience quality, difficult fault locating, and large-scale security policy management. Huawei data center network analyzer FabricInsight abandons the resourcestatus-based traditional monitoring mode. It detects fabric and application status in real time, streamlines networks and applications, monitors networks from the perspective ofapplications, helps customers detect network and application problems in a timelymanner, and ensures continuous and stable application running. [Key Components]FabricInsight provides second-level collection of real flow on the entire network in Telemetry mode, analyzes and displays network data based on the big data intelligent algorithms, and provides northbound APIs to interconnect with upper-layer applicationsystems.FabricInsight is a data center network analyzer launched by Huawei. It provides ubiquitous network application analysis and visualization functions to streamline applications and networks.Based on the big data analysis technology, FabricInsight collects massive real service packets through the Telemetry, provides correlation analysisbetween internal applications and networks of the data center, and displays the application map and network quality in real time, helping customers quickly identify fault and proactively identify risks before services are affected.[Benefits]Mutual visibility between applications and networks, facilitating second-level fault identification●Second-level display of service flows and network-wide KPIs through Telemetry●Analysis of correlation between services, network paths, and network devices, visualizing network health statusTraining the knowledge inference engine using AI, achieving minute-level fault locating●Training the knowledge inference engine using machine learning, supporting minute-level root cause diagnosis for75 types of faults●Millisecond-level detection of historical microbursts, and accurate fault playbackPredictive maintenance using AI●Dynamic baseline construction based on ML/AI and identification of issues at the device, queue, and port levels●Proactively predicting traffic or optical module faults, reducing the fault rate by up to 68%[Key Features]DashBoard: multi-dimensional data analysis and graphical displayFabricInsight provides multi-dimensional Top N statistical views for hosts, applications, sessions and fabrics to help users detect network quality through multi-dimensional analysis.Management of mutual access relationship between applications (ADM) and visualization of network policiesFabricInsight provides an application view, which can intuitively display the actual interaction relationships between services based on the network-wide real service flows. When a new service goes online, the network administrator can sort out the service relationship and complete the policy configuration based on the network-wide application associationmap. In addition, the network administrator can quickly detect non-compliant access and traffic and take related measures.Mutual visibility between applications and networks for quick fault analysis and demarcation FabricInsight provides the intra-application visibility function. In the application details view, you can view the nodes with abnormal interaction to locate performance problems and analyze specific bottlenecks through the association with networks. In addition, FabricInsight provides the function of collecting statistics on and filtering abnormal events for users to quickly focus on abnormal events and quickly identify the service network health in the application based on the interaction diagram and heatmap of clusters in the application.Live-network quality evaluation, visualizing network abnormalitiesFabricInsight provides the network view, performs intelligent analysis of TCP flow status and detects abnormal flows based on big data, displays network quality in real time through indicators such as delay and traffic, and quickly identifies and analyzes abnormal flows on the network.In addition, FabricInsight supports network change visualization. By comparing device configuration changes using snapshots, FabricInsight can quickly identify network changes such as Up Route, BD, Static Route, Dynamic Route, Host Route, Gateway Route, MAC, ARP, VRF, and Running Config.Network exception detection based on dynamic baselines and intelligent identification of service changesFabricInsight collects statistics on metrics of devices, boards, queues, and interfaces in real time based on the GRPC, displays the top ranking of metrics in the area distribution chart, and displays the trend chart of top 5 metrics in real time.Based on machine learning algorithms, FabricInsight displays the dynamic baseline range of each metric to quickly locate the time point when the baseline exception occurs and proactively identify faults before service interruption. In addition, FabricInsight automatically associates exception points with the affected service flows. You can view data such asconnection setup failure flow behavior on the device at the exception time point.Predictive maintenance using machine learning, effectively reducing the network fault rate FabricInsight provides the capability to predict faults of optical modules. Based on the Big Data and machine learning algorithms, FabricInsight can detect optical module faults and predict the optical module faulty probability to identifyabnormal optical modules before services are affected. In addition, FabricInsight displays basic attributes of opticalmodules on the entire network and the trend of optical module metrics in the last 14 days. Users can evaluate the deterioration of optical modules based on the data to better troubleshoot faults.In addition, FabricInsight supports traffic forecast based on the RX and TX bandwidth utilization of interfaces, and displays the traffic prediction results for the next 12 weeks.Training the knowledge inference engine using AI, achieving minute-level locating for 75 types of faultsFabricInsight continuously conducts fault drills in Huawei, sorts out 75 types of faults (7 categories in total) based on Huawei's 30+ O M experience and network fault scenarios of 7800+ data center customers, and builds the knowledge inference engine using AI automatic learning and training results to improve the system immunity.From the service aspects, FabricInsight summarizes faults as typical application quality, network service, and security compliance issues for intelligent recognition and analysis of service faults, helping O&M personnel analyze the impact and quickly rectify faults.Application quality issuesFabricInsight can intelligently detect and analyze the following issues: continuous service interruption, intermittent service interruption, and host ports not listened. Based on the IP triplet, FabricInsight can identify services with abnormal TCP connection setup on the network, enabling users to quickly view active and historical issues and affected sessions, hosts, and applications. In addition, FabricInsight can analyze the abnormal event trend and network-wide connection setup information, helping users quickly collect and analyze issues.For abnormal events, FabricInsight collects data such as service flow paths, device configurations, entries, and abnormal logs, generates network snapshots, and rectifies faults based on knowledge inference, helping locate rootcauses in minutes.Network service issuesFabricInsight can proactively check whether the entry resource usage of the network device forwarding plane on thefabric is abnormal. The issues include the following: TCAM resource insufficiency, insufficiency or abrupt changes ofFIB, ARP, and MAC address entry resources. FabricInsight can locate such an issue to the specific board, chip, andresource type.Security compliance issuesFabricInsight can quickly detect security compliance issues and proactively identify potential non-compliant traffic interactions, suspicious SYN flood attacks, and suspicious port scanning attacks. FabricInsight comprehensively analyzes related data to identify the location of the suspicious attack source, analyzes the attack impact on the targethost, and helps users audit non-compliant traffic.specified flowsBased on the intelligent switch chip, FabricInsight provides edge intelligence and can comprehensively analyze UDP/TCP flows as required. The intelligent chip obtains and analyzes all the flows passing through the VM passes through in real time, including flow characteristics, packet loss, RTT delay, and traffic, and reports the analysis result to FabricInsight. Compared with reporting raw data, reporting analyzed data reduces the data volume by 99%, greatly reducing the impact on the analysis server. In addition, FabricInsight correlates and analyzes the data of the application network, network paths and network devices, compares the path delay hop by hop, and locates the packet loss point in minutes.Comprehensive RoCE flow analysis and AI-based Fabric visualizationFor distributed storage, HPC, and AI networking scenarios in data centers, FabricInsight supports RoCE flow analysis and collects session statistics based on the source IP address, source QP, destination IP address, and destination QP. In this manner, users can view KPI details such as the number of packet loss events, RTT, read throughput, and write throughput of a single session in the source and destination directions and the multi-dimensional trend.[Product Components]FabricInsight consists of the basic package and value-added package based on functions and features. The following table describes the Telemetry network analysis functions of the basic package.The following table describes the service flow analysis functions provided by the value-added package of intelligent flow analysis.[Operating Environment]FabricInsight supports hardware configurations of physical servers and VMs. To avoid unexpected problems, configure the system according to the following software and hardware configuration requirements.[Deployment Scenarios]The supported networks are as follows:●Hardware-centralized gateway networking ●Hardware-distributed gateway networkingPure IP networking (Host Overlay)Remarks:(1) The underlay network is based on IP forwarding.(2) SVF networking is not supported.(3) IP address overlapping scenarios (for example, multi-tenant and VPC scenarios) are not supported.(4) Other networking modes such as traditional layer-2 networking (including the VLAN and STP), TRILL networking,and MPLS VPN are not supported.[Ordering Information]FabricInsight can provide a 180-day trial license. You can obtain the license from Huawei local sales department.MoreFor more information about the Huawei FabricInsight, visit All other holders.。

最全云计算平台设计方案

最全云计算平台设计方案

最全云计算平台设计方案云计算平台设计方案:云计算平台设计方案是一个全面的、灵活的和可扩展的解决方案,旨在提供稳定、高效、安全、可靠和可伸缩的云计算环境。

下面是一个最全的云计算平台设计方案,包含以下几个关键方面:1.基础架构设计:-选择合适的硬件和网络设备,以支持云计算平台的高负载和高可用性需求;-云计算平台的基础架构应具备弹性,以便在需要时自动调整资源,提供可靠的性能。

2.虚拟化技术:-使用虚拟化技术来提供云计算平台的资源池管理,以实现服务器资源的最佳利用;- 选择合适的虚拟化平台,如VMware、KVM或Hyper-V。

3.存储架构设计:-选择合适的存储解决方案,如网络附加存储(NAS)或存储区域网络(SAN),以满足对存储容量和性能的需求;-使用冗余存储和数据备份策略来确保数据的可靠性和容灾能力。

4.网络设计:-设计云计算平台的网络架构,包括虚拟网络和外部网络的连通性;-使用负载均衡和故障转移技术来提高网络的性能和可用性;-提供安全的网络连接,使用防火墙、VPN和安全加密协议来保护数据的安全性。

5.安全管理:-在平台级别实施安全策略,包括身份验证、授权和访问控制;-使用防火墙、入侵检测系统(IDS)和入侵防御系统(IPS)来保护云计算平台免受网络攻击。

6.自动化和编排:-使用自动化工具和编排技术来实现资源自动分配和管理,提高运维效率;-使用预测性分析和智能控制算法来优化资源利用率和性能。

7.监控和故障排除:-实施监控平台来监测云计算平台的健康状况和性能;-使用日志分析和故障排除工具来快速识别和解决问题,以减少系统停机时间。

8.弹性扩展:-提供自动扩展功能,以根据负载需求动态添加或移除计算或存储资源;- 使用容器技术(如Docker)来实现弹性扩展并提高应用程序的灵活性。

9.数据备份和恢复:-实施合适的备份和恢复策略来保护云计算平台上的数据,包括定期备份和远程数据复制;-使用快照和增量备份技术来减少备份时间和存储空间。

云计算中的数据中心设计与规划

云计算中的数据中心设计与规划

云计算中的数据中心设计与规划随着云计算的迅猛发展,越来越多的企业开始意识到数据中心的重要性。

一个高效可靠的数据中心设计与规划对于实现云计算的目标至关重要。

本文将探讨云计算中的数据中心设计与规划,以及其中的关键要素。

一、数据中心的重要性在云计算时代,数据中心是企业存储、处理和传输数据的核心枢纽。

它不仅是云计算平台的基础设施,也是保证云服务稳定性和可靠性的基石。

一个优秀的数据中心设计可以提高整体资源利用率,降低成本,提升服务质量,增加可扩展性。

二、数据中心设计的关键要素1. 网络架构设计:数据中心的网络架构设计是保证云服务高效运行的基础。

应该采用高负载容量、高可用性、低延迟的网络设备和连接方式,并且根据实际需求灵活调整网络拓扑结构。

2. 服务器硬件配置:服务器硬件配置是数据中心设计中的关键环节。

应该选择高性能的服务器硬件,包括处理器、内存、存储和网络适配器等。

同时,还需要进行合理的负载均衡和容灾设计,确保数据中心的高可用性和容错能力。

3. 数据存储与备份:数据中心存储设计需要考虑数据的安全性和可扩展性。

应该采用分布式存储系统,保证数据的高可靠性和可用性。

此外,还需要设计合理的数据备份机制,以应对数据丢失和灾难恢复的情况。

4. 能源管理与节能设计:数据中心的能源管理和节能设计对于降低运营成本和减少环境负荷至关重要。

应该选择高效节能的服务器设备和冷却系统,并且进行合理的温度控制和能源消耗监测,以实现数据中心的可持续发展。

5. 安全与监控:数据中心的安全与监控是保护数据安全和保障云服务质量的必备环节。

应该建立完善的物理安全措施和网络安全机制,定期进行安全审计和风险评估。

同时,还需要配备可靠的监控系统,实时监测数据中心的运行状态,并及时发现和解决问题。

三、数据中心规划的重要性数据中心规划是根据业务需求和未来发展规划,对数据中心进行合理布局和扩展规划的过程。

一个科学合理的数据中心规划可以提高数据中心的资源利用效率,降低运营成本,增加数据中心的可扩展性和可靠性。

云数据中心整体规划方案

云数据中心整体规划方案

05
监控与管理:部 署监控和管理系 统,实时监控服 务器和存储设备 的运行状态,及 时发现和解决问 题。
网络设备选型与部署
01
网络设备类型:交 换机、路由器、防 火墙等
02 03 04
网络设备选型原则: 性能、可靠性、可 扩展性等
网络设备部署策略: 分层、分区、冗余 等
网络设备管理:监 控、配置、维护等
NoSQL数据库:如MongoDB、 Cassandra等,适用于非结构化 数据存储和处理
02
数据库备份与恢复:通过定期备 份、快照等技术确保数据安全
04
数据库安全:通过访问控制、加 密等技术确保数据安全
06
应用系统选型与部署
01
应用系统类型:根据业务需求选择合 适的应用系统类型,如ERP、CRM、 OA等。
云数据中心整体规划方案
汇报人:xx
目录
云数据中心建设策 云数据中心基础设 云数据中心平台建 云数据中心运营管

施建设


云数据中心建设策略
确定建设目标与需求
明确云数据中心建 设的目的和意义
评估现有资源和技 术能力,确定建设
方案的可行性
分析业务需求,确 定云数据中心的规
模和功能
制定建设计划,包 括时间表、预算和

选型考虑因素: 功能、性能、兼
容性、成本
部署方式:私有 云、公有云、混
合云
部署步骤:规划、 实施、测试、上
线、维护
数据库系统选型与部署
01
关系型数据库:如MySQL、 Oracle等,适用于结构化数据存 储和处理
03
数据库集群:通过主从复制、分 片等技术实现高可用性和可扩展 性

基于云计算的数据中心网络设计

基于云计算的数据中心网络设计

基于云计算的数据中心网络设计一、简介随着大数据时代的到来,数据中心网络的可靠性、可扩展性及灵活性已成为机构和企业不可避免的难题。

云计算作为当前主流的一种计算模式,为数据中心网络的设计提供了新的思路和技术支持。

本文将重点介绍基于云计算的数据中心网络设计方案。

二、云计算及其应用云计算指的是以云为基础的可编程和跨越网络的计算资源池,可通过互联网快速失效,按需访问一种计算模式。

它具有简单易用、按需使用、快速的扩展和高可靠性等优点。

目前已经被广泛应用于各大企业、政府机构以及科研机构之中,大幅度提高了其计算效率和业务水平。

三、数据中心网络的关键问题数据中心网络在规划和设计时,需要考虑以下几个关键问题:1. 数据中心网络规模数据中心网络的规模是决定网络设计的主要因素之一。

一般而言,网络规模越大,网络设计的难度越大,设计时需要考虑传输性能、可靠性和安全性等问题。

2. 高可靠性的高速数据传输在数据中心网络中,数据传输需要具备高度可靠性。

一旦数据传输发生故障,会影响整个数据中心操作的顺利进行。

为此,网络设计应该充分考虑数据传输的可靠性。

3. 灵活的网络节点对于大规模的数据中心网络,网络节点的设定应该是灵活的。

以便根据网络规模的变化对节点进行动态扩展。

四、基于云计算的数据中心网络设计方案数据中心网络的规划和设计应该以可靠性和可扩展性为主要目标,同时考虑传输性能、安全性等问题。

基于云计算的数据中心网络设计方案应该具有以下几点:1.开放性基于云计算的数据中心网络设计方案应该尽可能采用开源技术和标准,并提供开放式接口,以便于不同的厂商和用户进行互联操作。

2. 动态扩展基于云计算的数据中心网络设计方案应该具有动态扩展的能力,可根据实际业务规模进行灵活的节点扩展操作。

3. 高可靠性基于云计算的数据中心网络设计方案中,可靠性是至关重要的。

网络节点应该设置故障切换机制和备份,保证数据的传输和存储的安全可靠。

4. 网络安全性基于云计算的数据中心网络设计方案,安全性也是不可忽略的因素。

最全的云计算平台设计方案和对策

最全的云计算平台设计方案和对策

最全的云计算平台设计方案和对策云计算平台是一种以网络为基础的计算技术,通过共享资源和数据,并在虚拟化环境下提供可扩展性和可靠性的计算服务。

在设计云计算平台时,需要考虑以下几个方面的因素:架构设计、安全性、可扩展性和可靠性。

一、架构设计在设计云计算平台的架构时,应考虑以下几个因素:1.虚拟化技术:使用虚拟化技术将物理资源进行抽象和隔离,实现资源的共享和动态分配。

常见的虚拟化技术包括服务器虚拟化、存储虚拟化和网络虚拟化。

2.分布式存储:使用分布式文件系统或对象存储技术,将数据分散存储在多个节点上,提高数据的可用性和可靠性。

同时,可以通过数据冗余和数据备份策略来保护数据的安全性和完整性。

3.弹性扩展:设计云计算平台时应考虑到资源需求的不确定性,通过动态扩展和收缩资源来满足不同的负载需求。

可以使用自动化的资源管理工具来实现弹性扩展。

4.多租户支持:云计算平台通常有多个用户同时使用,需要支持多租户隔离和资源控制。

可以使用虚拟化技术或容器化技术来实现用户之间的资源隔离。

二、安全性安全是云计算平台设计中非常重要的方面,以下是几个提高安全性的对策:1.身份认证和访问控制:使用强密码策略、多因素身份认证和访问控制机制,确保只有授权用户能够访问云计算平台。

2.数据加密和隐私保护:对云计算平台中的数据进行加密保护,同时对用户的隐私信息进行保护。

可以采用数据加密算法、密钥管理和数据安全监控技术等手段。

3.安全监控和审计:监控云计算平台的安全漏洞和攻击行为,并进行实时响应和取证分析。

可以使用入侵检测系统、事件管理系统和日志分析工具来提高安全监控和审计能力。

三、可扩展性在设计云计算平台时,应考虑到用户的扩展需求,以下是几个提高可扩展性的对策:1.分布式架构:将云计算平台设计为分布式架构,通过增加节点来扩展系统性能和容量。

可以使用负载均衡和集群管理技术来实现节点的动态管理和资源调度。

2.自动化管理:使用自动化的工具和技术来管理云计算平台的配置、部署和维护。

CloudFabric云数据中心网解决方案-Underlay网络

CloudFabric云数据中心网解决方案-Underlay网络

CloudFabric云数据中心网解决方案设计指南(Underlay网络)目录1 概述 (1)2 数据中心物理网络方案设计 (3)2.1 总体架构 (3)2.1.1 数据中心物理网络概述 (3)2.1.2 数据中心物理网络架构演进 (5)2.1.3 CloudFabric物理网络总体架构 (7)2.2 物理组网设计 (8)2.2.1 CloudFabric标准组网设计 (8)2.2.2 CloudFabric融合组网设计 (10)2.2.3 CloudFabric扩展组网设计 (16)2.2.4 CloudFabric基线组网选型(待版本规格确认后刷新) (19)2.3 路由设计 (25)2.4 接入设计 (30)2.4.1 服务器接入设计 (30)2.4.2 V AS设备接入设计 (33)2.4.2.1 防火墙接入设计 (33)2.4.2.2 负载均衡器接入设计 (36)2.5 出口设计 (39)2.5.1 出口拓扑设计概览 (39)2.5.2 Border Leaf 4个L3接口对接PE(推荐) (40)2.5.3 Border Leaf 2个L3接口对接PE (41)2.5.4 Border Leaf 单L3接口对接PE (42)2.6 管理网络设计 (43)2.6.1 控制器/SecoManager部署设计 (43)2.6.1.1 管理Leaf被纳管(推荐) (43)2.6.1.2 管理Leaf不被纳管 (44)2.6.1.3 控制器/SecoManager部署连线方式 (44)2.6.2 FabricInsight部署设计 (45)2.6.2.1 FabricInsight网络平面规划 (46)2.6.2.2 单Fabric基础组网典型规划 (47)2.7 容量设计 (50)2.8 数据规划 (52)2.8.1 MTU规划 (52)2.8.2 VLAN规划 (53)2.8.3 IP规划 (54)2.8.3.1 IPv4地址规划 (54)2.8.3.2 IPv6地址规划 (56)3 数据中心物理网络可靠性设计 (60)3.1 高可靠设计综述 (60)3.2 Border Leaf高可靠设计 (61)3.3 Spine高可靠设计 (62)3.4 Server Leaf高可靠设计 (63)3.5 防火墙高可靠设计 (64)A 参考图片 (65)1 概述随着行业数字化转型加速,企业数据中心云化的要求越来越迫切,云计算逐渐成为各行各业的基本能力,数据中心网络作为构建云数据中心的基石面临很大的挑战。

云数据中心网络架构安全设计建议

云数据中心网络架构安全设计建议

云数据中心网络架构安全设计建议作者:翁叶峰来源:《信息化建设》2022年第06期从云数据中心的云网络架构设计、南北向流量控制、东西向流量控制等三个维度出发进行云架构安全的总体规划,保证数据中心在网络架构上弹性可扩展、业务流量上按需可隔离网络架构安全是云数据中心的基石,只有云网络架构设计合理,南北向、东西向流量控制得当,才能按照《信息安全技术網络安全等级保护基本要求》(GB/T22239-2019),继续深化上层的安全防护设计,保证数据中心在网络架构上具备弹性可扩展、业务流量上具备按需可隔离的能力。

云网络架构设计传统数据中心建设中,云主机基于虚拟化运行于实体服务器,基础网络为适配云主机产生的业务通讯流量,需要一线运维人员手工介入调整云主机所在VLAN、VPN实例和相应的通信控制策略,存在配置流程繁琐、业务切换时间长、响应延迟度高、扩容性差等问题。

因此,建议基于Overlay技术对现有数据中心进行改造升级。

所谓Overlay网络是指基于现有物理网络虚拟化出来的一套专为业务服务的层叠网络,该网络具有独立的控制和转发平面,对于云主机来说其产生的业务流量仅承载在该虚拟网络中,物理网络是透明不可见的;可以说Overlay网络是物理实体网络向云和虚拟化的深度延伸,使云资源池不仅可以调度虚拟化的CPU、内存、存储资源,也可以对虚拟化的网络资源进行调度,是实现云网融合的关键。

目前实现Overlay网络可基于三种方式:VXLAN、NVGRE和STT。

这三种技术中又以VXLAN的使用效果最佳,其优势有四:一是基于报文重封装技术保证业务可部署于网络任意位置;二是VXLAN采用组播技术进行泛洪流量的转发,通过二层优化技术极大地增加了网络规模的可扩展性;三是Overlay网络流量转发拓扑既可以基于路由控制协议如IS—IS或BGP自学习完成,也可以通过SDN控制器统一调度、下发完成,适用于集中部署;四是基于VXLAN 技术有效解决传统VLAN的4K数量限制,通过扩展的隔离标识位可支持高达16M的用户,轻松实现千万级别租户隔离需求,为数据中心的大规模云业务部署奠定扎实基础。

CloudFabric云数据中心网络解决方案

CloudFabric云数据中心网络解决方案

DC3
36*400GE/100GE 互联
100K+ 10GE/25GE server farm
36*400G LPU (CE12800)
4x 业界平均性能
8*400G LPU (NE9000)
400G LPU (OSN-9800U)
IP + 光 全层次400GE (3x 业界平均性能)
100GE/40GE DLC BIDI 光模块
案例:某零售银行,客户体验要求高,业务永远在线
网络自动化导致 管理黑盒化
传统运维手段失效 故障修复时间>1小时
在线银行业务
现金/投资/理财
云平台
云托管业务
看不见的异常流
274,046 条/天,0.3%
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
VM
1447 VM/BM
VM
VM
VM
VM
VM
VM
VM
VM
华为 CloudFabric 云数据中心解决方案
构建简单、智能、超宽的50%
DC内流量年均增长
10万/DC
5年增长20倍
25GE
GE->10GE->25GE->100GE
海量应用部署和大数据,带来对业务快速上线的挑战以及潜在安全威胁
APP APP
APP
?
Data Center
VM
100% 可 视
0 业务中断
89%↑ 运维效率
耗时76min 21
SDN故障演练时间
43
12 手工操作
耗时8min FabricInsight

CloudFabric云数据中心网解决方案-Multi-PoD设计指南

CloudFabric云数据中心网解决方案-Multi-PoD设计指南

CloudFabric云数据中心网解决方案设计指南(Multi-PoD)目录1 多数据中心业务诉求和场景 (1)1.1 多数据中心业务场景分析 (1)1.1.1 集群跨DC部署 (1)1.1.2 虚机跨DC迁移 (2)1.1.3 网络级主备容灾 (3)1.2 华为Multi-PoD方案整体架构 (4)1.2.1 方案整体架构 (4)1.2.2 部署场景 (7)1.2.3 方案特点 (9)1.2.4 与Multi-Site方案的对比和选择 (10)2 Multi-PoD方案设计 (14)2.1 Multi-PoD方案部署设计 (14)2.2 PoD内组网设计 (16)2.2.1 物理网络架构 (16)2.2.2 物理网络设计基本原则 (18)2.2.3 路由协议设计 (19)2.2.4 故障场景分析 (21)2.3 Multi-PoD对于IP Network的要求 (22)2.4 Multi-PoD –管理面方案 (25)2.5 云平台与VMM对接 (27)2.6 Multi-PoD - Underlay网络方案 (29)2.7 Multi-PoD –Overlay网络方案 (30)2.7.1 Multi-PoD –Overlay控制面方案 (30)2.7.2 Multi-PoD –Overlay数据面方案 (32)2.7.3 网络级容灾-主备出口设计 (32)1 多数据中心业务诉求和场景1.1 多数据中心业务场景分析1.2 华为Multi-PoD方案整体架构1.1 多数据中心业务场景分析随着业务的发展,越来越多的应用部署在数据中心,单个数据中心的规模有限,不可能无限扩容,业务规模的不断增长使得单个数据中心的资源很难满足业务增长的需求,需要多个数据中心来部署业务;同时,数据安全、业务的可靠性和连续性也越来越被重视,备份和容灾逐渐成为了普遍需求,需要通过建设多个数据中心来解决容灾备份问题。

1.1.1 集群跨DC部署对于DB层服务器,以及少量App层服务器,往往采用物理IP直接提供业务,这种模式仅用于数据类应用(CS模式)。

云计算中的数据中心设计与规划

云计算中的数据中心设计与规划

云计算中的数据中心设计与规划云计算作为一种新兴的计算模式,正逐渐改变着现代企业和个人的计算方式。

而在云计算背后,一个庞大的数据中心扮演着关键的角色。

数据中心的设计与规划对于云计算的可靠性、稳定性以及效率至关重要。

本文将探讨云计算中的数据中心设计与规划,从不同的角度来分析其要点和关键因素。

一、数据中心位置的选择在数据中心设计与规划的过程中,选择合适的位置是一个重要的决策。

数据中心的位置应该考虑以下因素:1.网络带宽:数据中心需要充足的网络带宽来满足用户对云服务的需求。

因此,选址时要考虑网络基础设施的覆盖程度和稳定性。

2.自然灾害:数据中心的位置不能位于易受自然灾害影响的地区,如地震、洪水等。

否则,这些灾害可能会导致数据中心的瘫痪,造成巨大的损失。

3.供电和供水:数据中心对电力和水资源的要求很高。

选址时要确保充足可靠的供电和供水条件,以保证数据中心的正常运行。

二、机柜布局和系统组织机柜布局和系统组织是数据中心设计与规划的核心要素。

合理的机柜布局和系统组织能够提高数据中心的可维护性和可扩展性。

1.机柜布局:机柜应该按照一定的规则摆放,以便于设备间的散热和维护。

同时,机柜之间应该保留足够的通道空间,便于技术人员进行设备调试和维修。

2.系统组织:数据中心内应该建立清晰的系统组织结构,确保各个系统之间的协同工作。

例如,计算系统、存储系统和网络系统应该相互配合,形成一个高效的整体。

三、冗余和容错设计冗余和容错设计是确保数据中心高可用性的关键。

在设计和规划数据中心时,应考虑以下方面:1.设备冗余:采用冗余设备,如双路供电、双路网络、双路存储等,以确保设备在某一路线路出现故障时,能够自动切换到备用路线,从而保证服务的连续性。

2.备份和恢复:数据中心应该定期备份重要数据,并建立完整的恢复机制。

在数据中心发生故障时,能够快速恢复服务,降低用户和企业的损失。

四、节能和环保设计云计算的爆发式增长给数据中心的能耗提出了更高的要求。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

CloudFabric云数据中心网解决方案设计指南(ZTP)目录1 Why ZTP (1)2 方案概述 (2)2.1 ZTP组网 (2)2.2 场景分类 (4)2.3 流程概览 (4)2.4 实现原理 (6)3 ZTP介绍 (11)3.1 开局文件 (11)3.2 开局准备 (13)3.3 ZTP开局 (13)3.3.1 DHCP/SFTP服务器部署 (14)3.3.2 经典配置规划&自定义规划导入模式 (15)3.3.3 配置模板&配置文件 (20)3.4 ZTP扩容&设备替换 (23)3.4.1 ZTP扩容 (23)3.4.2 ZTP设备替换 (25)3.5 Overlay组网 (26)A 参考图片 ......................................................................................................... 错误!未定义书签。

1 Why ZTP在新建数据中心场景,主要困难在于接入交换机设备数量极大,如果这些设备均通过人工手动配置则非常容易出错,且出错后很难排查具体错误位置,进而导致数据中心业务上线延期。

在扩容数据中心场景,则可能因为配置不当而影响已经部署的业务。

针对这种设备大规模部署场景,产生了ZTP(ZTP,Zero Touch Provisioning)零配置开局技术,实现批量、自动化地为交换机下发设备程序及设备启动文件,优化开局部署流程,加快业务上线速度。

零配置开局功能可以提高设备部署、日常维护和故障处理的效率,降低人力成本。

当设备规划完成后,无需网络管理员到安装现场对设备进行软件调试,在设备空配置的情况下,设备上电后即可自动连接到指定的管理设备,加载指定的配置文件、设备软件大包、license文件等系统文件,实现设备快速部署。

iMaster NCE-Fabric实现CloudEngine系列交换机设备零配置部署,提供以下亮点特性:●即插即用●批量上线●开放可定制●设备上线可视化●设备证书认证接入高安全●链路校验减少连接错误2 方案概述2.1 ZTP组网2.2 场景分类2.3 流程概览2.4 实现原理2.1 ZTP组网CloudFabric数据中心物理组网采用Spine-Leaf架构,支持横向按需扩容,组网中包含的角色有Spine、Server Leaf、Border Leaf、Service Leaf、DCI-Gateway。

其中ServerLeaf数量众多,对自动化上线的诉求最强烈,因此当前ZTP开局主要聚焦在ServerLeaf上。

Server Leaf节点支持M-LAG、单机组网,适合不同的服务器接入场景,由于服务器M-LAG双归接入可靠性高,而且M-LAG设备各自有独立的控制面,升级维护简单,所以推荐M-LAG方式组网。

CloudFabric解决方案支持如图所示三层组网和二层组网两种架构。

●三层组网架构:Spine与Border Leaf、Service Leaf独立部署,角色分离组网,适合大规模网络场景●二层组网架构:Spine、Border Leaf、Service Leaf三者融合,适合中小规模网络场景ZTP支持CloudFabric解决方案三层组网和二层组网架构场景,支持Underlay IPv4场景对CE设备的ZTP自动化上线,不支持Underlay IPv6场景。

图2-1ZTP三层组网基线组网示意图2-2ZTP二层组网基线组网示意2.2 场景分类ZTP支持CE设备的开局、扩容以及设备替换场景。

ZTP开局新建数据中心或新建POD场景,ZTP支持开局场景,实现自动化版本加载和配置导入,实现设备自动化上线。

ZTP扩容CloudFabric网络支持灵活组网、弹性扩容:当服务器数量增加时,可相应增加ServerLeaf数量;当Spine转发带宽不足时,可相应增加Spine节点个数。

ZTP支持扩容场景,实现扩容设备的自动化上线。

ZTP设备替换当CE设备发生故障或升级更替时,需要进行设备替换操作。

ZTP支持设备替换场景,实现替换设备的自动化上线。

2.3 流程概览在使用ZTP方式进行自动化部署时,分为“带内组网场景”和“带外组网场景”两种,两者的组网方式和开通流程有所差别:●带内组网场景是指开局设备与控制器之间的管理流量和后续的业务流量共用一张网络,共同使用业务网口,没有单独的管理交换机或管理网络。

●带外组网场景是指开局设备与控制器之间的管理网络和业务网络分开部署且需要部署独立管理交换机。

带外管理网又分为带外Meth口管理网和VPN隔离的带外管理网。

两者的区别是管理口的配置不同:−带外Meth口管理网中Meth口绑定设备管理IP−VPN隔离的带外管理网中管理口(Meth口)绑定管理VPN带外组网ZTP开通顺序ZTP带外管理网开通顺序如图所示。

1.手工部署开通:手工部署控制器/DHCP/SFTP服务器(可选),详见“手工部署DHCP/SFTP服务器款型说明”。

2.手工部署开通:带外管理交换机。

3.ZTP自动开通:第1层Spine设备。

4.ZTP自动开通:第2层Server Leaf设备。

5.ZTP自动开通:Server Leaf接入侧端口,通过服务器扩容的意图网络实现(非ZTP范围,参见意图网络设计指南)。

手工部署DHCP/SFTP服务器款型说明:支持控制器内置DHCP/SFTP服务器的设备款型目前包括:CE16800(V2/V3)、CE6881、CE6863、CE8851、CE6866、CE5881,其他CE款型需手工部署第三方DHCP/SFTP服务器。

如果开局款型既有上述支持内置DHCP/SFTP服务器的款型又有其他CE款型的混合场景,则需要部署第三方DHCP/SFTP服务器。

CE16800(V2/V3)、CE6881、CE6863、CE8851、CE6866、CE5881款型除了支持控制器内置DHCP/SFTP服务外,也支持第三方服务器。

图2-3带外组网ZTP开通顺序示意图带内组网ZTP开通顺序图2为ZTP功能带内管理标准组网,iMaster NCE-Fabric对各开局设备的管理流量和后续的业务流量共用一张网络,没有单独的管理网络。

ZTP带内管理网开通顺序如图所示。

1.手工部署开通:手工部署控制器/DHCP/SFTP服务器(可选),详见“手工部署DHCP/SFTP服务器款型说明”。

2.手工部署开通:第1层设备通过手工部署上线,首层设备我们也称为根设备。

3.ZTP自动开通:第2层Spine设备。

4.ZTP自动开通:第3层Server Leaf设备。

5.ZTP自动开通:Server Leaf接入侧端口,通过服务器扩容的意图网络实现(非ZTP范围,参见意图网络设计指南)。

图2-4带内组网ZTP开通顺序示意图2.4 实现原理ZTP作为网络自动化部署的一个服务组件,其总体目标为实现设备underlay配置自动化,设备通过ZTP上线后,可自动被控制器纳管,自动加入到fabric,为overlay业务发放做好充分准备。

设备通过ZTP上线的关键点在于,ZTP程序如何识别零配置上电的设备,将设备的配置文件或网络规划参数精准地推送给该设备。

传统ZTP的方案采用设备的ESN、MAC等唯一信息作为设备身份的唯一索引,虽然也能够实现精准的配置文件或网络规划参数推送,但由于获取和收集设备ESN或MAC的人工操作相对繁琐。

iMaster NCE-Fabric ZTP采用人为规划设备唯一索引的方式来开局,这种自定义索引方式作为设备身份标识更符合用户习惯,也消除对设备ESN号等依赖。

在实际部署过程中,用户可以使用便于规划和管理的信息作为设备唯一索引,例如使用设备物理位置"RoomNum-ShelfNum-FrameNum"作为设备索引。

该唯一索引随拓扑模板导入控制器,由控制器将待开局设备的身份索引配置到已上线设备的互联端口,再由已上线设备的互联口通过LLDP TLV字段通知给对端设备(也就是待上线设备),待上线设备收到该TLV后,将该索引信息写到设备Sysname中。

同时,待上线设备从DHCP Server获取临时IP,向控制器发起建立连接请求,控制器接收到请求后,向设备获取sysname即可识别该设备身份,进而实现精准推送该设备的配置或规划信息。

图2-5通过自定义设备索引方式自动化上线原理下面结合上图进行说明。

首先手工开通第1层Server Leaf设备组,使之成为已上线设备。

然后导入规划拓扑文件,执行ZTP开局,接下来已上线设备和待上线设备都会执行ZTP脚本,已上线设备的Server Leaf设备从控制器获取到与自身相关的拓扑规划信息,获取自己与第2层Spine设备的连接信息,例如:Server LeafA的port 1连接Spine A- Port 1,Server LeafA的Port 2连接Spine B的Port1。

然后Server LeafA的port 1发送LLDP报文携带TLV告知对端设备的索引为Spine A的索引,同样Server LeafA的port 2发送LLDPTLV告知对端设备的索引为Spine B的索引。

Spine A和Spine B设备将LLDP收到的索引信息作为Sysname。

如前所述,ZTP组网大多为Spine-Leaf三层或二层的多层架构,而LLDP一个只能在直联的相邻节点间通信的协议,下一层Server Leaf设备需要依赖上层已上线的Spine设备获取自身索引,身份索引是一个逐级扩散上线过程。

因此,ZTP过程设备需要分层/逐层上线,即Spine层设备先上线,待Spine上线完成后再进行Server Leaf层上线。

另一种场景,如下图所示的带外组网,其中的带外管理交换机不支持运行ZTP脚本无法通过LLDP携带下一层设备身份索引属性,此时我们通过将第1层待上线的Spine设备通过ESN号身份识别,根据ESN号获取配置或规划信息ZTP上线,使第1层设备成为已上线设备,然后第2层Server Leaf设备再通过用户自定义的身份索引自动化上线。

整个过程只有Spine需要输入ESN号,其他设备仍然使用自定义的身份索引。

图2-6带外组网情况下Spine-Leaf身份识别原理接下来,我们以Server Leaf设备上线为例,进一步说明ZTP上线原理。

预置条件:1.管理员按照拓扑规划完成对设备进行上架等物理安装和连线。

2.管理员导入规划拓扑等开局文件,在控制器上执行ZTP开局,Spine设备(第1层)ZTP上线成功,成为已上线设备。

图2-7ZTP上线过程1.ZTP STEP 1:发现阶段:待上线设备上电后,作为DHCP客服端自动发起DHCP DISCOVER广播请求报文寻找DHCP Server服务器;提供阶段:DHCP服务器从地址池选择一个IP地址,通过DHCP OFFER报文发送给DHCP用户端;选择阶段:如果有多台DHCP服务器向DHCP用户端回应DHCP OFFER报文,则DHCP用户端只接收第一个收到的DHCP OFFER报文。

相关文档
最新文档