FusionCompute平台日常维护指南
FusionCompute运维故障处理指南
主机故障案例-添加主机失败
收集 • 在FusionCompute界面上添加主机失败 信息
定位 故障
• VRM与CNA节点网络链路不通
• 添加主机失败后,主机上可能残留网络配置数据,导致再次添加主机 失败
排除
• 检查VRM与故障CNA节点网络连接 • 删除故障CNA节点残留网络数据
故障
检查
• 告警消失 • 业务正常
收集 • FusionCompute服务异常,无法重新启动VRM虚拟机 信息
定位 故障
• 在FusionCompute中对VRM虚拟机执行关机操作 • 在VRM虚拟机上执行关机命令 • VRM操作系统异常引发VRM自动关机
排除 故障
• 使用“PuTTY”,登录VRM节点所在主机 • 切换至“root”用户: su - root • 查找VRM虚拟机id: ll /etc/galax/eucalyptus • 启动虚拟机: /opt/galax/NCclient ncStartInstances 虚拟机ID
确认
第12页
系统接口管理
⚫ FusionCompute管理如下几类系统接口:
绑定网口
◼ 绑定主机的网口,以提高网络的可靠性。
存储接口
◼ 在主机中添加存储接口,实现主机与存储设备对接。 ◼ 添加多个存储接口,可以实现存储的多路径传输。
业务管理接口
◼ 承载一些特殊业务流量的系统接口,这些特殊业务包括热迁移虚拟 机、虚拟机主机容灾、虚拟化SAN存储心跳检测等。
添加主机存储接口
第7页
主机和集群故障点
站点故障
不能使用 FusionCompute
不能配置级联
集群故障
不能创建、修 改、移除集群
FusionCompute_V100R005C00_日常操作维护与故障处理(PDF)
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Page 13
虚拟机管理—虚拟机操作管理
虚拟机操作包括虚拟机启动、休眠、唤醒、关闭、迁移、删除、帮定主机等。
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
CPU热插拔策略不同时,调整CPU属性生效的条件不同: 不启用CPU热添加:调整CPU资源控制策略时,在线生效;增加CPU数量或减 少CPU数量时,需重启虚拟机后生效。 启用CPU热添加:增加CPU数量、调整CPU资源控制策略时,在线生效;减少 CPU数量,需重启虚拟机后生效。
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved. Page 4
目录
1. FusionCompute基本维护操作
FusionCompute Portal
虚拟机管理 账户管理
告警管理
备份恢复
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Copyright © 2015 Huawei Technologies Co., Ltd. All rights reserved.
Page 16
虚拟机管理—快照还原虚拟机
快照还原注意事项: 1、快照恢复虚拟机前提,虚拟机必须为“已关闭”或“已休眠”; 2、若虚拟机在创建快照后绑定了新磁盘,则在使用该快照还原虚拟机时,新磁 盘会自动与虚拟机解绑定。可根据需要,手动重新绑定。 3、若虚拟机的某个磁盘属性为“不受快照影响”,则使用快照还原虚拟机时, 不对该磁盘的数据进行还原。如果快照后,该磁盘被解绑定,则快照恢复的虚 拟机会重新绑定该磁盘,但磁盘数据不进行还原。 4、如果快照后,该磁盘被删除,则快照恢复的虚拟机上不存在该磁盘。
FusionCompute平台日常维护指南
FusionCompute数据手工恢复
在对FusionCompute进行重大操作(如升级或打补丁、重大数据调整、扩容等)后,系 统有可能出现异常或未达到预期结果。此时,需要对其进行回退,回退过程中需要进行 数据恢复操作。 恢复过程中需要停止VRM服务:
Page 32
目录
1. FusionCompute基本维护操作 2. FusionCompute定位信息收集
备份存放路径 数据库备份文件:/var/backup/[YYYY]-[MM]-[DD]_sn/DATA 配置备份文件:/var/backup/[YYYY]-[MM]-[DD]_sn/DB
Page 30
FusionCompute手工备份
备份的作用:进行重大操作(如升级、重大数据调整等)前,对VRM节 点数据进行手工备份,从而保证系统在出现异常或未达到预期结果时 可以及时进行数据恢复,将对业务的影响降到最低。
Page 18
网络管理—添加上行链路
添加上行链路:在已创建的分布式交换机中添加上行链路,为虚 拟机提供网络资源。
Page 19
网络管理—创建端口组
端口组是一种策略设置机制,这些策略用于管理与端口组相连的 网络。虚拟机的虚拟网卡连接到分布式交换机的端口组,这样, 即使与同一端口组相连接的虚拟机各自在不同的主机上,这些虚 拟机也都属于虚拟环境内的同一网络。
Page 25
虚拟机管理—制作模板
制作模板方式:虚拟机转为模板、虚拟机克隆为模板和模板克隆为模板。
Page 26
虚拟机管理—创建虚拟机快照
虚拟机快照:将某一时刻虚拟机的所有磁盘信息保存下来,用于虚拟机数据的 还原和恢复。一台虚拟机可以创建多个快照,使用其中一个快照恢复虚拟机时, 不会对其他快照产生影响。
FusionCompute云平台高危技术操作一览表
可以正常使用。
操作名称
操作风险
风险等级
规避措施
重大操作观察项目
手动重启VRM
该操作会导致
★★
重启完数据库
-
节点数据库
写数据库失
后,在VRM节
败,造成任务
点上执行命令
无响应。
service vrmd
restart,重启
VRห้องสมุดไป่ตู้服务。
修改内部对接
修改密码过程
★
修改内部对接
观察对接网元
恢复管理节点数据
操作不当会导致部分管理数据丢失。
★★
在对FusionCompute进行数据恢复 操作时,需要 选择正确时间 点的备份数据 进行恢复操作。
数据恢复后, 检查系统是否正常运行。
强制关闭虚拟机
操作不当,可能导致数据丢失。
★★
强制关闭不明确或故障恢复中状态的虚拟机。否则虚拟机会无法启动或造成数据破坏丢失。
定模式从主备
模式,建议将
切换到负荷分
此主机上的用
担时,该绑定
户虚拟机热迁
网口的通信会
移到其他主机
中断2~3s。
上;修改完成
后,再将用户
虚拟机迁移到
本主机;修改
过程中不进行
配置或管理类
操作。
★★★
请勿在短时间内频繁修改。修改前确认操作的必要性。若修改后产生告警,需要根据告警信息和告警帮助进行处理。
观察是否存在未恢复的异常告警。
修改VRM节点
IP地址
若操作不当, 会使管理平面网络不通,请详细了解使用约束后操作。
★★★
请严格按照 “修改VRM节点IP地址”操作步骤进行修改。
FusionCloud桌面云一体机(RH2288H V2)系统管理指南说明书
FusionCloud 桌面云一体机 (RH2288H V2) V100R005C10系统管理指南文档版本02发布日期2014-04-25版权所有 © 华为技术有限公司 2014。
保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
商标声明和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:前言概述本文档提供了在桌面云系统维护阶段的常用操作,包括帐户管理、证书管理、补丁管理、系统配置管理、系统监控、系统维护、备份与恢复等,指导系统维护人员对桌面云系统进行维护管理。
读者对象本文档(本指南)主要适用于以下工程师:l技术支持工程师l维护工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。
修订记录修改记录累积了每次文档更新的说明。
最新版本的文档包含以前所有文档版本的更新内容。
文档版本 02 (2014-04-25)第二次发布版本。
新增l增加更新ITA HTTPS证书和更新ITA与FusionManager的认证证书的操作指导。
l增加恢复GaussDB/HDC/WI服务器的操作指导。
l增加FusionCompute证书管理和FusionManager证书管理的操作指导。
修改l更新软件重装恢复和系统重装恢复节点下各服务器的备份恢复操作指导。
l恢复策略页面中,增加vAG/vLB组件的恢复策略。
FusionCompute日常维护与故障处理介绍
FusionCompute日常维护与故障处理介绍技术创新,变革未来⚫FusionCompute是华为云计算解决方案的基石,了解和掌握FusionCompute的日常维护和故障处理方法,可以更好的部署和维护企业云计算环境。
通过本章学习,您将能够掌握FusionCompute系统的日常运维能力。
⚫学完本课程后,您将能够:⚫描述日常维护操作⚫区分FusionCompute告警⚫分析常见故障处理步骤⚫描述FusionCompute常见故障处理方法1.维护管理◼日常监控☐配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理日常维护操作⚫为了保证系统长期正常、稳定的运行,维护工程师需要定期对系统进行检查,并根据检查出的异常结果排除故障。
维护项目检查项正常状态维护周期查看系统告警FusionCompute 上的告警无新增告警每天检查FusionCompute 健康状态健康检查报告无“不合格”检查项每天检查设备运行状态服务器、交换机和存储设备的指示灯状态指示灯显示正常每天检查设备运行环境温湿度符合运行环境对温度和湿度的要求。
每周空气质量符合运行环境对空气质量的要求每周防尘情况无明显尘土附着每周查看预警整改公告“/enterpr ise”,选择“公告>产品公告>预警公告>IT >云计算数据中心>FusionSphere >FusionSphere”,查看预警整改公告。
满足预警通知的要求每月查看告警告警级别图标说明紧急已经影响业务、需要立即采取纠正措施的告警为紧急告警。
重要已经影响业务,如果不及时处理会产生较为严重后果的告警为重要告警。
次要目前对业务没有影响,但需要采取纠正措施,以防止更为严重的故障的发生,这种情况下的告警为次要告警。
提示检测到潜在的或即将发生的影响业务的故障,但是目前对业务还没有影响,这种情况下的告警为提示告警。
实时监控⚫管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运行状态目录1.维护管理☐日常监控◼配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理⚫管理员可以根据业务需求对FusionCompute系统配置参数作出调整。
FusionCompute V100R003C10 存储管理指南 02说明书
FusionCompute V100R003C10存储管理指南文档版本02发布日期2013-12-28版权所有 © 华为技术有限公司 2013。
保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
商标声明和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:前言概述本文档提供了FusionCompute中数据存储、磁盘等存储资源的创建、调整和回收的流程和方法,帮助管理员对FusionCompute的存储资源进行管理。
读者对象本文档(本指南)主要适用于以下工程师:l技术支持工程师l维护工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。
界面图形使用约定文档中所有界面图形仅为示例,请以产品实际界面为准。
修订记录修改记录累积了每次文档更新的说明。
最新版本的文档包含以前所有文档版本的更新内容。
文档版本 02 (2013-12-28)第二次正式发布。
文档版本 01 (2013-11-15)第一次正式发布。
目录前言 (ii)1 存储管理简介 (1)2 存储资源管理 (4)2.1 向站点添加存储资源 (5)2.2 向主机关联存储资源 (7)2.3 扫描存储设备 (9)2.4 修改存储资源 (11)2.5 解关联存储资源 (13)3 数据存储管理 (14)3.1 添加数据存储 (15)3.2 查看数据存储信息 (19)3.3 修改数据存储的名称和描述 (20)3.4 删除数据存储 (21)4 磁盘管理 (23)4.1 创建磁盘 (24)4.2 绑定磁盘 (27)4.3 解绑定磁盘 (29)4.4 增加磁盘容量 (29)4.5 为NFS服务器添加磁盘 (32)4.6 迁移磁盘(基于虚拟机) (34)4.7 迁移磁盘(基于数据存储) (39)4.8 回收磁盘空间 (43)4.9 修改磁盘属性 (44)4.10 删除磁盘 (46)A 附录 (48)A.1 配置IE浏览器 (49)A.2 配置Firefox浏览器 (52)A.3 登录FusionCompute (52)A.4 如何创建Advanced SAN的管理帐号 (56)A.5 如何配置IP SAN启动器 (58)A.6 如何清除主机存储设备的残留信息 (59)A.7 在Windows操作系统中合并磁盘分区 (62)A.8 在Linux操作系统中新建磁盘分区 (62)A.9 在Windows操作系统中初始化磁盘 (65)A.10 在Linux操作系统中初始化磁盘 (66)A.11 技术支持 (69)A.12 参数参考 (69)A.12.1 存储资源参数说明 (70)A.12.2 数据存储参数说明 (72)A.12.3 磁盘参数说明 (72)B 术语 (76)B.1 A-E (77)B.2 F-J (78)B.3 K-O (79)B.4 P-T (80)B.5 U-Z (81)1存储管理简介内容简介FusionCompute的资源包括主机和集群资源、网络资源和存储资源。
FusionCompute云计算平台故障处理指南
FusionCompute云计算平台故障处理指南目录前言 (ii)1概述 (1)1.1故障处理流程 (2)1.2故障分类 (3)2信息收集 (5)2.1基本故障信息收集 (6)2.2告警信息收集 (6)2.3事件信息收集 (8)2.4收集日志 (8)3常见故障处理 (11)3.1用户虚拟机故障 (12)3.1.1虚拟机蓝屏 (12)3.1.2SUSE 虚拟机网卡不可用 (14)3.1.3Ubuntu10.04 及以上版本操作系统中uvp-monitor 进程未启动 (18)3.1.4Windows Server 2003 虚拟机绑定USB 2.0 设备后,虚拟机黑屏或关机失败 (19)3.1.5SUSE 10 虚拟机不能正常使用USB 2.0 设备 (20)3.1.6重启或关闭主机网络服务后,主机网络异常 (21)3.1.7虚拟机同时绑定SCSI 磁盘和IDE 磁盘时无法正常启动 (22)3.1.8本地磁盘的ext4 文件系统损坏 (23)3.1.9虚拟机内存数值显示异常 (25)3.2管理节点故障 (26)3.2.1VRM 虚拟机故障 (26)3.2.2主机操作系统故障 (32)3.3操作维护类故障 (35)3.3.1登录界面时IE 浏览器异常 (36)3.3.2FusionComute 无法获取监控数据 (38)3.3.3修改虚拟机IP 后虚拟机通信中断 (40)3.3.4主机管理网络配置与交换机不匹配 (42)3.3.5异常掉电再上电后,任务长时间无响应 (43)3.3.6网络数据残留导致添加主机失败 (44)3.3.7仲裁IP 地址失效,导致Web 客户端无法登录 (46)故障处理目录3.4Tools 故障 (47)3.4.1Windows 下安装Tools 时弹出警告提示 (47)3.4.2Windows 下安装Tools 时异常中止 (48)4部件更换 (50)4.1部件更换策略 (51)4.2更换主机 (53)A 附录 (57)A.1使用ISO 方式安装VRM 虚拟机 (58)A.2清除FusionCompute 中本地硬盘的残留数据 (63)A.3配置FusionCompute 告警上报 (64)A.4配置单点登录 (66)A.5如何处理虚拟机网卡乱序问题 (67)A.6ISO 镜像方式安装主机 (68)A.7配置IE 浏览器 (76)A.8配置Firefox 浏览器 (79)A.9登录FusionCompute (80)A.10兼容性 (83)B 术语 (94)B.1A-E (95)B.2F-J (96)B.3K-O (97)B.4 P-T (98)B.5 U-Z (99)1 概述关于本章1.1故障处理流程1.2故障分类1.1故障处理流程故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排除。
FusionCompute云平台运维监控指南
FusionCompute云平台运维监控指南前言概述本文档针对FusionCompute系统,提供日常监控的操作指导,以便及时发现和处理系统中的潜在问题,确保系统正常运行。
读者对象本文档(本指南)主要适用于以下工程师:●技术支持工程师●维护工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。
目录前言 (ii)1告警监控 (1)1.1查看告警 (2)1.2手工清除告警 (3)1.3查看事件 (4)1.4查看告警统计 (4)2实时监控 (6)2.1监控集群 (7)2.2监控主机 (8)2.3监控虚拟机 (10)3自定义监控 (12)3.1查看单对象多指标监控 (13)3.2查看单指标多对象监控 (13)3.3查看TOP 统计结果 (14)4历史KPI 查询 (15)4.1查询单对象多指标数据 (16)4.2查询单指标多对象数据 (17)5设置自定义监控策略 (20)5.1设置单对象多指标监控策略 (21)5.2设置单指标多对象监控策略 (23)5.3设置TOP 统计策略 (24)A 附录 (26)A.1配置IE 浏览器 (27)A.2配置Firefox 浏览器 (30)A.3登录FusionCompute (30)B 术语 (35)B.1A-E (36)B.2F-J (37)B.3K-O (38)B.4 P-T (39)B.5 U-Z (40)1 告警监控关于本章1.1查看告警1.2手工清除告警1.3查看事件1.4查看告警统计1.1查看告警操作场景该任务指导维护工程师通过FusionCompute查看系统告警信息,以便及时发现和解决系统中存在的故障,保证系统的稳定运行。
必备事项前提条件已登录FusionCompute。
操作步骤查看告警1在FusionCompute中,选择“虚拟数据中心监控> 告警”。
进入“告警”页面。
单击FusionCompute界面右上角“告警统计”区域对应的告警个数,可进入“实时告警”页面,且告警列表中会根据告警级别搜索出相关告警信息。
FusionAccess桌面云运维与管理介绍
第26页
禁用操作概述
在维护FusionAccess时,禁止进行下表所示的操作,否则可能会给设备的正常运 行带来致命危险。
类别
操作风险
严禁在FusionCompute的界面上删除虚拟桌面。 删除后,用户虚拟桌面不可用。
用户使用虚拟机状态统计
基础架构虚拟机重启 基础架构服务器操作系统补 丁更新 基础架构服务器病毒检查
维护场景
具体维护任务
定期对桌面云环境进行全面检测,防范于 使用FusionCare工具进行系统健康检查,
未然。
对于存在不合格的检查项, 请立即处理。
通过对用户使用虚拟机情况的分析,可以 一定时间段内的在线人数统计。
白天进行批量操作, 会影响ITA的性能, 可能导致其他业务异 常。
★★★
在FusionAccess界面“系统
管理 > 初始配置”中执行 “配置虚拟机化环境”、 “配置域/OU”、“配置桌
操作不当,可能导致 业务中断。
★★
面组件”操作。
规避措施
重大操作观察项目
先备份数据,再进行更 换操作。 记录AD修改前的配置情 况,当出现问题时,便 于进行回退操作。 1.在夜间业务量低时进行 批量操作。 2.批量创建、批量关联虚 拟机前,请确认资源是 否充足。
第19页
FusionAccess周维护任务
项目
维护场景
具体维护任务
用户虚拟机重启 说明:此项建议用户自行 重启。
Windows操作系统长时间运行可能存在内 存资源不足、进程占用CPU过高导致系统 运行缓慢的风险,为保证系统正常运行, 建议用户虚拟机至少每周重启一次。
FusionCompute V100R003C10网络管理指南说明书
FusionCompute V100R003C10网络管理指南文档版本02发布日期2013-12-28版权所有 © 华为技术有限公司 2013。
保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
商标声明和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。
除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
华为技术有限公司地址:深圳市龙岗区坂田华为总部办公楼邮编:518129网址:前言概述本文档提供了FusionCompute中分布式交换机、上行链路和端口组等网络资源的创建、调整和回收的流程和方法,帮助管理员对FusionCompute的网络资源进行管理。
读者对象本文档(本指南)主要适用于以下工程师:l技术支持工程师l维护工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。
界面图形使用约定文档中所有界面图形仅为示例,请以产品实际界面为准。
修订记录修改记录累积了每次文档更新的说明。
最新版本的文档包含以前所有文档版本的更新内容。
文档版本 02 (2013-12-28)第二次正式发布。
文档版本 01 (2013-11-15)第一次正式发布。
目录前言 (ii)1 网络管理简介 (1)2 分布式交换机管理 (3)2.1 创建分布式交换机 (4)2.2 查看分布式交换机信息 (8)2.3 删除分布式交换机 (9)2.4 添加VLAN池 (10)2.5 删除VLAN池 (11)2.6 添加子网 (12)2.7 修改子网 (14)2.8 删除子网 (15)2.9 创建本地端口镜像 (16)2.10 修改本地端口镜像 (18)2.11 查看端口镜像信息 (20)2.12 删除端口镜像 (20)3 上行链路组管理 (22)3.1 添加上行链路 (23)3.2 查看上行链路信息 (26)3.3 移除上行链路 (27)3.4 配置VTEP网络 (27)4 端口组管理 (29)4.1 创建端口组 (30)4.2 查看端口组信息 (34)4.3 修改端口组属性 (35)4.4 删除端口组 (38)A 附录 (39)A.1 配置IE浏览器 (40)A.2 配置Firefox浏览器 (43)A.3 登录FusionCompute (43)A.4 参数参考 (47)A.4.1 分布式交换机参数说明 (47)A.4.2 VLAN池参数说明 (51)A.4.3 子网参数说明 (52)A.4.4 端口镜像参数说明 (53)A.4.5 上行链路参数说明 (54)A.4.6 VTEP参数说明 (57)A.4.7 端口组参数说明 (58)B 术语 (61)B.1 A-E (62)B.2 F-J (63)B.3 K-O (64)B.4 P-T (65)B.5 U-Z (66)1网络管理简介内容简介FusionCompute的资源包括主机和集群资源、网络资源和存储资源。
资料-FusionSphere 日常操作维护与故障处理讲解
登陆管理节点
执行备份命令
检查备份进度和结果远端备份结果
结束
Openstack OM数据手工恢复
FM上执行命令手工恢复 开始
登陆FM主节点 查看备份包信息
登录OM备节点 停止OM备节点服务 停止OM主节点服务 在OM主节执行恢复命
令 启动OM主节点服务 启动OM备节点服务
结束
根据不同场景有如下几种扩容方式:
为现有集群扩容主机--不需要在OpenStack中配置。 扩容集群--需要操作有可用的控制节点。
计算资源扩容---KVM
开始
收集主机MAC 并编辑别名
PXE上电 ISO镜像方式安装主机
配置主机网络
配置资源隔离
配置内核参数
重启
加入主机组
服务器/机框接入
部署compute角色 多网元管理
FusionStorage,FusionSphere OpenStack和FusionAccess。 日志收集收集各节点的日志,包括操作系统、模块、脚本、软件狗等的日志。 日志收集支持工具自身日志的收集。
健康检查—FusionCare工具
FusionCare工具是一个基于Web的B/S程序。 首次使用健康检查需要添加环境和节点信息。 健康检查支持检查FusionCompute, Openstack OM, FusionStorage,FusionSphere
执行以下命令,执行系统审计
infocollect audit
开始
登陆管理节点
查看备份包信息
执行恢复
检查恢复进度和 结果
否 是否进行 系统审计
是 参照系统审计的 内容消除审计不
合格项 结束
Openstack OM设置备份策略和手工备份
虚拟化平台运维指南
虚拟化平台运维指南虚拟化平台是现代数据中心的核心基础设施,能够实现更高的资源利用率和灵活性。
虚拟化平台的运维工作是保障系统稳定运行和高效利用资源的重要环节。
本指南将介绍一些关键的虚拟化平台运维任务和注意事项,帮助运维人员顺利管理和维护虚拟化环境。
1.虚拟机管理虚拟机是虚拟化平台的核心组件,运维人员需要对虚拟机进行管理和监控。
常见的任务包括创建、克隆、销毁和迁移虚拟机。
要保持虚拟机的性能和可靠性,需要定期进行虚拟机硬件和软件的更新和维护操作,包括操作系统更新、应用程序更新和安全补丁的安装。
2.资源管理运维人员需要监控和管理虚拟化平台的资源使用情况。
这包括对虚拟机的CPU、内存、存储和网络等资源进行监控和分配。
需要定期检查资源使用率,及时进行资源调整和优化,以确保虚拟机的性能和可靠性。
3.故障排除虚拟化平台可能会出现各种故障,例如虚拟机无法启动、存储故障和网络故障等。
运维人员需要熟悉虚拟化平台的日志和报警系统,及时发现和解决故障。
在排除故障过程中,需要运用故障排除的方法和工具,例如日志分析、网络抓包和性能监控工具。
4.安全管理虚拟化平台的安全是至关重要的。
运维人员需要定期检查虚拟化平台的安全设置,并采取必要的措施来保护虚拟机和虚拟化平台的安全。
这包括定期更新虚拟化平台软件的安全补丁、设置合理的访问控制策略、实施强密码策略和加密传输等。
5.性能优化虚拟化平台的性能优化是提高系统效率和满足用户需求的重要工作。
运维人员可以通过监控和调整虚拟机资源分配、磁盘和网络性能优化来提高虚拟化平台的性能。
定期进行系统性能分析和优化将有助于提高虚拟化平台的响应能力和用户满意度。
6.灾难恢复灾难恢复是关键的运维任务。
运维人员需要定期备份虚拟机和关键数据,确保数据的安全性和可恢复性。
同时,还需要测试和验证灾难恢复计划,以确保在发生灾难时能够快速恢复虚拟化平台和关键服务。
总结:虚拟化平台运维工作包括虚拟机管理、资源管理、故障排除、安全管理、性能优化和灾难恢复等。
FusionCompute日常维护与故障处理介绍
FusionCompute日常维护与故障处理介绍技术创新,变革未来⚫FusionCompute是华为云计算解决方案的基石,了解和掌握FusionCompute的日常维护和故障处理方法,可以更好的部署和维护企业云计算环境。
通过本章学习,您将能够掌握FusionCompute系统的日常运维能力。
⚫学完本课程后,您将能够:⚫描述日常维护操作⚫区分FusionCompute告警⚫分析常见故障处理步骤⚫描述FusionCompute常见故障处理方法1.维护管理◼日常监控☐配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理日常维护操作⚫为了保证系统长期正常、稳定的运行,维护工程师需要定期对系统进行检查,并根据检查出的异常结果排除故障。
维护项目检查项正常状态维护周期查看系统告警FusionCompute 上的告警无新增告警每天检查FusionCompute 健康状态健康检查报告无“不合格”检查项每天检查设备运行状态服务器、交换机和存储设备的指示灯状态指示灯显示正常每天检查设备运行环境温湿度符合运行环境对温度和湿度的要求。
每周空气质量符合运行环境对空气质量的要求每周防尘情况无明显尘土附着每周查看预警整改公告“/enterpr ise”,选择“公告>产品公告>预警公告>IT >云计算数据中心>FusionSphere >FusionSphere”,查看预警整改公告。
满足预警通知的要求每月查看告警告警级别图标说明紧急已经影响业务、需要立即采取纠正措施的告警为紧急告警。
重要已经影响业务,如果不及时处理会产生较为严重后果的告警为重要告警。
次要目前对业务没有影响,但需要采取纠正措施,以防止更为严重的故障的发生,这种情况下的告警为次要告警。
提示检测到潜在的或即将发生的影响业务的故障,但是目前对业务还没有影响,这种情况下的告警为提示告警。
实时监控⚫管理员可以查看集群、主机以及虚拟机的监控信息,以便于了解集群在指定时间段内的运行状态目录1.维护管理☐日常监控◼配置管理☐用户管理☐FusionCompute备份与恢复2.故障管理⚫管理员可以根据业务需求对FusionCompute系统配置参数作出调整。
HUAWEIFusionSphere虚拟化平运维指南精选版精心整理
虚拟化平台运维指南北京辰安科技股份有限公司版权声明本文档版权属北京辰安科技股份有限公司所有,未经北京辰安科技股份有限公司书面许可,任何单位或个人不得以任何形式或任何手段复制或传播本文档的一部分或全部。
版本记录目录1.引言错误!未指定书签。
1.1简介错误!未指定书签。
1.2书写约定错误!未指定书签。
1.3通用图标说明错误!未指定书签。
2.平台介绍错误!未指定书签。
2.1功能简介错误!未指定书签。
3.用户操作指南错误!未指定书签。
3.1功能查看错误!未指定书签。
3.1.1登录系统错误!未指定书签。
3.1.2注销系统错误!未指定书签。
3.1.3查看近期任务错误!未指定书签。
3.1.4虚拟机和模板错误!未指定书签。
3.1.5查看已创建虚拟机错误!未指定书签。
3.1.6查看计算池错误!未指定书签。
3.1.7查看存储池错误!未指定书签。
3.1.8查看网络池错误!未指定书签。
3.2配置指南错误!未指定书签。
3.2.1创建集群错误!未指定书签。
3.2.2扫描存储设备错误!未指定书签。
3.2.3添加数据存储错误!未指定书签。
3.2.4向集群中添加主机错误!未指定书签。
3.2.5创建虚拟机错误!未指定书签。
3.2.6为虚拟机安装操作系统错误!未指定书签。
3.2.7虚拟机转为模板错误!未指定书签。
3.2.8按模板部署虚拟机错误!未指定书签。
3.2.9管理虚拟机错误!未指定书签。
3.2.9.1配置虚拟机错误!未指定书签。
3.2.9.2迁移虚拟机错误!未指定书签。
3.2.9.3创建虚拟机快照错误!未指定书签。
3.3系统管理错误!未指定书签。
3.3.1用户管理错误!未指定书签。
3.3.2时间配置错误!未指定书签。
3.3.3配置错误!未指定书签。
3.3.4管理错误!未指定书签。
3.4运维监控错误!未指定书签。
3.4.1监控告警错误!未指定书签。
3.4.2监控事件日志错误!未指定书签。
3.4.3监控性能错误!未指定书签。
表目录表1-1 书写约定描述表错误!未指定书签。
华为桌面云-业务发放和日常维护介绍
管理员使用FusionAccess工具安装HDA软 件,优化操作系统,配置防火墙规则等其他 操作,完成模板制作。
2.2 模板制作---创建裸虚拟机
管理员登录FusionCompute,选择“计算池”->“主机”->“创建虚拟机”,创建模 板空虚拟机。
2.3 模板制作---安装操作系统
管理员通过“硬件光驱”挂载操作系 统ISO,安装操作系统。
管理员通过FC虚拟机“挂载Tools”菜 单为虚拟机挂载PvDriver安装盘,再 通过VNC窗口完成安装。
2.4模板制作---安装系统补丁,应用软件
管理员安装系统补丁,并根据需要在模板内预装各种应用软件;
告警帮助中会给出该条告警 的影响,可能原因,处理步 骤,管理员可以按照帮助进 行告警处理。
4.6告警监控---状态监控
管理员可以在FusionAccess Portal“首页”和“状态监控”中查看到各组件状态,了 解系统当前状态。
4.7告警监控---VIP桌面告警
管理员可以按需选择VIP桌面监控项,一旦出现异常系统会生成告警。
5.8健康检查---检查结果
任务执行结束后系统会呈现检查结果,管理员可以查看每个节点检查详情,也可以导出 巡检报告;
5.9日志收集---创建日志收集任务1
管理员进入“信息收集”页面,并点击“创建任务”按钮,创建日志收集任务;
5.10日志收集---创建日志收集任务2
管理员选择需要收集日志的FusionAccess管理节点;
5.4健康检查---创建检查1
管理员在完成配置后,打开“健康检查”页面;
5.5健康检查---创建健康检查任务2
FusionCompute实验指导手册
.华为认证Cloud系列教程HCIP-Cloud Computing华为FusionCompute实验指导手册华为认证体系介绍基于“平台+AI+生态”战略,围绕“云-管-端”协同的新ICT技术架构,华为公司打造了业界唯一覆盖ICT全技术领域的认证体系,包含ICT技术架构认证、平台与服务认证和行业ICT认证三类认证。
根据ICT从业者的学习和进阶需求,华为认证分为工程师级别、高级工程师级别和专家级别三个认证等级。
华为认证覆盖ICT全领域,符合ICT融合的技术趋势,致力于提供领先的人才培养体系和认证标准,培养数字化时代的新型ICT人才,构建良性的ICT人才生态。
HCIP-Cloud Computing V4.0定位于培养具有FusionCompute、FusionAccess运营与运维的能力,能够熟练掌握FusionCompute、FusionAccess日常操作与维护的人才。
HCIP-Cloud Computing V4.0认证课程包括:FusionCompute的产品介绍、虚拟化资源池管理、日常管理及故障处理,FusionAccess的产品及组件介绍、安装部署、业务管理及故障处理等。
相对于V3.0,HCIP-Cloud Computing V4.0增加了FusionCompute虚拟机发放与管理,优化FusionCompute与FusionAccess实验内容,删除FusionCloud私有云以及全内存桌面。
通过HCIP-Cloud Computing V4.0,将证明您基本掌握了FusionCompute和FusionAccess产品特性原理和运营运维能力。
企业拥有通过HCIP-Cloud Computing V4.0认证的高级工程师,意味着企业具备搭建华为虚拟化平台和桌面云的资质和能力。
前言简介本书为HCIP-Cloud Computing认证培训教程,适用于准备参加HCIP-CloudComputing考试的学员或者希望了解华为服务器虚拟化FusionCompute并希望熟练使用和管理FusionCompute的读者。
FusionCompute云平台健康检查指南
FusionCompute 云平台健康检查指南健康检查指南目录目录前言 (ii)1日常维护一览表 (1)2日常维护 (2)2.1检查FusionCompute 健康状态 (3)3FusionCompute 上下电 (6)3.1下电FusionCompute (7)3.2上电FusionCompute (8)A 附录 (10)A.1配置IE 浏览器 (11)A.2配置Firefox 浏览器 (14)A.3登录FusionCompute (14)健康检查指南 1 日常维护一览表1 日常维护一览表为了保证系统长期正常、稳定的运行,维护工程师需要定期对表1-1所示的项目进行检查,并根据检查出的异常结果排除故障。
表1-1 日常维护一览表2 日常维护关于本章2.1 检查FusionCompute健康状态2.1 检查FusionCompute 健康状态操作场景为保证FusionCompute系统的正常运行,建议维护工程师每天使用FusionCare对系统进行健康检查,并对检查结果中的不合格项进行处理。
对系统的影响该操作对系统正常运行无影响。
必备事项前提条件–已完成FusionCare的安装及配置。
–浏览器为“Internet Explorer 8.0”及以上版本,或“Firefox 8.0”及以上版本。
–已获取FusionCare系统的IP地址、用户名、密码。
–如启用邮件转发功能,需已有邮件服务器。
操作步骤登录健康检查工具配置健康检查任务1打开IE浏览器,在地址栏中输入FusionCare的网络地址,按“Enter”。
地址格式为http://FusionCare系统的IP地址:8800/hct/index.action。
例如,在IE浏览器地址栏中,输入“http://192.168.100.60:8800/hct/index.action”。
2输入“用户名”和“密码”。
默认用户名为“admin”,密码为“admin”。
精选-第九章日常维护
学完本课程后,您将能够:
掌握通过FusionCompute进行系统维护的方法 掌握通过FusionManager进行系统维护的方法 了解其他几种常见的维护工具
自动备份 备份时间:每天凌晨02:00 默认保留7个备份(包括自动和手工备份)
手工备份 场景:对系统进行重大操作前,例如升级、重大数据调整等,通过FusionManager备份管 理节点数据 目的:保证系统在出现异常或未达到预期结果时可以及时进行数据恢复,将对业务的影响 降到最低 备份时间:建议在业务量小的时间段执行备份数据操作 备份数据保存到:本地和FTP 操作入口:FusionManager:系统->备份设定
①
② ③
查看事件
在FusionCompute中可以查看系统中产生的事件记录,同时可将记录以文件的形式备 份保存在本地。
在FusionCompute主界面上方点击“监控”,然后在左侧中点击“事件”就能够查看 到事件列表,如下图所示:
①
③ ②
查看性能
在FusionCompute主界面上方点击“监控”,然后在左侧点击“性能”就能够查看到性能监控相 关内容,如下图所示:
SOI 支持部署在虚拟机上 健康:负载是否正常,包括CPU、内存、磁盘和网络IO 风险:系统资源是否充裕 效率:是否存在优化机会
FusionSphere SOI (2/2)
全局监控:系统首页呈现全局环境运行状态 查看详情:健康得分、节点规格、历史分析 失衡详情:工作负载详情,支持导出 趋势预测:未来的资源需求和使用情况 资源合规:快速找到容量不足和容量过剩的节点 热点统计:TOP对象的情况和数据,例如哪些主机CPU负载最高 导出批量数据:1分钟粒度一周,包括CPU/内存/存储IO/磁盘IO 设置分析阈值:对分析的各种选项和阈值灵活修改定制
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主机和集群管理—主机添加存储接口
主机添加存储接口:实现主机与存储设备对接;添加多个存储接口,可以 实现存储的多路径传输。 添加存储接口的方式:手动添加存储接口和批量添加主机存储接口。 参数:名称、描述、IP地址、子网掩码、VLAN ID、限速设置、上限带宽。
Page 7
主机和集群管理—设置主机时间同步
在浏览器输入以下地址进入 FusionCompute Portal : http://VRM节点的IP地址
Page 3
主机和集群管理—概述
主机和集群管理包括创建集群、添加主机、主机添加存储接口、设置主 机时间同步、设置集群资源调度策略、设置集群HA和内存复用、设置虚 拟机启动策略等。
Page 4
主机和集群管理—创建集群
Page 23
虚拟机管理—修改虚拟机规格
系统支持对虚拟机规格做如下修改:调整CPU、调整内存、增加磁盘 容量、绑定磁盘、解绑定磁盘、添加网卡、删除网卡。
Page 24
虚拟机管理—迁移虚拟机
迁移虚拟机方式:主机间迁移和数据存储间迁移。 主机间迁移:将虚拟机迁移至其所在站点内指定的主机上。 数据存储间迁移:将虚拟机中的磁盘从一个数据存储迁移到另一个数据存储中。
设置主机时间同步:为主机配置单独的外部时钟源,定期同步 时间以保证主机时间运行准确。设置主机时间同步需要重启主 机业务进程,会引起主机服务暂时中断,需谨慎操作。
Page 8
主机和集群管理—设置集群资源调度策略
集群的计算资源调度策略:实现集群内计算资源的动态调度,达到计算 资源的合理分配。
Page 9
配置参数: 集群名称 描述 迁移阈值 电源管理阈值 HA资源预留 CPU预留(%) 内存预留(%) 主机内存复用 虚拟机启动策略
Page 5
主机和集群管理—添加主机
添加主机的方式:手动逐个添加主机和使用模板批量添加主机。 参数:名称、IP地址、描述、BMC IP、BMC用户名、BMC密码。
Page 6
Page 18
网络管理—添加上行链路
添加上行链路:在已创建的分布式交换机中添加上行链路,为虚 拟机提供网络资源。
Page 19
网络管理—创建端口组
端口组是一种策略设置机制,这些策略用于管理与端口组相连的 网络。虚拟机的虚拟网卡连接到分布式交换机的端口组,这样, 即使与同一端口组相连接的虚拟机各自在不同的主机上,这些虚 拟机也都属于虚拟环境内的同一网络。
Page 25
虚拟机管理—制作模板
制作模板方式:虚拟机转为模板、虚拟机克隆为模板和模板克隆为模板。
Page 26
虚拟机管理—创建虚拟机快照
虚拟机快照:将某一时刻虚拟机的所有磁盘信息保存下来,用于虚拟机数据的 还原和恢复。一台虚拟机可以创建多个快照,使用其中一个快照恢复虚拟机时, 不会对其他快照产生影响。ge 14
存储管理—添加数据存储
添加数据存储:在主机上添加数据存储,从而在数据存储上创建 虚拟机的磁盘。一个主机可以添加多个数据存储,一个数据存储 也可以添加到多个主机上。只有当虚拟机磁盘所在的数据存储同 时添加到两个主机上时,虚拟机才能在这两个主机之间进行计算 迁移。 主机关联存储资源方式:手动关联存储资源和批量关联存储资源。
Page 11
存储管理—概述
存储管理提供对存储资源、数据存储和磁盘进行调整和操作。
Page 12
存储管理—配置共享存储资源
共享存储资源包括SAN存储、Advanced SAN存储以及NAS存储。如果使用共 享存储,需要先把准备好的共享存储资源添加到系统中。
Page 13
存储管理—主机关联存储资源
华为FusionCompute平台 日常维护指南
目录
1. FusionCompute基本维护操作 2. FusionCompute定位信息收集
Page 1
目录
1. FusionCompute基本维护操作
FusionCompute Portal基本维护 备份恢复
Page 2
登录FusionCompute Portal
Page 20
虚拟机管理—概述
虚拟机管理包含创建虚拟机、克隆虚拟机、修改虚拟机规格、迁移虚拟机、 制作模板、创建虚拟机快照等。
Page 21
虚拟机管理—创建虚拟机
先创建裸虚拟机,再安装虚拟机操作系统和应用软件。
Page 22
虚拟机管理—克隆虚拟机
克隆虚拟机方式: 1. 虚拟机克隆为虚拟机:基于系统内已有的虚拟机,创建
Page 15
存储管理—创建磁盘
在数据存储上创建磁盘,并通过与虚拟机绑定,为虚拟机提供存 储资源。
Page 16
网络管理—概述
网络管理提供创建分布式交换机和端口组等网络资源的功能,支持对网络 资源进行调整和配置。
Page 17
网络管理—创建分布式交换机
分布式交换机的功能类似于普通的物理交换机,每台主机都连接到分布式 交换机中。分布式交换机的一端是与虚拟机相连的虚拟端口,另一端是与 虚拟机所在主机上的物理以太网适配器相连的上行链路。通过它可以连接 主机和虚拟机,实现系统网络互通。
主机和集群管理—设置集群HA和内存复用
HA策略:用于虚拟机故障切换时,系统用预留的资源为HA的虚拟机分配 CPU和内存。 内存复用策略:开启集群内主机的内存复用功能后,可以实现虚拟机内 存规格总和大于主机规格内存,提高主机的虚拟机密度。
Page 10
主机和集群管理—设置虚拟机启动策略
虚拟机启动策略:在虚拟机启动时,会按照配置的策略在集群内选择对应 的主机,分为自动分配和负载均衡两种方式。 自动分配:虚拟机启动时,在集群中满足资源条件的节点中随机进行节点 的选择。 负载均衡:虚拟机启动时,根据节点的CPU和内存利用率进行节点的选择。