虚拟化的健康巡检

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

虚拟桌面优化及健康检查

一个成功的项目离不开从项目实施到日常维护过程不间断的按照最佳实践去设计、规划、实施,其中对于系统的健康性检查是保证项目成功不可或缺的一个部分。虽然相比较于设计一个新的项目,健康检查看起来并不是一项特别高深的技术工作,并不需要像设计一个大型项目那样需要全方位的技能,但此工作检验的是运维管理人员对于整个系统的熟悉程度、仔细程度。其对于每一个事件日志、每一个报警、每一个变更都能按部就班,一丝不苟的完成,则可以让整个系统在日常运行过程就能规避很多可能出现的问题。所以一个成功的项目离不开对整个系统不间断的健康检查。

第一章优化方案

一般情况下Citrix桌面虚拟化项目,从底层的物理服务、服务器虚拟化、网络、存储、AD、SQL、DDC、PVS、SF等都会通过N+1、双机、多路径等方式来保证高可用性。核工院项目前期高可用方案的设计到实施并通过验证确保所有核心组件不存在单点风险。

第二章日常运维中健康检查

Director巡检

1:首先Citrix系统中有一个非常重要的组件Citrix Director,Director能够让运维人员查阅整个虚拟桌面平台的使用状态、包括用户连接状态、出现的故障虚拟化、许可使用情况。我已经把组件安装在10.2.156.9(SF02这台服务器上。

2:可以对于故障的计算机、用户查看故障原因。

3:对于个别用户反馈登录比较慢,可以直接读取该用户访问的虚拟桌面获得更为详细信息,包括终端信息、ip、Receiver版本等。

4:查看会话信息

当然Director还有很多其他的功能、比如查看虚拟机使用率、查看DDC状态、配置文件查看情况、系统报告、查看用户集成了那些策略(包括DDC策略、域策略和本地策略、远程虚拟桌面、查看用户运行的程序等。

DDC巡检

1 :DDC日常巡检中主要查看交付组中对应的虚拟机注册状态。如出现没有注册的虚拟机、以下几种步骤可以参考排除、定位问题。

1:因为之前虚拟机都是可以正常注册的、所以就不会存在防火墙、DDC在虚拟桌面的全域名不对等一些常规问题。

2:远程登陆到虚拟桌面、用域账号登陆验证是否虚拟机脱域环境、如果域账号登陆出现问题、需要重新退域、加域。

3:远程登录虚拟桌面后查看服务Citrix Desktop Server是否是“已启动”状态、或者重启这个服务查看注册情况。

4:查看系统日志,日志中是否记录错误信息等。

5:当在系统日志里面记录了虚拟桌面已经完成了与DDC中的注册,但是DDC 中仍然显示没有注册,这时候就需要在ddc中删除计算机账号、从新添加。

6:DDC策略,这块做好策略后需要检查下发给对应的是全局、特殊的OU、交付组、还是个人等。

7:许可证如果存在零时许可、可以在DDC中“许可”工具栏中查看即将过期的许可情况,以及使用情况。

8:DDC中也有日志记录、可以查询近6个月内管理员所做的一切操作情况,方便追寻、查看管理员的操作。

SQL巡检

1:检查SQL Server的磁盘空间,确保存放DB文件和LOG文件的磁盘还有足够的空间。

2:检查SQL高可用

PVS巡检

环境中所有的虚拟机都是采用Citrix PVS流技术、一个站点中最多可以添加4台PVS服务器、一台PVS服务器建议250到300个虚拟桌面,PVS内存建议给到12G以上。

1 :检查PVS服务器是否在活动状态、如果有PVS服务器down了,检查对应PVS的Stream Server服务。

2:虚拟磁盘的版本

(1首先版本建议不要超过5个,如果版本过多在用户登录过程中会影响登录的性能,建议

达到5个版本就合并更新成一个新版本,合并应该在晚上用户使用少的情况下合并版本。

(2引导生产设备的版本,因为版本比较多的情况需要注意你引导的设备版本是所需要的。

(3更新虚拟磁盘的时候备注写明原因、完成时间、操作人员等。

(4Vdisk对应的使用情况,可以查看那些虚拟机使用Vdisk的版本。

3:检查PVS服务器上的核心服务,PXE、TFTP是否正常启动。

3)虚拟磁盘模式:除了 XP 系统不能缓存到本地磁盘外,之后的系统都支持到本地磁盘,如果出现缓存到 PVS 服务器、有可能是本次磁盘没有格式化或者D 盘满了。 DHCP 巡检 1 DHCP 检查 66、67 功能选项里面是否填写有误。 2 两台DHCP 工作模式、是否正常为虚拟机提供地址。 3 检查 DHCP IP Scope 的可用量,确保有足够的 IP 地址提供对应的 Vlan。

XenServer 巡检 1)确保所有的 XenServer 上指定了有效的 NTP 服务器,服务器的时钟都相同。 2在 NICs 处确认所有的 Speed 都是正确的,如:千兆网卡则应该为 1000Mbit/S,都为全双工。如发现速率和工作状态不正确,请检查网卡驱动和对端交换机情况确保存储多路径都已开启

5通过 XenCenter 查看整个平台的性能使用情况,如果总体资源使用量超过了80% 则需要考虑一定量的扩容,如果超过 90%则请务必尽快增加新的资源,同时查看 VGPU 资源。 6检查 XenServer 日志是否有存储、许可、多路径报错等。过长

时间的 Windows 服务器不重启是会有可能导致其工作不稳定,建议至少三个月将Windows 服务器进行一次重启,比如 DDC、PVS、SQL,重启前做好前期的准备工作。修正 V1.0 改变说明新建更新者柯日期 2016年9月27日

相关文档
最新文档