行业之云计算时代的运维
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
行业之云计算时代的运维
Yelp的SRE工程师Dmitriy Samovskiy关于在云计算大环境下,运维工作重心和角色的变化,当下运维相关的技术工作做出的看法
为什么运维会发生变化?这种变化会继续下去吗?
主要有以下两点原因:
aaS云服务的兴起深刻改变了运维。基础设施即代码,运维面对的不再是传统的服务器。云厂商可以将所有事情标准化,然后以服务的形式打包提供给客户。运维人员自身也掌握了更多的软件开发技能。运维人员不再局限于脚本,转而变成更好的开发者,承担起更多的职责。
研发生产和运维会变得越来越难以分割。不会再有专门的运维团队,每个项目研发团队都可以自行进行产品的运维。这种角色的变化,并不意味着运维工作的消失;相反,依然需要运维技能、知识和经验。
1、可扩展性已经成为了运维工作的重心
在以前的服务器时代,运维团队的主要工作是创建环境并维护生产的稳定性。而现如今,运维团队的工作重心已经转向了如何提高产品的可扩展性。如果扩展性做得不好,流量负载过多就带来各种相关问题(会话冲突、用户拥堵和数据集合大小不符)。如果扩展性做得好,产品就会运行得既安全又高效。这对于一些金融类的高风险业务尤为重要。
随着服务规模的不断扩展,人工进行系统管理已经成为不可能完成的任务,自动化运维将是不可回避的选择。业界的一种观点是,DevOps是自动化运维的唯一方法;Dmitriy认为DevOps是一种文化,会在企业发展成长中自然而然地形成。
2、运维能力已经成为企业的技术基础
在以前,研发工程师团队只负责开发产品,而不负责提高开发效率的相关工作,如:代码重用性、实现模式、用户库、核心API等。现在,一些DevOps文化的公司已经将这些工作融合在一起。
一些大型网站如Facebook、Google等都有专职的SRE(Site Reliability Engineer)网站可靠性工程师,国内又称应用运维师。其对应的工作职责包含:容量规划与实施、集群部署、数据中心容错、负载均衡和监控等。
3、公司在不同的发展阶段对运维的需求不同
初创阶段
公司在初创时期最需要关心的就是如何研发出满足市场需求的功能,而不是舍本逐末地去抓运维。因为这个时期企业一方面还没有大量用户,而另一方面运维会耗费过多的技术资源;所以应该将更多的精力放在快速迭代、新功能研发上。这个时期,推荐企业采用NoOps。
快速扩张时期
在互联网时代,传统企业开始直接向客户提供服务,但是旧式运维并不能胜任大量的流量负载。这个时候,运维工作需互联网规模化(WebScale)。WebScale IT是相对于传统IT构架的新概念,意味着系统可处理大量计算、承受高负载、具有强容错性和持续部署及交付能力、可高效运维等。
云计算运维和传统的运维方式比较,显著的优势在于费用低,上线速度快,动态的调整存储空间的大小,维护成本低等。千锋Linux课程,由浅入深,依次掌握公有云,私有云,混合云,Docker容器,Shell脚本,Python等专业技术。
丰富的实战项目助力下,学员的核心竞争优势更加突出。