在当前有着重要的现实意义,一、云运维与传统
分类:巴黎人-服务器

云计算在企业运营中的基本工作原理是将计算分布在大量分布式计算机中,从而使企业数据中心的运行和互联网更为相似。通过云计算的运维管理,企业不仅能够实现对IT资源的统一,根据用户的需求提供可量化的存储服务与计算,而且还能有效将资源切换到实际需要的应用中,提高了IT资源的利用率,降低了系统的成本。因而加强对云计算运维管理的要点和改进方式的研究,从而使云计算在企业运营中能发挥出更大的效力,在当前有着重要的现实意义。

图片 1

编者按】管理是IT系统良性运行的重要保障,不同的IT设备都有自己的管理系统。特别是大规模数据中心,必须通过集中的管理系统来运行管理计算、存储、网络等设备,以能够快速响应和处理数据中心的业务变更、异常事件、持续优化。在《IP领航》往期的文章中曾多次聚焦"数据中心的管理",但大都侧重于"以网络为核心"的管理,本文将把视线放大到整个云计算环境下的数据中心,对三种运行管理模型逐一对比分析。

姓名:张刚 学号:17021210979

一、云计算的概念及特征

云计算商业模式就是要实现IT即服务,无论是对外还是在企业内部,IT自服务的需求越来越明显。另一方面,超大规模的数据中心急需一个有效的挂历方式来降低运营成本。

随着工业4.0的兴起,云计算已经从实验阶段转化为具体实施阶段。除了部署相应的软件、硬件和虚拟化资源,还有一个问题摆在我们面前,如何运维云?如果没有清晰的云运维规划和手段,云数据中心将难以高效的运转起来,所以云运维对于云建设者来说是至关重要的一环。那么云数据中心与传统的数据中心运维有什么共同点和差别?做好云运维应该关注什么?该如何选择一个合适的云运维工具?上述问题都是应该是云运维过程中会遇到的。下文会针对这些问题展开详细论述

一、云计算对运行管理变革的驱动

【嵌牛导读】:云计算时代,IT运维迎来转型升级。传统 IT 运维问题日显, IT 运维转型是必然趋势;云计算时代的 IT 运维转型升级向云运维方向发展,包含两方面内涵:运维技术的云化和对云的运维;市场对高效运维的需求和云计算、大数据等技术手段是云运维得以兴起的根本原因。

1、云计算的概念

在云计算技术体系架构中,运维管理提供IaaS层、PaaS层、SaaS层资源的全生命周期的运维管理,实现物理资源、虚拟资源的统一管理,提供资源管理、统计、监控调度、服务掌控等端到端的综合管理能力。云运维管理与当前传统IT运维管理的不同表现为:集中化和资源池化。

图片 2

传统数据中心,基础架构层面设备之间通过标准化连接和协议互通,保证了计算、存储、网络设备的管理系统之间相互分离、独立如图1所示),从而使得不同的运维团队可以按照自身业务发展与架构演进的趋势不断完善和深化各自的管理规程,满足数据中心业务不断发展的要求。

【嵌牛导读】:IT运维转型之路何去何从

云计算(cloud computing)是一种通过Internet以服务的方式提供动态可伸缩的虚拟化资源的计算模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源(资源主要包括网络、服务器、应用软件、存储及服务等)共享池,这些资源能够被快速提供,用户可根据个人或团体的需要对云计算的资源进行租赁。继个人计算机变革、互联网变革之后,云计算也被看作是第三次的rr浪潮,是中国战略性新兴产业的重要组成部分,它不仅实现了信息时代商业模式上的创新,而且也为人们生产和生活带来了根本性的改变,必将成为当前全社会所关注的焦点。

云运维管理需要尽量实现自动化和流程化,避免在管理和运维中因为人工操作带来的不确定性问题。同时,云运维管理需要针对不同的用户提供个性化的试图,帮助管理和维护人员查看,定位和解决问题。

一、云运维与传统数据中心运维比较

图片 3

【嵌牛鼻子】:智能化     自动化    可视化

2、云计算的特征

云运维管理和运维人员面向的是所有的云资源,要完成对不同资源的分配、调度和监控。同时,应能够向用户展示虚拟资源和物理资源的关系和拓扑结构。云运维管理的目标是适应上述的变化,改进运维的方式和流程来实现云资源的运行维护管理。

“云是数据中心的新IT形态”,云与传统数据中心的建设目标是一致的,都是为企业提供IT服务。运维人员的职责都是保障IT服务的质量,围绕服务等级协议SLA展开各种运维活动。然而在运维技术、管理模式、财务流程、服务分级、业务要求、运维职责划分等方面两者又有所不同。

图1传统数据中心管理运行架构

        智能化、自动化、可视化是运维发展的三大趋向; DOCKER 技术或将给运维带来大变革;在 IT 运维转型大势驱动下,BSM(Business ServiceManagement, 业务服务管理)、 APM(应用性能管理) 将顺势崛起; 基于大数据分析是 IT运维向高级发展的重要路径。

(1)多元化的应用服务

云计算运维管理应提供如下功能:

· 相对于传统的数据中心,云数据中心的服务特征更加明显,云数据中心将基础设施(IaaS)、平台(PaaS)、软件(SaaS)以服务的形式提供给最终用户,它利用虚拟化、SDN等技术将网络、计算、存储以及应用等资源池化,通过自动化技术按需为用户分配IT资源。因此在云运维中IT请求交付(Request Fulfillment)流程的地位不断突出,也使得云运维显示出明显的运营性质。

在云计算环境下,各自独立分离的运行模式不能支持云服务的展开,新的IT运行模式对传统的管理架构提出了挑战:

IT运维转型升级机会大,细分领域将涌现龙头企业

云计算可将大量计算资源在一个公共资源池中集中。并通过租用的方式以实现计算资源的共享,所提供的资源网络即被成为云。云计算不仅能够使用户对资源能随时获取与存储,并按需使用,而且利用其庞大的计算机群以及数据挖掘技术,为用户反馈出准确、详尽的结果,确保了用户服务的多元化与高效性。

1、自服务门户

· 云也改变了传统数据中心的财务管理模式和采购模式,传统数据中心原来的采购流程变为了服务审批流程。要申请云数据中心资源,面向云业务的计费系统也应运而生。云计费除了用于真正的收费场景外,更多的时候应用于企业内部,通过内部核算,也就是经济杠杆去有效约束IT资源需求,形成在服务质量和IT资源间的平衡,有效提升IT资源利用率。

虚拟化:传统数据中心中每个物理服务器上只是单个或几个应用的固定运行,业务基本是与主机的绑定运行方式,对主机的管理,某种意义上也就是对业务的管理。云计算环境下服务器大量采用虚拟化技术,每一个物理网络端口下都会分布多达数十个虚拟机,物理主机上运行着多个不同的操作系统和应用,网络中应用密集度极大增长,对网络的性能、规格、可靠性都提出更高要求,而虚拟机网络属性的可管理性更是面临巨大挑战。

1)从市场看, 云计算蓬勃发展,市场规模增速快, 云计算在中国的落地和繁荣将成为云运维持续发展的核心动力; 从政策层面看,国家政策鼓励发展“互联网+”、云计算、大数据、物联网,提高各行业信息化建设水平,促进运维需求增长,推动传统运维向云运维转型,同时国家建设绿色数据中心的要求将推进智能化运维的发展,为运维转型升级提供动力。

(2)高可扩展性

自服务门户将支撑基础设施资源、平台资源和应用资源以服务的方式交互给用户使用,提供基础设施资源、平台资源和应用资源服务的检索、资源使用情况统计等自服务功能,需要根据不同的用户提供不同的展示功能,并有效隔离多用户的数据。

· 云数据中心对IT服务交付速度提出了更高的要求,然而云数据中心的基础结构却比传统数据中心更加复杂,手工交付难以满足云服务交付的速度要求,更容易发生故障,自动化交付就成为了云服务交付的必要手段。

动态性:传统数据中心的业务针对物理主机展开,而物理服务器一般固定连接在某个网络端口上,并且业务属性单一,无论是网络策略、安全控制都比较固定。只要主机与网络运维界面清晰、系统归属明确,则业务容易展开,并能平稳运行。但是云计算环境下部署着高密度的虚拟机,在虚拟化环境下,基于服务变更、容灾、分布式计算等业务运行要求使得虚拟机动态迁移成为必备属性。如果网络无法感知这种动态性计算方式,持续的运行必将造成业务的紊乱、运维的不可控,这就要求管理系统能够具备动态计算的感知能力。

2)细分领域专业化程度尚低, 产业与资本仍在酝酿。

当前主流的云计算平台均根据SPI架构,在各层集成功能各异的软硬件设备与中间件软件。大量中间件软件和设备提供针对该平台的通用接口,允许用户添加本层的扩展设备。部分云与云之间提供对应接口,允许用户在不同云之间进行数据迁移。类似功能更大程度上满足了用户需求,并对计算资源实现了有效集成。

2、服务目录管理

在传统数据中心,运维人员需要关注基础设施的维护,而在在混合云和公有云应用场景中,应用管理的地位更加突出。运维人员不必关心部署在公有云上的业务所依赖的基础设施,而业务监控的职责也转移给公有云提供商。公有云提供商不但要保障IT基础设施本身,还要更加关注承载业务的运行状态。

关联性:当前的网络与计算之间以一种松耦合方式运行,网管与主机管理系统之间基本上没有信息关联交互,这样,对于虚拟化数据中心,虚拟机的动态性计算特性,网络无法感知、网络管理系统无法对虚拟机进行定位,网络对业务的安全、控制、配置、监管便无法关联到虚拟机,无法实现云计算下的灵活部署和扩展性。

3)国外企业如 IBM、 BWC、 HP 等企业在云运维领域的产品和布局为国内运维企业

(3)服务的安全性

建立基础设施资源、平台资源和应用资源的逻辑视图,形成云计算及服务目录,供服务消费者与管理者查询。服务目录应定义服务的类型、基本信息、能力数据、配额和权限,提供服务信息的注册、配置、发布、注销、变更、查询等管理功能。

二、云数据中心运维简介

自动化:在非虚拟化环境中,业务部署后一般都具有相对的固定性,即主机位置、网络接入比较确定,运行维护的目标与物理机、物理端口一致,这种情况,主机系统、网管系统分别部署、调试对接相对比较容易。但在大规模数据中心,特别是云计算环境下的业务流程,基于传统的分离调试是无法有效支持云服务的业务模式,这就要求整个服务的供应应能够简单提交、且不同系统(基础的计算、网络,上层的主机、网络管理系统)之间能够交互服务信息,并基于一致的业务要求完成所有部件的自动化部署与运行。

发展提供了借鉴。

云计算中的分布式数据中心,可将云端的用户信息备份到地理上相互隔离的数据库主机中,甚至用户自己也无法判断信息的确切备份地点。该特点不仅仅提供了数据恢复的依据,也使得网络病毒和网络黑客的攻击失去目的性而变成徒劳,大大提高系统服务的安全性与容灾能力。

3、身份与访问管理

在云数据中心维护过程中,云服务请求交付系统、计费组件以及自动化部署组件已经从云运维系统中剥离出来,形成相对独立的运营平台—云平台。云平台提供了服务目录、自助服务台、云服务自动部署、以及一体化的计费和核算功能,因此云平台对云数据中心的正常运转至关重要。

二、云计算管理的目标

4)国内企业如华胜天成、 广通软件、 北塔软件、银信科技和新华三等纷纷推出云运维相关产品。

(4)使用的便捷性

身份与访问管理提供身份的访问管理,只有授权的用户才能访问相应的功能和数据,对资源服务提出使用申请。

而传统的网络监控、服务器监控、机房监控、业务监控、事态管理、变更管理、问题管理、配置管理对云数据中心而言依然不可或缺。

为了支持云计算虚拟化、动态化、关联性、自动化的服务要求,整个云计算系统需要有一个统一的操作运行管理平台,能够对云服务进行端到端自动化部署,同时快速响应资源调度与业务变更的服务需求如图2所示)。

三重逻辑把握 IT 运维转型升级带来的机遇

云计算管理软件将整合的计算资源根据应用访问的具体隋况进行动态调整,包括增大或减少资源的要求。因此云计算对于在非恒定需求的应用,如对需求波动很大、阶段性需求等,具有非常好的应用效果。

4、服务规则管理

云平台是云数据中心的对外服务和展示窗口,是云租户对云数据中心的直观体验。云数据中心运维是云服务水平的后台保障,二者就像客机上的空乘和地勤一样,在云数据中心缺一不可。

图片 4

1)从细分领域看,需抓好 IT 运维新领域应用大机会,我们重点看好APM、 BSM 等新领域。

二、云计算运维管理的要点

服务规则管理定义了资源的调度、运行顺序逻辑。

1、云运维过程中需要关注哪些问题?

图2 云计算的管理目标

2)从运维技术看,把握新技术运用方可引领未来,我们优选新兴的 Docker 技术、 基于大数据的运维管理、 SaaS 化运维等技术这几大技术方向。

云计算在运维管理中其所涵盖的范围非常广泛,其中主要包括了对环境管理、网络管理、软件管理、设备管理、日常操作管理、用户密码管理以及员工管理等多个方面。要良好实现以上的管理目标,则应着重从云计算运维管理中的运行监控、安全性管理和自动化处理这三个要点出发。

5、资源调度管理

在云运维过程中主要需要关注如下几个问题:

统一的服务平台能够屏蔽云服务供应层面对底层不同架构的差异,使得用户或业务运营部门聚焦在服务层面,不必关注云计算资源(计算、网络、存储)本身的技术属性。

3)综合地来看,在云运维领域,在技术有领先优势、在细分领域深耕细作、对客户资源有较强把控力的企业,能够更好地服务于客户,在同质化竞争中打出差异化路线、并且以高的用户黏性和高的用户续费率源源不断地为公司创造价值并且产生现金流。因此,这部分拥有综合优势的企业将更有希望在IT 运维转型升级领域中脱颖而出。

1、运行监控云计算的运维管理应从数据中心的日常监控人手,对日常维护管理、事件管理、变更管理以及应急预案管理等进行全方位的日常监控,以提前发现问题并消除隐患。通过对云计算良好的运行监控,从而实现对各个系统服务的统一管理,以及对各服务操作系统应用程序信息的统一收集,并实现对各层面信息的综合分析、归纳和总结。而且通过有效的运行监控,在系统出现问题时能及时的向系统管理员预警,从而提前解决问题,有效避免了因系统故障而导致企业蒙受经济和信誉上的损失。

资源调度管理通过查询服务目录,判断当前资源状态,并且执行自动的工作流来分配及部署资源,按照既定的适用规则,实现实时响应服务请求,根据用户需求实现资源的自动化生成、分配、回收和迁移,用以支持用户对资源的弹性需求。

  • 选择开放架构

在自动化响应的管理关联结构上,云服务的提供需要将业务需求转换为对基础资源的部署要求,并形成相应的底层配置下发到不同的设备上,同时在服务变更(包括容灾、虚拟机迁移、扩展等资源的操作与调度)过程中,能够全方位调整底层设备的配置、功能、对接,以匹配业务需求。

一、云计算时代, IT 运维迎来转型升级

2、IT规范化主要是指通过对企业IT的规范化,从而有效实现对企业IT资产的管理,包括了对企业重要文件资料的跟踪与审计、对可能出现泄密或病毒蔓延的介质与设备进行有效控制、对客户端安全分级管理、恢复性操作以及非法软件的禁用等等。通过实现IT规范化,有效解决了因云服务所引发的安全问题,并且强化了服务中运营管理与安全技术保障,增强了企业和用户对使用云服务的信心。

6、资源监控管理

云虽然已经到达了可实际部署阶段,但是云平台架构、计算虚拟化技术、网络虚拟化技术、云与大数据的配合等技术依然发展迅速。为保障云运维的持续发展,应该优先选择正在不断演进的开放平台作为基础架构。

三、如何选择合理的运行管理模型

1.1传统 IT 运维问题日显, IT 运维转型是必然趋势

3、自动化处理随着当前IT建设的不断深入,以及云计算能力和规模的扩大,云计算运维管理的难度与复杂度也日益增加,如果只是依靠人工的运维管理将无法满足当前企业的发展需求。这些新特性都对IT管理的自动化能力提出了更高的要求,企业需要更高程度自动化处理来以此实现运维管理的专业化、流程化与标准化。自动化管理已然成为了当前云计算运维管理的一个必然发展趋势。

资源监控管理实时监控、捕获资源的部署状态、使用和运行指标、各类告警信息。

  •  CMDB作用愈加明显

模式一:集中统一的云计算运行管理

IT 运维是信息化时代企业不可或缺的一环。 IT 运维管理,是指单位 IT 部门采用相关的方法、手段技术、制度、流程和文档等,对 IT运行环境(如软硬件环境、网络环境等)、 IT 业务系统和 IT 运维人员进行的综合管理。配备专职 IT 运维人员的企业会自行进行 IT运维管理;而其余企业选择将 IT 部门的职能全部或部分外包给专业的第三方 IT 外包公司管理,集中精力发展自身的核心业务。

三、对当前云计算运维管理的改进研究

7、服务合规审计

在私有云和混合云应用场景中,高度集中的业务、高度集中的设施、广泛应用的虚拟化技术、众多的云设施和软件供应商、多样的云服务消费者,以上这些因素组合在一起,使云运维的复杂度成指数级增长。云数据中心的设备信息、应用信息、策略信息、维保信息、组织信息、负责人等各维度的信息交织成复杂的关系网,实际运维时如果能从这张关系网中将所关注的信息抽丝拨茧,将大幅提升云运维的效率。反之如果没有有效手段管理这些关系,云运维可能会变得混乱和无序,运维效率低下,使云服务体验大打折扣。设计合理的CMDB(配置管理数据库)恰恰是解决这个问题的最佳途径。CMDB自动同步配置项信息,将割裂的各维度信息关联在一起,帮助云运维人员全面、准确和及时地了解业务相关的组织、资源、环境和服务等不同维度信息,使运维人员快速准确地了解事件影响范围,作出正确的决策。

为了实现灵活的云计算服务,有些人提出了一种以统一集中的方式进行数据中心基础架构的运行管理模式如图3所示)。这种模式下,云的操作管理平台能够对计算、存储、网络进行整合,在用户操作平面上形成单一的界面,在逻辑结构、运行结构上很清晰,管理层次少。

自信息化普及以来, IT 运维对企业的发展而言不可或缺,因其能保障企业“网络不断、系统不瘫、数据不丢”,在保证各类 IT 基础设施稳定运行的基础上对关键业务提供良好支撑,使企业的核心业务能够实现不间断、高质量的运行,最终保证并提升公司的运营效益。

为促进当前云计算运维管理的优化与改进,应从打造一体化的的运维管理模式,并将业务导向放在首位,从而有效实现完善、成熟的IT运维服务体系的构建。

服务合规审计对资源服务的合规性进行规范和控制,结合权限、配额对服务的资源使用情况进行运行审计。

  • ·使用必要手段全局监控业务质量

图片 5

图片 6

1、一体化的管理模式一体化是指云计算的数据中心运维管理,是数据中心生命周期中最后一个也是历时最长的一个阶段,从前期应用架构设计、软硬件资源配置评估、应用服务性能瓶颈评估到安全防护和系统优化等工作,都需运维人员全程参与。因此在对云计算运维管理的改进中,应从日常监控、周期巡检、服务受理、故障处理、平台维护、配置管理、安全管理等方面着手,利用自动化运维工具,实现对物理资源、虚拟资源的统一管理,提供资源管理、统计、监控、调度、服务管控等端到端的综合管理能力,从而实现对云数据中心统一、便捷、高效、智能的一体化运维管理。

8、服务运营监控

在混合云应用场景中,部分开放的业务会部署到公有云上,企业运维人员无法有效的监控到公有云的基础设施,在这种情况下,公有云的服务等级SLA就成了一个黑盒,无从监控。所以必须要有有效的手段全局监控业务质量,从而间接评价公有云服务等级SLA。

图3集中统一的云计算运行管理模型

图片 7

2、将业务导向放在首位运行维护服务能力的四个关键要素分别是:人员、资源、技术和过程。每个要素通过关键指标反映运行维护服务的条件和能力。将业务导向放在首位,就是对人员、资源、技术和过程这四个关键要素的提升。从而有效实现云计算运维管理的改进。首先,应通过现代化与自动化的运维工具完成系统预备、配置管理以及监控报警等功能,降低故障发生率,提升故障发生后的响应处理效率,实现企业业务的快速恢复;其次,应做好在运维管理中新业务的快速部署、系统容量的平滑扩容以及资源分配等各个方面的业务项目,从而保证服务达到相应的等级标准,并能根据业务目标形成IrI’服务的管理目标;最后,还应当通过改进运行维护服务能力与管理过程中的不足,以持续提升运行维护服务能力。

服务运营监控将各类监控数据汇总至服务监控及运营引擎进行处理,通过在服务策略及工作请求间进行权衡进而生成变更请求,部分标准变更需求别转送到资源供应管理进行进一步的处理。

  • 明确云架构下各机构的责任主体

这种结构虽然在一定程度上实现统一的业务部署、基础资源的自动化调度,但局限性很明显。不同的IT系统有其固有的专业性,网络、计算、存储各个系统的监控运行、故障处理、软硬件升级、容量与规划完全不同,要在一个管控系统中既做到业务的统一,又做到基础管理的全面,不仅对这个系统本身的规模、复杂性、功能性、专业性提出了挑战,而且对于支撑管理运行的团队,也在操作配合、知识体系、专业交叉上产生了巨大的复杂度。

传统 IT 运维问题日显, 究其根本是管理问题。 传统 IT 运维在发展过程中显现出了各个方面的问题:

四、总结

9、服务质量管理

由于企业组织架构是按照传统的网络、应用、计算来划分的,而在混合云场景中,云服务商与企业运维人员也不属于同一组织机构,所以当部署在云上的业务出现故障时,容易出现组织间的推卸责任的问题,从而延长了问题的定位和解决周期。因此企业运维人员要有手段基于业务按照网络、计算、应用等不同维度的出具资源健康度报告,明确问题责任主体。

即使是一个厂家能够以极高的专业程度整合多个基础资源的运行管理到这样的统一系统,这个系统也必将非常巨大、复杂,其本身的运行维护也会存在极大难度。

其一,运维服务人员工作忙碌却不受重视,传统的“救火式”运维大大增加了运维人员的工作强度和工作压力,难以量化的工作得不到业务部门的认可。

云计算为现代化的运维管理体系带来了新的理念,将传统运维工作中的大量重复性、简单的手工工作通过软件实现,从而使运维人员能有更多精力、条件投人到整个服务的生命周期当中。我们应当加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。

服务质量管理遵循SLA要求,按照资源的实际使用情况而进行服务质量审核与管理,如果服务质量没有达到预先约定的SLA要求,自动化地进行动态资源调配,或者给出资源调配建议由管理者进行资料的调派,以满足SLA的要求。

  • 云场景下如何有效控制开销

模式二:双属式管理

其二, IT 系统复杂,维护难度高,系统宕机风险系数大。

...

10、服务计量管理

云应用场景中还有另外一个问题,就是如何使用最小的开销(公有云资源),最大限度地保障业务的质量。为了保障业务的稳定运行,企业运维人员通常为每个业务申请一定的资源余量,然而过多的余量会增加财务成本,如何确定这个量,就成企业运维人员关注的问题。一份能将业务运行时所需要的CPU、内存、磁盘等历史信息进行有效分析的可度量的业务容量分析报告,将对企业运维人员非常有用。如果在资源不足发生前,有工具能够提前预警,给企业运维人员充分时间调整资源分配策略,将有效节省公有云开销。

第二种模型是双属式管理模型。如图4所示,在类似第一种模型的架构下,除了统一的运行管理平台,在计算、存储、网络各个系统中集成各自专业的管理系统。相比模型一,模型二有极大的增强,不仅可以简化统一运行管理平台的复杂度,又引入了传统成熟的运维管理方式,并分离了云计算的服务运营与基础架构管理,形成一个具有分工与协作的IT运行结构。

其三,技术人员难培养,流动性大,有经验的技术人员因为不受重视而辞职,造成运维质量和客户满意度的波动。

本文由巴黎人手机版发布于巴黎人-服务器,转载请注明出处:在当前有着重要的现实意义,一、云运维与传统

上一篇:没有了 下一篇:没有了
猜你喜欢
热门排行
精彩图文