数据中心运营如何实现可视化?



随着传统固话、短信业务营收的逐步缩减,中国联通、电信、移动三大电信运营商不约而同地将收入增长的重点放到了数据流量和数据中心这两个热点领域上。 2014年度, 国内IDC市场规模已达350亿,但三大电信运营商仅占据半壁江山,可见随着数据中心(以下简称DC)需求持续增多,以及市场面向民营资本的逐步放开,竞争将从资源型向服务型转化。

没有比“可视化”更好的一个词能概括市场对DC运营服务的要求了。DC机房内存放着企业客户的交易数据,这些企业对外提供着7*24小时不间断的业务服务,例如期货交易、票务信息、视频游戏、社交通讯、零售物流等。任何突发、未经授权的中断均是不能承受的,这也是企业数据从传统办公楼转移到专业DC机房集中存放的主要原因。然而,封闭不透明的DC运营使得企业客户常常感觉不踏实,他们迫切需要了解DC机房运营的过程和质量,提前预知风险。

调查结果显示,65%的受访者表示希望了解DC机房运营的维护计划和监控数据,25%的受访者表示会考虑为服务报告、主动告警、网络优化等服务支付额外费用。那么,是否运营可视化就是简单的向客户展现维护细节这么简单呢?事实未必如此,很多DC尚不具备条件做到对客户的可视化运营和服务。

要实现可视化,DC的管理团队可能需要做以下准备:

  1. 预先设定服务的界限是可视化的前提,做到运营可视化必须在签订合同时,也签署一份具体的SLA(服务级别协议)。这不光是乙方对服务能力做出承诺,也需要提前准确把握客户的关注点和业务特性,才能更好地框定可视化的范围,体现作用,无边界的需求并不会促进运营水平的提升,反而可能造成服务偏离目标;
  2. 运营标准化是可视化的保障。维护团队各行其是,工作流程随意的DC是无法做到可视化的。DC运营团队需要对繁杂的运维事务进行一次或多次组合封装,按既定流程,以标准化的形式提供服务;
  3. 使用一套业界广泛认可的IT管理方法论,是可视化运营的基础。传统电信运营商的运维工作遵循集团规程和省市各级运维制度,这些制度制定的初衷在于保证通信机房的安全运行,而不是开放式DC面向客户的运营方式。虽然运营商的维护经验很多值得企业客户参考和学习,但这套制度规程相对封闭,并不适应需求灵活多变的商业DC服务。比较而言,ITIL方法论更加适合DC运营,因为这套理念被国内外越来越多的企业广泛认同,更重要的是这些企业来自不同行业;
  4. 可视化运营是一个逐步提高的过程,透明和开放是为了展现运营水平,同时也引入外界监督,最终持续优化运营体系。因此可视化仅仅是过程和方法,而不是目标,具备清醒的认识是做好可视化运营的关键。在可视化运营落地之后,DC的运营管理团队才能顺畅地了解客户需求,为后续产品开发和解决方案提供奠定基础,推动DC服务产品无限贴近客户需求,提供更多粘性服务,这才是目标;
  5. 最后,为了确保可视化运营的落地,我们需要不断建立和修正基线,这是认清我们当前水平的客观体现,盲目追求指标的提升是不科学,也是无价值的。一个数据中心所能提供的服务能力最初是由规划设计标准确定的,T4等级和T3等级所能达到的服务能力显然不同;第二次基线的建立发生在运营团队验证测试(例如系统倒换和假负载测试),并验收这个DC时,建设过程中的各类不可控因素导致机房是否达到设计要求,还需要重新认定;之后的基线建立受运营水平的影响,一个DC的可用性是否能够达到99.999%,甚至更高水平,交付后就要看运营团队理解设计的水平和冗余保护机制、应急预案的执行情况了。

综上所述,可视化运营无论是对作为使用方的客户,还是对提供方的DC运营管理团队,都是收益良多的,这是一种双赢的局面,可以更多地创造服务价值,挖掘业务潜力,避免低价竞争,同时给予最终业务所需的可用性保障和连续性保护。

上海联通在实践可视化运营方面,尝试做到以下几点:

  1. 引入ITIL方法论,融合电信运营商规程制度后,建立一整套适合DC运营的专业化流程和制度,并通过ISO20000认证,同步准备ISO27001认证;
  2. 实施ITIL软件落地,流程固化确保执行操作标准化,同时即将开放IDC自助服务台,允许客户在线交互,查看服务请求履行情况、事件处理情况、发布执行情况,以及监控数据和服务报告;
  3. 与大客户签订SLA,并组织月度例会,回顾服务指标执行情况,并沟通新增服务需求;
  4. 邀请大客户参与机房模块验证测试和验收交付,做到基线建立的充分开放透明;
  5. ISO核心流程设置明确的owner和manager,流程制度开放周期性修订窗口,并确保规范发布,运营流程始终贴近客户需求,并适应实际情况变化;
  6. 各地运营团队严格按照流程文档执行运维操作,团队考核及个人考核与流程执行情况紧密捆绑,运营团队有权在新增需求或客观情况变化导致的流程阻碍时及时升级,并要求触发流程修订,但流程修订前需确保运维操作的一致性。
注:本文作者为中国联通上海分公司云数据运营中心项目支撑处部门经理朱子凡