Visa数据中心交换机故障 造成大面积交易错误



这是一次非常罕见的网络故障,导致了欧洲数百万交易被拒绝。

本月初,英国财政委员会要求Visa(维萨)公司提供交易故障的细节。对此,Visa做出了相应地回应。

Visa欧洲CEO夏洛特·霍格(Charlotte Hogg)向公众对这次事故做出了“坦诚的”道歉并指出故障期间91%的交易是正常进行的。尽管如此,故障期间大量的零售商还是停止了信用卡交易而临时了选择只提供现金支付的交易方式。

Visa在英国有两个active-active的数据中心,两者都本可以独立处理欧洲Visa百分之百的交易。

Hogg在给英国财政委员会的函件中表示: “两个数据中心根据系统的状态彼此交换信息来保证。在这次故障事故中的两个数据中心都有两个主交换——一个主交换机和一个辅助交换机。一般来说,如果主交换机出了故障,备用交换机会取代主交换机进行工作。在这次故障中,交换机内部出现了一个罕见的问题导致了备用交换机无法运行。因此,找出并隔离主数据中心的系统比往常花了很多的时间。在此期间,主数据中心出了故障的系统依旧在尝试与辅助站点同步消息,从而导致了消息的积压。反过来降低了站点处理交易的能力。”

Hogg补充道:“Visa迄今为止还没有找出交换机出问题的原因,目前公司已经在积极地与制造商对故障交换机进行分析。”她特地强调这次事故与网络攻击无关。

交换机出现故障之后,Visa花了5个小时才发现了问题所在。这期间,交易系统的失败率两个达到了高峰。其中一次持续了10分钟,另一次持续了50分钟,失败率高达35%。故障一共持续了10个小时,总共约有520万交易失败。

Visa还请了国际会计事务所安永(EY)来这次事件进行审查。预计今年年底,Visa将会将欧洲系统迁移到它的全球系统:VisaNet系统。VisaNet系统与欧洲的系统不同的是,它有更多的数据中心,并且服务器分布在多个区域。VisaNet与欧洲的系统相比,有更大的容量和规模。

Hogg宣称:“VisaNet只需要一个指令就可以隔离和移除故障组件,而这个过程只需要花费几分钟。”

原文阅读链接:

http://www.datacenterdynamics.com/content-tracks/security-risk/visa-details-cause-of-widespread-outage-blames-data-center-switch-failure/100287.article

作者:Sebastian Moss 译:Yvonne Feng