以银行业为例追溯边缘计算发展

有这样一个人,目前服务于安邦保险集团,混迹于各种基础架构论坛,处心积虑为了扭转IT鄙视链,作出极大牺牲,但自嘲目前仍生活在最底端。期待各位大牛开发出更高更快更强的解决方案,这是他喘气的原动力。他就是王宇恒。现在,他脱掉IT制服,就是出色的段子二传手;穿上IT制服,就是全心全意的IT民工,服务于数据中心建设和运维相关工作,在参与了农发行两地三中心系统搭建后,常常醉心于研究银行业基础设施和数据中心。本期DCD技术专栏,他将以银行业为例追溯一下边缘计算发展。


 

一、边缘计算数据中心的定义

边缘计算从名字上来说,指的是将算力从核心数据中心端推向数据的源端或者服务的请求端。是一种去中心化的思路,也可以看作是基础架构将数据中心内部算力去中心化向外发散的一种体现。目前这还是一个比较新的概念Gartner在2017 Hype Cycle for Emerging Technologies将边缘计算放在了一个热炒期,跟它相伴的是物联网、虚拟助理这类同处落地探索阶段的技术。

二、数据中心的演进

如果想说明白边缘计算这个概念,不妨让我们回到数据中心算力演进的源头,以银行业为例追溯一下数据中心算力演进的过程。

(一)分布式远古时代

在远古时代银行业的计算是以行政区划(省和计划单列市)为单位进行分布式部署,各区域内数据中集中存储,跨区域间利用报文等方式进行通信。根据CAP原理这个时候的银行系统选择了一致性(Consistency)、分区容忍性(Partition)但是舍弃了可用性(Availability)。可用性的降低必然会导致效率低下、监管失控等多方面的问题。所以在银行IT在基础算力具备的前提下开始了数据大集中的进程。

(二)集中式的近代

银行业在过完了千禧年以后就着手开始了算力的集中,值得注意的是这次集中是算力的集中,并不是架构的集中。银行业称这个变革为数据大集中,数据大集中集中的并不是仅仅是数据,还有与之对应的应用逻辑、业务需求和业务逻辑,是一次算力的整合。在这次集中的过程中,银行业选择了高一致性和高可用性,但是舍弃了分区容忍性。

(三)有总有分的现代

在大集中之后银行业获得了一个体量巨大的数据中心,这里巨大的不只是面积、装机数量以及应用,还有千奇百怪的数据、无穷无尽的需求、臃肿不堪的系统、疲于应付的IT。所以现在银行业IT更趋向于打造平台,将数据回发,本地数据本地加工本地使用。这个时候IT对数据或者说算力进行了多维度划分,所以这时候算力并不太遵循CAP的原则。

从金融业的演进可以看出,分有分的道理,合有合的缘由,分分合合就是看业务需求呀^_^完全的分和完全的合都不是最好的解决方案。分中有合,合完了再分,多角度,多维度合理划分算力才是正道。

早期的互联网跟银行差不多,也是全套IOE,高等级数据中心。但随着互联网的发展互联网公司逐渐醒悟了,我这边完全没有银行那样变态的数据的一致性要求呀!这就TM开挂了呀!所以从Google的三架马车开始互联网就点亮了一条全新的技能树,高分区容忍性,高可用性,低一致性,这条科技树在现阶段为边缘计算提供了丰沛的沃土。

上面扯了这么多,我们再回来看边缘计算,越靠近用户就意味着约好的体验,也意味着更高的成本,所以当边缘计算成为一个选项之后CXO们是不是勾选这个选项背后的逻辑就很值得玩味了。就像两三年前云计算发展之初,哪些系统要上云(公有云)实在是个值得头疼的问题。所以………究竟上还是不上?

二、边缘计算数据中心可能的应用场景

目前边缘计算还没有很成功的落地场景。不过还好,这个时代有足够多的厂商和大牛,指明了前进的道路^_^。边缘计算的落地前景我个人看到大牛们总结的以下三个方向:

1、  第一个是我最看好的落地方向–物联网平台。目前微软的Azure平台已经开始提供基于Edge的IoT云计算平台解决方案了(好绕),其他的应用场景还有Cisco提出的雾计算(Fog computing),不过这两个平台成功落地的项目好像还不多。这个场景中边缘计算是强需求,传感器的数量如此之多,以至于如果不做本地处理那么核心数据中心可能会比银行还要庞大。类似的场景还有AR,CDN等。

2、  第二种落地方向是网格计算。这个详见BOINC,这个方向已经有非常多的落地项目了,不过这个本质并不是为了拉近用户实现商业价值满足业务需求,而是为了集中广泛分布的闲置算力用来进行科学计算,当然今天能做科学计算,明天也许就能做通用计算。

3、  最后一个场景就是MEC(Mobile Edge Computing),这个本质跟物联网没有太大的区别,个人认为只是套了个Mobile的壳,像智慧城市或者物联网一样固化了一定的场景。去年ETSI发布了MEC相关的标准,不过到目前为止这个MEC也只是停留在很前期的阶段。

听起来为什么感觉有点像炒作,并没有落地的项目呀!是呀因为大面积的分布式需求目前还没出现,互联网公司的多数据中心推进也只是停留在持有个位数的数据中心更贴近用户并不能带来更高的收益,而且针对广泛物理分布的大集群调度管理平台也只是Google、微软、亚马逊等少数精英的独门绝技,远没有普及开来。

这就是人类的科技,我们并不知道我们不知道什么。所以皇帝才不用金锄头干活,老佛爷的枕头边才没有一筐柿子饼呢。边缘计算真正落地可能根本不是上述三个场景中的任何一种。互联网的下半场谁知道会有什么样的惊喜呢。

三、边缘计算数据中心/去中心化的主要障碍

站在既有的认知基础上,要实现边缘计算落地我觉得目前主要有两个障碍,一个来自商业逻辑一个来自技术准备。

从商业逻辑来讲,目前还没有一个强需求来支撑边缘计算这项技术。物联网可能是一个,但是物联网在哪里可能连它本身也没想明白。近源数据交互也可能是一个,但这些场景是不是一个强需求还很值得商榷。不过这个问题留给那些CXO们去伤脑筋吧,毕竟他们拿着那么高的高薪。

来自技术准备的障碍就直观很多。从传统IT架构到云架构,运维团队面对的服务器从一千多台跃增到几万甚至十几万台,数量的激增导致整个监控运维工作与之前截然不同。在这次考试中各大互联网厂商都交出了一个不错的答卷,为开源世界带来了很多新鲜的东西。那么到了边缘计算,算力运维在庞大的数量基础上增加了地域这个维度,几万十几万台服务器每个都被打上了地域的标签,并分散到十几个甚至是几十个数据中心中。空间维度的增加对监控将是一个全新的考验。如何运维好这些分布开来的服务器、如何避免数据孤岛、如何有效进行数据调度、如何弹性应对网络需求、多数据中心如何协同消除热点,希望边缘计算厂商能给出完美的答卷,并为开源世界带来更多有意思的思考和项目。

四、尾巴

在说尾巴之前容我先装一下抛一个问题。

算力的终极形态应该是什么样的?

我认为从人类历史的角度来看,人类的行为方式具有很强的重复性。今天我们处于信息革命的阶段,抹去浮华的表面,这次信息革命与之前的两次工业革命并没有本质的区别,都是一种驱动力的标准、持续稳定的供给。算力发展的方向应该是摆脱算力实现路径完成标准化供给的过程,就像电力从Nikola Tesla到Tesla, Inc.的过程。边缘计算是实现算力广泛分布并高度抽象的基础,只有这步实现了才能向无路径差别算力转化,实现了标准算力的持续稳定供给才可能是这次信息革命的一个里程碑。通过互联网点亮的下半场科技树,分布式计算已经有了长足的进展,算力已经开始慢慢的摆脱实现路径依赖,目前束缚分布式发展的主要压力应该是来自于传统架构的束缚,这里的传统架构可能是TCP/IP,甚至可能是图灵。

最最后做个小广告,欢迎各位关注BOINC项目,用您闲置的算力为这个世界做一点伟大的贡献吧 https://boinc.berkeley.edu/。 同时BOINC处理分散算力的方式也需会对寻找边缘计算落地框架的你带来一些有趣的思路。


后续DCD将推出更多技术专题文章,将与行业专家一起从技术侧带来对各个热点话题的深入解读,敬请关注

– 了解更多,尽在DCD –

– 第八届DCD Hyperscale China活动现已全面启动 –

扫描以上二维码,立即预留您的席位