89资讯移动版

阿里巴巴花了7年造出的阿里云,靠什么实现“7x24小时在线”事业部?

 

 

 

 

 

 

云栖大会上放出的观点成为这几日行业人士乃至社交网络上的热议话题,包括马云的主题演讲。马云在这场主题演讲中,只字未提“阿里云”,但这并不说明阿里云不重要,而是在某种意义上来讲,阿里云“从0到1”的阶段已经完成了。

 

 

在10月13日杭州云栖大会开幕当天,马云发表了就上一财年致股东信,信中提及,“阿里云承载了中国35%的网站并为之提供云计算和大数据的服务,而截至2016年3月31日的阿里财报显示阿里云拥有超过230万用户,其中云计算付费用户达50万。”

 

 

从2009年2月写下阿里云的第一段代码开始,阿里云上上下下的负责人们就一直在试图解释阿里云到底是什么。成立七年的阿里云的业务逻辑是什么?现任阿里云首席架构师唐洪、阿里云资深技术总监李津通过密密麻麻的图表清晰地做出了解析。

 

三句话道破阿里云的天机

 

阿里云的核心人物王坚最近出版了一本书《在线》。王坚自2008年9月加入阿里任阿里巴巴集团任首席架构师,2009年9月创建阿里云计算公司并任总裁,现任阿里巴巴集团技术委员会主席。

 

 

王坚和其团队自主研发的大规模分布式计算系统“飞天”,是阿里云的核心,建立了互联网规模的通用计算平台,完成了云计算公共服务的商业化。

 

 

 

 

 

 

阿里巴巴集团技术委员会主席王坚

 

 

《在线》一书中,王坚对过去8年自主技术创新道路进行了反思与总结。摘出书中三句话,就能从根本上说清楚阿里云的本质以及过去与未来:

 

 

 

1、从某种意义上来说,“飞天”就是一个操作系统,操作系统最重要的功能就是资源管理。

 

 

“飞天”的底层是数据中心,有成千上万台通用服务器,每台服务器都有CPU(中央处理器)、内存、存储,相互之间用以太网进行连接,这套系统简单说就是把所有资源抽象成一台计算机,并通过互联网提供计算服务。

 

 

 

飞天系统与PC系统的逻辑对比

 

 

因此,在过去的7年时间里,阿里云一直在发布这个庞大体系的不同组件,并且在把不同的组件连接起来形成一个有机体。

 

 

众所周知,传统操作系统在升级硬件的时候需要重启系统,而阿里云在升级飞天的时候却不能“重启”——这个很好理解,阿里云已经与社会经济息息相连,必须7*24小时不间断在线。

 

 

另外一个问题是:这样的一个有“生命”的有机是怎么自我调节、自我平衡、部分组织自我重生的呢?

 

 

根据唐洪的介绍,阿里云的生命机理就是阿里云的自动化运维系统“天基”。在“天基”看来,系统里每一台机器都无时无刻地处在部署、升级、迁移以及各个状态的转换中,“天基”在整个系统运行中精准地控制每个进程、每个组件的状态,从而控制每个系统的状态。

 

 

 

2016杭州云栖大会介绍了杭州城市大脑项目

 

 

国内开源界,阿里巴巴也是最大贡献者之一。在开源方面,本次杭州云栖大会上 AliSQL 正式开放了源代码的下载。AliSQL是阿里巴巴基于开源数据库MySQL官方版本的一个分支,应用于阿里巴巴集团业务以及阿里云数据库服务,目前由阿里云数据库团队维护。阿里云在AliSQL上进行了300多个改进,包括针对电商秒杀、物联网大数据压缩、金融数据安全等场景提供个性化解决方案。