宇婷:阿里云发布CIPU,对于企业客户意味着什么?

宇婷
+ 关注
2022-06-14 19:10
464次阅读

极致聚焦TO B行业 

商业记者宇婷原创、一线报道 

2022年阿里云峰会上,阿里云智能总裁张建锋表示,阿里云今年最重要策略是“B2B”,也就是“Back to Basic”,回到云计算的本质。
云计算的要义是推动包括软件和硬件驱动的技术创新,从而提升算力。
阿里云这场发布会的重点放在:数据中心体系架构变革之上。
作为一个云计算厂商,服务这么多客户以后,阿里云发现客户对他们的诉求是:逐步从业务逻辑为中心,转向了数据处理为中心。
此次,涉及到变革的关键技术是——CIPU。CIPU(Cloud Infrastructure Processing Units 云基础设施处理器),将替代CPU成为云时代IDC的处理核心。
1、原来需要3.5台,现在2.5台就够了
云上客户的需求发生了很大变化,数据密集型的计算越来越多,不断地提高了对云计算提供的低时延、高带宽的需求,这些需求很难通过传统体系结构去满足。
CIPU推出,原来需要3.5台同样规格的计算资源,今天可能因为CIPU,企业用户只需要2.5台的同样规格的服务器,就可以完成这样的计算。
效果是为云上的客户带来更好的性能,尤其是更好的性价比。
CIPU是跑在阿里云的云操作系统底下,来支撑云操作系统更高效地做云资源的管理和加速。从客户视角来讲,客户看到的其实就是虚拟的计算集群、存储集群、网络集群,到客户这里直接体现为算力。
区别在于被CIPU管理的数据中心提供了云算力,调度效率以及它的运行算力的性能会有比较大的区别,明显要好于不用CIPU加速的这些云算力。
阿里云要达到的目标是——所以从客户视角来讲,他其实是无感的。客户的应用不需要改任何代码。但能更快、更敏捷、更灵活了,性能更好了。
客户看到的其实就是云上的一个池化的统一管控的算力资源。客户取用的时候,就是能发现:第一有更好的性价比;第二,当他的应用不需要做任何的调整的时候,本身性能就会更高。
客户对云计算的要求是什么?不是直接使用硬件,客户希望通过虚拟化的技术来使用软件而使用硬件,所以他是可以不关心操作系统及其以下部分,操作系统及其以上部分他做到标准化就可以了。
2、“因为我们不去研发,就没有人会去研发。”
阿里云是怎样想到在CIPU上进行创新呢?
在阿里云近几年的创新过程中,明显看到了一种“端到端”的痕迹。
如何让飞天操作系统跑得更好,别人帮不了阿里云,在这一点上阿里云只能选择端到端去自研,垂直往下。但是一旦是客户能感受到的部分,阿里云的边界守在用开放的方式与生态合作(硬件、软件合作方)。
“因为我们不去研发,就没有人会去研发。”阿里云高管也在采访中对记者表达。
另外,作为一个云计算厂商,需要降低自己的成本。
阿里云不但要做资源池化,资源池化本身要应对的是多租户环境,因为要服务不同的客户。从这个视角来讲,最大的挑战是当你资源池化达到全球上百万台服务器的时候。整体的虚拟化或者说资源池化出的算力,无论是计算资源还是存储资源、网络资源,这些资源如何能够进行统一的管理、调度、编排,而且是让它更有效地发挥出它的性价比?这是不变的难题。
过去十多年,云计算技术发展经历了两个阶段:
第一阶段是分布式技术,推动互联网企业从大机向分布式系统整个迁移;第二阶段诞生了资源池化技术,通过计算存储分离的架构,对资源统一的调度编排,提高云计算的可靠性和可用性。 
进入第三阶段,CIPU的研发是要协助或者说承载飞天云操作系统需要去纳管的整体编排、调度的上百万台服务。
在CIPU这个品类里面,推出新物种,在云上能够大规模普惠化的高性能网络加速服务,叫eRDMA,延时能低到5.5微秒。CIPU推出,阿里云针对上层的飞天云操作系统包括我们更上层的要跑在云上的应用,做了非常多的定制化开发。与之相对的飞天云操作系统本身的内核,如神龙计算平台、盘古存储平台、洛神网络平台包括安全内核,实际上都是对CIPU本身所具备的能力做了深度的适配。
从而让客户在低成本组网之外,结合龙蜥的操作系统,以及用户态的一些驱动技术,让客户不需要修改一行代码,能够无缝地加速所有的分布式应用。阿里云基于CIPU的架构,加飞天操作系统架构,推出的eRDMA(弹性RDMA)的技术。系统对延时要求特别高,它在阿里云上开发几乎不用改代码。使用阿里云的龙蜥操作系统就可以。
eRDMA就是典型的是一个物理世界不存在,但是它是虚拟出来的大规模普惠化的网络延时技术。物理世界它不一定存在,但是在云计算里面就存在,它解决了企业的特殊问题,这里面背后就是软件定义。软件定义的背后就是飞天操作系统。飞天操作系统怎么跟这些差异化的硬件进行协同和协作?那么就需要有一个CIPU。
3、为无法计算的价值 
目前,数据中心的低碳绿色,是中国乃至世界上绝大部分数字化转型必须做的思考。
这两个阶段的演进推动云计算发展,但它们都是通过软件定义的方法,基于传统的以CPU为中心的体系架构去做优化,已经触及瓶颈。
“飞天+CIPU”,形成软硬件结合。CIPU向下接入物理的计算、存储、网络资源,快速云化并进行硬件加速;向上接入飞天云操作系统,管控阿里云全球上百万台服务器,让算力虚拟化损耗降到0,并通过规模化应用RDMA网络技术,让访问云端比访问本地硬盘更快。
与英特尔、英伟达的路线不同(产业链上的供应商),阿里云的CIPU是通过云的规模、业务,客户云的需求,根据飞天操作系统从顶层定义,又根据垂直业务定义芯片,寄托于CIPU的精准度能够精准解决云操作系统关于管理、控制和调度的问题,以及部分核心业务加速。
与AWS对比。阿里云认为其与AWS其实都迈入到了类似的一个新阶段,只是说有些区别是因为阿里云在不同的市场里面,看到的风景不太一样。举例,在应用跑起来以后,其性能无论在计算、存储还是网络的技术指标上,有优势。这是因为国内的客户对性能的要求和性价比的要求非常极致,也与垂直的技术栈的深入有关系。
为什么要重提无法计算的价值?云计算解决的是不同规模的企业,能够用上高可用的分布式技术,满足业务的需求。
在之前采访无影的案例中,我也感受到,未来服务器或者主机的概念有可能会淡化,云服务真正被接受的时候,企业的算力直接从云计算公司获取。
企业客户在数字化改造的时候,没有能力搭建分布式系统。不需要改代码的情况下,企业用户就可以获得别人可能投入了几百人或者上千人,投入了大量钱研发出来的一个eRDMA的技术,在阿里云上什么都不需要投入就可以获得这样的技术红利。
但即便进入第三阶段,无论是软件定义还是软硬驱动,云计算的本质仍然没有变。
除了回归技术本身,这次也提醒了云计算的本质,依然是让更多中小企业享受到技术红利。这是云计算能够帮助我们突破计算限制,实现从个人到企业的创新的重要原因。
技术的发展趋势是从技术的整合走向了技术的融合,从技术整合走向技术融合,使得摩尔定律可以继续生效。
我回想曾经看到的一篇文章,有一个很有趣的细节,阿里云刚成立的前两年,员工出差用餐时,开发票的服务员总是“好心”地将“阿里云计算有限公司”,写成”阿里云计算机有限公司”。多加一个“机”字。
软件、硬件,推动技术发展,潮流总是重复的。
参考:阿里云技术产品负责人蒋江伟(小邪)、阿里云虚拟化技术负责人蒋林泉(雁杨)、阿里云基础产品首席架构师黄瑞瑞媒体采访,以及张建锋 阿里云智能总裁/阿里巴巴达摩院院长演讲。

本文经授权转载自微信公众号:极致兔贝

腾讯SaaS加速器,加速闯进SaaS创业者心智

资深作者宇婷
0
相关文章
最新文章
查看更多
关注 36氪企服点评 公众号
打开微信扫一扫
为您推送企服点评最新内容
消息通知
咨询入驻
商务合作