OpenStack改进对AI工作负载的支持

OpenStack允许企业在内部管理自己的类似AWS的私有云。即使经过29次发布,它仍然是世界上活跃度最高的开源项目之一,本周,负责监督该项目的OpenInfra基金会宣布推出OpenStack的第29版。这个新版本被称为“Caracal”,强调了用于托管AI和高性能计算(HPC)工作负载的新功能。

典型的OpenStack用户是大型企业公司。可能是像沃尔玛这样的零售商或者像NTT这样的大型电信公司。现在几乎所有企业都有一个共同点,那就是他们正在考虑如何将他们的AI模型投入生产,同时保持数据的安全。对于许多企业来说,这意味着对整个堆栈保持完全的控制。

OpenInfra基金会COO Mark Collier。图片来源:Frederic Lardinois/TechCrunch

正如英伟达CEO黄仁勇最近指出的那样,我们正处于一个投资数据中心基础设施的数万亿美元投资浪潮的前夜。其中相当大一部分是由大型超大规模云提供商进行的投资,但也有很多投资将用于私有部署——这些数据中心需要一个软件层来管理它们。

目前,OpenStack正处于一个有趣的位置,作为对VMware提供的功能的综合性替代方案之一,VMware自己面临着一些问题,许多VMware用户对其出售给博通并不感到满意。比以往任何时候都更多,VMware用户正在寻找替代方案。OpenInfra基金会执行理事Jonathan Bryce解释说:“随着博通收购VMware和他们所做的一些许可证变更,我们有很多公司来找我们,重新审视OpenStack。”

图片来源:Frederic Lardinois/TechCrunch

近年来,OpenStack增长的许多动力来自亚太地区的采纳。事实上,正如OpenInfra基金会本周宣布的那样,其最新的白金会员是韩国云提供商Okestro,重点关注AI。但欧洲,具有严格数据主权法律的国家,也是一个增长市场,例如英国的Dawn AI超级计算机正在运行OpenStack。

OpenInfra基金会COO Mark Collier告诉TechCrunch:“所有事情都在为基础设施的开源采用提升创造一个重大反弹。这主要意味着OpenStack,但也包括Kata Containers和我们的其他一些项目。因此,看到另一波基础设施升级为我们社区提供了重要的工作,这是非常令人激动的。”

在实际方面,此次发布新增的一些新功能包括Nova支持对vGPU进行实时迁移,Nova是OpenStack的核心计算服务。这意味着用户现在可以将GPU工作负载从一个物理服务器移动到另一个物理服务器,对工作负载的影响最小,因为企业希望尽可能高效地管理昂贵的GPU硬件。长期以来,CPU的实时迁移一直是Nova的标准功能,但这是首次为GPU提供此功能。

最新版本还带来了许多安全增强功能,包括基于规则的访问控制,适用于更多核心OpenStack服务,如Ironic裸机即服务项目。除此之外,还对网络进行了更新,以更好地支持HPC工作负载和一系列其他更新。您可以在此处找到完整的发布说明。

2015年7月10日在加利福尼亚州伯班克的7-Eleven庆祝7-Eleven 88周年。图片来源:Photo by Chris Weeks/Getty Images for 7-Eleven

这也是OpenStack自一年前转向“跳级升级发布流程”(SLURP)以来的第一个版本。OpenStack项目每六个月发布一次新版本,但对于大多数企业来说速度太快了——在项目的早期阶段,大多数用户会将升级过程描述为“痛苦”(或更糟糕)。

如今,升级要容易得多,项目也更加稳定。SLURP节奏引入了类似于长期版本的概念,在每年基础上,每第二个版本是容易升级的SLURP版本,即使团队仍然按照最初的六个月周期进行主要更新,以满足那些希望采用更快节奏的人的需求。

多年来,OpenStack在感知方面经历了起伏周期。但它现在是一个成熟的系统,并得到一个可持续的生态系统支持——这在10年前其第一次炒作高潮时并非一定会发生。近年来,它在电信世界取得了很大成功,使其得以经历这一成熟阶段,因此今天,它可能会发现自己正处于正确的位置和时机来利用AI的繁荣。