来源:Murata(村田)
发布时间:2025-09-22
OCP(Open Compute Project)是一个促使有效硬件规格和设计的开源社区,旨在满足日益增长的数据中心需求。据称,符合OCP规格和设计的硬件可为大型数据中心带来高处理能力、高经济效益和低能耗。本文对数据中心需求增长的背景、数据中心面临的诸多课题以及符合OCP的硬件能解决的数据中心课题进行相关介绍。
需求日益增长的数据中心
IT的应用每天都在不断扩大和发展,需求也呈现出了多样化。在这种状况下,容纳向网络中连接的终端提供多种服务的服务器和网络设备等IT设备的设施就是数据中心。
数据中心需求不断增长的有哪些背景呢?
首先,数据中心的需求增长受到了云服务使用量不断增加的影响。
云服务使用量增加的原因有在线业务的增长、智能设备的增加和社交媒体的使用等。此外,云流媒体、云游戏和来自IoT设备的数据收集等通常也由云服务提供。为了应对这些情况,需要发送、接收和处理大量数据,这是数据中心需求增长的主要原因。
另外,AI数据中心的需求也在增长。
AI数据中心是指提供人工智能和机器学习等AI服务的数据中心。提供AI服务的AI数据中心专为AI处理而设计,拥有高速网络、并行处理能力和大内存等。特别是生成式AI尤其需要学习大量数据的大型语言模型(LLM:Large Language Model),因为准确性和质量会随着学习量的增加而提高。构建LLM需要针对大量学习数据反复进行类似的演算。这样的演算处理由GPU(Graphics Processing Unit)进行。为了实现更低的延迟和更快的处理速度,一般会配备专用的硬件——AI加速器。近年来,生成式AI在商业中的应用不断扩大,对AI数据中心的需求不断增加。
数据中心电源系统的课题
提供云服务和AI服务等的数据中心设备需要能够长期稳定地正常运行。其中,供应电力的电源设备尤为重要,需要针对所需的电源容量构建一套设备使用率高、浪费很少的电源系统。
数据中心的电源系统主要面临以下四个课题。
首先,数据中心要能够做到长期稳定地正常运行,散热是目前电源系统的主要挑战之一。
在数据中心,服务器高性能化导致TDP(Thermal Design Power)*1不断增加,而且,IT设备的配备密度越来越高,因此,单位面积产生的热量持续迅速上升。特别是配备了GPU和AI加速器的AI服务器往往需要更大的功率,产生更多的热量。高密度化和大功耗化导致的散热问题会增加服务器故障和误动作的风险,因此,冷却不可或缺。但是,冷却设备增加和冷却设备运行所需的功耗增加以及由此带来的运营成本增加和环境负荷已成为大问题。
*1 TDP(Thermal Design Power):上限功耗时的发热量。
其次,在数据中心,由于IT设备的运行而导致局部温度升高的热点现象已成为需要解决的课题。空调系统如果无法仅对热点进行冷却,就只能对整个数据中心进行冷却,从而导致额外的电力消耗。如果对热点放任不管,也会增加服务器性能不足和故障的风险。
此外,在提供可靠、持续性服务的数据中心,电源设备不能出现停电和瞬间断电。数据中心需要高质量和高可靠性,因此需要很强的可维护性,以确保在发生商业停电、瞬间断电、电压波动、维护、增设工事和故障时能够连续运行。但是,将IT设备高密度配置后,存在配线密集、降低了可维护性的课题。
另外,在数据中心,服务器数量的增加有时会导致空调和电源设备的容量跟不上、难以增加机架的情况发生。此外,在服务器集中的机架上,即使有空间放置设备,在不少情况下也会因为地面负荷增加以及建筑物结构上的原因而导致无法设置额外的机架。因此,需要对选择有效的空调系统和室外设备的布局计划进行慎重地考虑,空间不足已成为一个严重的课题。
符合OCP的电源系统的优势
符合OCP的电源系统,是如何解决散热、热点冷却、维护和空间不足等课题的呢?
符合OCP的数据中心机架使用符合OCP规格的21英寸开放式机架。与传统的19英寸机架相比,21英寸机架的每个单元高度更高。这样就可以增加机架内可配备服务器和存储器的数量,有助于节省空间。另外,21英寸机架的单位叫做“1OU(Open Unit)”,以区别于19英寸机架。
了解村田为新一代数据中心定制的集中电源系统解决方案,请点击下载村田产品白皮书(本资料是英文版本)。
高散热性对于预防服务器过热不可或缺。通过将传统的分散型供电系统转换为集中供电系统(下图),可以将主要热源——电源部分和服务器分开,并对各自进行理想的温度管理。特别是在GPU和AI加速器导致高发热量而令人担忧的AI服务器中,OCP的理想温度管理对提高服务器的散热性非常有效。
将分散型供电系统
转换为
集中供电系统
此外,空调冷却是非常常见的服务器冷却方法,但有人指出这种方法的冷却能力有限。因此,近年来,作为一种效率更高的冷却方式,将服务器浸入特别的液体(非导电介质液体)中进行冷却的浸没式冷却备受关注。
集中式供电系统可使系统在转换效率更高的负载区域运行,因此可使电源整体以较高的效率运行。
此外,不仅是服务器,冷却分配单元(CDU:Cooling Distribution Unit)也可同时供电。这样能降低机架的耗电量,有助于降低数据中心的运营成本。此外,对于数据中心有限的电力容量,还有可以部署更多的服务器的好处。
符合OCP的服务器和存储器在设计时考虑到了维护时的操作性。
服务器上没有电源线,其结构为将服务器直接连接到机架的电源条(母线)来供电。通过这种结构,只要将设备安装到机架上,就立即进入能供电的状态,而且可以简洁地整理配线的布局。此外,还可以使用盲插插头,即使在无法确认嵌合位置的情况下也能正确嵌合。这种便于维护的设计减轻了设备维护作业的负担,有助于保持稳定运行。
总 结
在数据中心,不仅需要有效的电源系统,还需要具备高散热性能、可维护性和节省空间等功能,OCP正是实现这些要求的技术。
在村田制作所符合OCP的集中电源系统中,采用高能源密度PSU(Power Supply Unit),实现了小型化、节省空间及较高的电源效率。这也有助于提高散热处理的效率。此外,该系统还具有热插拔功能,可从多种问题中迅速恢复。该电源架有19英寸和21英寸两种尺寸可供选择,可容纳多种尺寸的IT设备。支持Delta/Wye/Single等输入,而且,输入电缆、PDU(Power Distribution Unit)和安装套件等附件也很丰富,因此,可以在多种环境中进行设置。