アンディ・スミス
データ センターは、ほぼすべての現代産業のバックボーンであり、世界中でシステム運用、データ ストレージ、接続、通信を可能にします。通信、電子商取引、メディア、ヘルスケア、金融、教育、セキュリティ、製造はすべてデータセンターによってサポートされています。しかし、データセンターの熱管理は見落とされがちな大きな課題です。
この記事では、最新のデータセンターが効率的かつ効果的に機能できるようにするボード、サブシステム、およびシステムレベルの冷却テクノロジについて説明します。
データセンターの冷却システムが重要な理由
データ センターの熱管理は、機器の信頼性、エネルギー効率、データ損失の防止、パフォーマンスの最適化、安全性、コスト、運用効率、環境への影響の最小化に不可欠です。
効率的な熱管理により、個々の電子部品が最適な温度範囲内で動作し、部品レベルのエネルギー消費も最適化されます。コンポーネントの温度が上昇すると、内部抵抗も増加し、パフォーマンスが低下したり、全体的な電力消費が増加したりする可能性があります。コンポーネントの冷却不足は、計算エネルギー消費の大幅な増加につながる可能性があります。対照的に、過冷却または非効率的な冷却システムは、最適化された計算エネルギー消費を維持するために不必要なエネルギー消費につながる可能性があります。
データセンターのコストはエネルギー消費に直接関係しています。効率的な 熱管理戦略 により、全体的な運用コストが削減されます。計算エネルギー消費コストに対して冷却システムのエネルギーコストを最適化することで、データセンター運営者は運用コストを最小限に抑え、計算パフォーマンスの要求を満たすことができます。
データセンターの冷却の3つのレベル
ボードレベルの冷却
データセンターでの主な熱発生は、CPU、GPU、TPUなどの処理装置から発生します。これらのボードレベルのコンポーネントは、適切な内部温度を維持するために効果的な放熱が必要です。
ボードレベルの冷却の最も一般的な方法は、熱吸収の媒体として空気を利用することです。データ センター ボードでは、 パッシブ ヒートシンク、ヒートパイプ、ベイパー チャンバー、アクティブ 冷却ファン、ブロワーなどの空気ベースの冷却デバイスが使用されます。
空冷式熱管理システムで必要な冷却性能が得られない場合、液体冷却システムを使用できます。液冷式のCPU、GPU、ASIC、計算アクセラレータは、従来の冷却方法では処理できないほどの熱を発生する特殊なハードウェア要件を備えた高密度データ センターで使用されています。液体冷却は、AIトレーニング、科学的シミュレーション、複雑なデータ分析、グラフィックス レンダリングなどの高性能コンピューティング (HPC) タスクで一般的なこのタイプのハードウェアの熱をより効果的に放散します。
サブシステム冷却
液体冷却はデータセンター全体に使用できますが、複雑さとコストが高いため、汎用的な冷却ソリューションになることはほとんどありません。多くのデータセンターでは、セクションごとにさまざまな冷却技術が活用されています。局所的な液体冷却システムの場合、収集された熱は液体を介して空気中に放出され、その後、データセンターの残りの空気ベースの冷却システム全体に伝達されることがよくあります。
エアフロー管理は、データセンター全体の熱管理の中核となる技術です。ほとんどのデータ センター ボードはラック内に配置されているため、ラック レベルの冷却システムは、データ センターの1つのセクションから別のセクションに空気の流れを誘導する専用の冷却ユニットまたはラック マウント ファンで構成できます。
データ センターは、通常、ホット アイルとコールド アイルの構成で構成されており、サーバーの片側はコールド アイルに面し、反対側はホット アイルに面しています。ラックレベルの冷却ユニットとファンは、冷気通路から空気を吸い込み、ラックに通してボードとコンポーネントを冷却し、その後、空気を熱気通路に排出します。ホット アイル コンテインメント (HAC) ソリューションは、物理的な障壁とドアを使用して通路を囲み、周囲空気や冷却空気との混合を最小限に抑えて効率を維持します。
空気ベースのラック冷却の代替として、冷水および液体冷却分配ユニット (CDUおよびLCDU) は、ラック全体の個々のボードレベルの液体冷却デバイスに冷水を循環させます。CDUは、冷却液ループ、ポンプ、および需要に応じて冷却液を分配できる制御システムで構成されています。また、ラック内で発生した熱をデータセンター レベルの空冷または液冷システムに排出する熱交換器も備えています。
液浸冷却は、データセンターのサブシステム冷却の最も珍しい形式であり、高性能コンピューティングおよびテクノロジー分野で使用されています。これらのシステムでは、サーバーのハードウェア システム全体を誘電液に浸し、すべてのボード コンポーネントを同時に直接冷却します。この冷却方法は優れた冷却機能を提供しますが、高度に特殊化されたインフラストラクチャが必要であり、ACまたは冷水冷却システムほど拡張性がありません。誘電液は高価で消耗品であり、メンテナンスが複雑で、環境に有害となる可能性があるため、ほとんどのデータ センターでは誘電液を控えめに使用しています。
システムレベルの冷却
データセンター全体を冷却するには、全体的なインフラストラクチャ、エネルギー消費、および場所の計画について十分な先見性が必要です。 施設内の全体的な温度、湿度、環境条件に応じて、いくつかのシステムが使用されます。どのシステムを使用するかの選択は、業界とデータセンターの予想される需要/利用率によって大きく異なります。
精密空調システム
コンピュータ ルーム エアコン (CRAC) ユニットなどの精密空調システムは、最も一般的なデータ センターの冷却システムです。 CRACユニットは、冷却された強制空気を使用してラックを冷却し、集中冷却サイクルを利用して熱せられた空気を外部環境に排出するデータ センターで使用されます。
CRACユニットは、精密な温度と湿度の制御、および空気ろ過を提供します。これは、繊細な機器やデータ ストレージには不可欠ですが、HPCアプリケーションにはあまり適していません。CRACユニットの冷却空気分配システムは、ホット/コールドアイル構成から床から天井までの上昇流分配システムまでさまざまです。高精度空調システムは、データストレージの多さ、毎日の需要の一貫性、HPCラックの最小化を考慮して、銀行、医療、テクノロジー、電子商取引、エンターテイメント指向のデータセンターで最も一般的に使用されています。
アップフローラック冷却構成の例
冷水システム
冷水システム データセンター全体に循環する冷却媒体として水を使用します。これらのシステムは、ハイドロニック冷却システムとも呼ばれ、その拡張性から、計算負荷の高い業界や非常に大規模なデータ センターで利用されています。冷水システムは、空調システムよりも効率が高く、大幅に高い熱負荷を処理できるため、一日を通して変化する熱需要を管理することができます。
冷水システムは冗長性も高く、システム全体の信頼性を高めます。残念ながら、冷水システムには初期コストが高くなります。中央装置、配管、ラックレベルの冷却システムは、空調冷却システムよりも高価です。これらのシステムは漏れが発生しやすいため、貴重なサーバー ハードウェアの損傷を防ぐために専門家によるインストールとメンテナンスが必要になります。
ただし、信頼性、拡張性、およびシステム熱容量の増加により、冷水システムは通信、政府、エネルギー/公共事業、セキュリティ、製造、科学の各分野で一般的に利用されています。計算密度や全体のサイズに関係なく、計算負荷の高いシステムには冷水システムが推奨される冷却方法です。
フリークーリングシステム
フリークーリングシステム 外部の環境条件を活用してデータセンターを冷却します。フリークーリングシステムは、機械的な冷却システムへの依存を最小限に抑えるため、エネルギー効率が優先される場合に利用されます。冷たい外気を取り入れ、それを濾過し、それを使ってデータセンターのラックを冷却し、暖められた空気を屋外環境に排出することで機能します。これらのシステムは外部環境がサポートする場合にのみ存在するため、あまり一般的ではなく、計算需要が低い特定の業界でのみ使用できます。
データセンターの冷却は基本である
ほとんどのデータセンターの冷却は、従来の空調システムまたは冷水システムのいずれかで構成されています。データセンターの熱密度、利用可能なスペース、地理的な場所、コストの制約が、2つのシステムを決定する最も一般的な要因です。より高度なHPCデータ センターは、複雑な液浸熱管理システムで構成でき、最も優れた熱管理ソリューションを提供します。それでも、コストと複雑さの点から、あまり一般的ではありません。ボード、サブシステム、データセンター レベルの冷却システムの高度にカスタマイズされた設計は、業界の需要、拡張性、信頼性、エネルギー効率の目標に大きく依存します。いずれにせよ、熱管理ソリューションは現代のデータセンターの運用に不可欠です。
関連商品を見る
関連商品を見る
関連商品を見る
関連商品を見る