デル eカタログサイト | デル・テクノロジーズ製品 販売支援サイト
情報ガイドステーションメニュー
 |  進化し続けるメモリのアーキテクチャー!!






■目次

・ 最新のメモリ アーキテクチャー
・ Intel 第3世代 Xeon スケーラブル プロセッサーの場合
・ AMD 第3世代 EPYC プロセッサーの場合
まとめ





・ 最新のメモリ アーキテクチャー

バランスの取れたメモリによって構成されたサーバーは、メモリ帯域幅を最大化し、遅延を最小化するために重要になります。サーバーのメモリが適切に構成されていない場合は、メモリコントローラーに不必要なアルゴリズムを使用して、システム全体のパフォーマンスが低下します。システムパフォーマンスの低下やボトルネックのリスクを軽減するためには、“バランスの取れた構成”“ほぼバランスの取れた構成”、および、“アンバランスなメモリ構成”を理解することが重要になってきます。


◆アーキテクチャーの変更

第3世代のIntel Xeonおよび第2/3世代のAMD EPYCプロセッサーは、チャネルごとに最大2つのメモリスロットを備えた合計8つのメモリチャネルを提供するようになりました。これにより、従来のデュアル インライン メモリ モジュール(DIMM)を使用してメモリを構成するための様々な組み合わせが可能になったのですが、実は、PowerEdgeサーバーのピーク メモリ パフォーマンスを実現するバランスの取れた構成は2、3しかありません。アンバランスなメモリ構成でも機能的には動作するのですが、データ転送速度を低下させる大幅な追加オーバーヘッドが発生してしまいます。


◆Intel XeonとAMD EPYCプロセッサーでサポートされているメモリ仕様


第1世代
Intel Skylake
第2世代
Intel Cascade Lake
(Refresh)
第3世代
Intel Ice Lake
第2世代
AMD Rome
第3世代
AMD Milan
(Refresh)
最大バス速度 2666MT/s 2933MT/s 3200MT/s 3200MT/s 3200MT/s
最大DIMMスロット数 12 12 16 16 16
バランスの取れた構成
(CPUあたり)
6または12 DIMM 6または12 DIMM 8または16 DIMM 8または16 DIMM 8または16 DIMM
チャネル数 6 6 8 8 8
DIMMスロット数
(チャネルあたり)
1 または 2 1 または 2 1 または 2 1 または 2 1 または 2
1DIMM時のバス速度
(チャネルあたり)
2666MT/s 2933MT/s 3200MT/s 3200MT/s 3200MT/s
2DIMM時のバス速度
(チャネルあたり)
2666MT/s 2933MT/s
(一部のサーバーで異なる)
3200MT/s 2933MT/s 2933MT/s






・ Intel 第3世代 Xeon スケーラブル プロセッサーの場合

◆最適なメモリ構成

「Intel 第3世代 Xeon メモリ トポロジー」



第3世代Intel Xeon スケーラブルプロセッサは、メモリデータ転送速度を向上させるために、メモリアクセスをメモリ コントローラーとチャネル全体に効率的に分散するインターリーブセットを作成します。作成されるインターリーブセットの数は、各スロットに装着されているメモリモジュールの構成方法に対応しています。1つのインターリーブセットの場合、任意のメモリにアクセスすることができ、すべてのメモリチャネルを利用することでメモリ帯域幅が向上します。 一方で、アンバランスな構成では、複数のインターリーブセットを生成すると、メモリコントローラーに不要な追加の処理が発生しメモリ帯域幅が減少します。バランスが取れるようにメモリを構成すると、必要なインターリーブセットの数が最小限に抑えられます(全部で1セット)が、2つのインターリーブセットでは、完全にバランスが取れておらず、非対称のメモリチャネルが存在するために、パフォーマンスが低下し予測できないプロセスパターンが作成されてしまいます。

例えば、7 DIMM構成ではアンバランスな構成になりインターリーブセットが2つになります。



1)バランスの取れた構成

各チャネルコントローラーに1つまたは2つのDIMMを装着することによって構成のバランスが取れ、データがチャネル間を最も効率的に移動します。このバランスが取れたガイドラインに従うと、最大のメモリ帯域幅と最小のメモリ遅延が得られます。


2)ほぼバランスの取れた構成

バランスの取れた構成ができない場合は、CPUごとに4/6/12/14枚のDIMMを対称的に配置することができます。
 - 4 DIMM: A1, A2, A3, A4
 - 6 DIMM: A1, A2, A3, A4, A5, A6
 - 12 DIMM: すべての白いスロット+A9, A10, A11, A12
 - 14DIMM: すべての白いスロット+A9, A10, A11, A12, A13, A14

※1または2 DIMM構成は、コントローラーに1つもメモリがなくアンバランスな構成になるため推奨されていません。
※2ソケット構成の場合は、CPU2の(B1‑B16)にそれぞれのDIMMを取り付けます。


◆混在したメモリ構成

システム内で異なる容量のメモリを混在することは許されておりバランスの取れた構成として取り扱われますが、すべてのメモリが同一のDIMM(ランク、容量、DIMMの種類)を使用することをお勧めします。また、メモリ速度が異なるDIMM(同じランク、容量、DIMMタイプである必要があります)場合は、最も遅いDIMMの速度で動作します。


◆メモリパフォーマンスの違い

下記のグラフは、メモリ構成ルールに従った場合に予想されるメモリ帯域幅曲線を示しています。このグラフには表示されていませんが、アンバランスな構成では、表示されているバランスが取れた構成とほぼバランスが取れた構成の両方と比較して、パフォーマンスが大幅に低下してしまいます。


※White Paper:Memory Population Rules for 3rd Generation Intel Xeon Scalable Processors on PowerEdge Servers





・ AMD 第3世代 EPYC プロセッサーの場合

◆最適なメモリ構成

「AMD 第3世代 EPYC メモリ トポロジー」



第3世代 AMD EPYCプロセッサーのNodes Per Socket(NPS)システムを理解するためは、CPUを4つに分割して考えます。4つに分割されたモジュールには、最大4つのDIMMをホストできる2つのペアのDIMMチャネルが含まれています。このNPSでNon‑Uniform Memory Access(NUMA)を使用することによって、メモリインターリーブ(CPUはメモリアクセスを複数のDIMMに効率的に分散)を実現しています。PowerEdgeで利用できるNPSオプションは3つあります。通常、NPS 1が最高のメモリパフォーマンスを発揮し、次にNPS 2、次にNPS4になります。

下の表は、1つのCPUあたりのDIMMの数ごとに推奨されるNPS設定を示します。

・NPS 1
1つのソケットに1つのNUMAノードを使用し、ソケット内のすべてのチャネルが1つのインターリーブセットを使用していることを意味します。

・NPS 2
1つのソケットに2つのNUMAノード(左/右半分ごとに1つ)を使用し、4つのチャネルを含む各半分が1つのインターリーブセットを使用していることを意味します。

・NPS 4
1つのソケットに最大4つのNUMAノードを使用し、2つのチャネルを含む各モジュールが1つのインターリーブセットを使用していることを意味します。


※BIOSのデフォルト設定はNPS1であり、CPUモデルをサポートするNPSオプションに一致するように手動で調整する必要がある場合があります。



1)バランスの取れた構成

各チャネルに1つまたは2つのDIMMを装着することによって構成のバランスが取れ、データがチャネル間を最も効率的に移動します。このガイドラインに従うと、最大のメモリ帯域幅と最小のメモリ遅延が得られます。


2)ほぼバランスの取れた構成

バランスの取れた構成ができない場合は、CPUごとに4/6/10/12/14枚のDIMMを対称的に配置します。
 - 4 DIMM: A1, A2, A3, A4
 - 6 DIMM: A1, A2, A3, A4, A6, A8
 - 10 DIMM: すべての白いスロット+A9, A13
 - 12 DIMM: A2, A4, A6, A8,+すべての黒いスロット
 - 14 DIMM: すべての白いスロット+A9, A10, A11, A13, A14, A15

※NPS 4の構成は、アンバランスな構成になるため推奨されていません。
※2ソケット構成の場合は、CPU2の(B1‑B16)にそれぞれのDIMMを取り付けます。


◆混在したメモリ構成

同一のメモリ(ランク、容量、DIMMの種類)をすべてのメモリ スロットで使用する必要があります。AMD 第3世代 EPYC プロセッサーでのDIMM混在はサポートしていません。また、メモリ速度が異なるDIMM(同じランク、容量、DIMMタイプである必要があります)場合は、最も遅いDIMMの速度で動作します。


◆メモリパフォーマンスの違い

下記のグラフは、メモリ構成ルールに従った場合に予想されるメモリ帯域幅曲線を示しています。推奨されないアンバランスな構成では、“バランスが取れた構成”と“ほぼバランスが取れた構成”の両方と比較して、パフォーマンスが大幅に低下してしまいます。


※White Paper:Memory Population Rules for 3rd Generation AMD EPYCTM CPUs on PowerEdge Servers





まとめ

いかがでしょうか。実はメモリのアーキテクチャーは進化しており、最適なパフォーマンスを得るためにはメモリスロットの装着にも気を配る必要があります。バランス構成をとることで、メモリ帯域幅が増加し、メモリアクセスの待ち時間が短縮されます。最新のテクノロジーをPowerEdgeサーバーに詰め込み製品を出荷していますので、その他の最新テクノロジーについては「PowerEdgeサーバー選定ガイド」も参考にしてください。


デル・テクノロジーズ株式会社
パートナーセールスエンジニア
山田 尚敏

2022/01/05

関連記事はこちら

情報ガイドステーション | Server
インテル/AMD 第3世代プロセッサーの強みを活かす!!
”山田さんと川口くん” が語る 次世代PowerEdgeリリース記念オンラインセミナー 突撃レポート その①
”山田さんと川口くん” が語る 次世代PowerEdgeリリース記念オンラインセミナー 突撃レポート その②
PowerEdgeサーバー選定ガイド



 

タグ: , , , ,