デル eカタログサイト | デル製品 販売支援サイト
情報ガイドステーションメニュー

 |  PowerEdgeで簡単システム管理 ~iDRAC編~
  iDRAC9 ファームウェア4.xの実力

   
       
   
       
   
    





■目次

1.序章
2.サーバー監視機能の強化
3.新機能テレメトリ ストリーミング
4.サーマル管理機能の強化
・ まとめ



■1.序章

皆さまこんにちは!
iDRAC9のファームウェアがメジャーバージョンアップ(3.x → 4.x)されました。

◆Release Notes
 iDRAC9 Version 4.11.11.11
 https://topics-cdn.dell.com/pdf/idrac9-lifecycle-controller-v4x-series_release-notes3_en-us.pdf
 iDRAC9 Version 4.00.00.00
 https://topics-cdn.dell.com/pdf/idrac9-lifecycle-controller-v4x-series_release-notes1_en-us.pdf

◆Users Guide
 Integrated Dell Remote Access Controller 9 ユーザーズガイド
 https://www.dell.com/support/manuals/jp/ja/jpbsd1/idrac9-lifecycle-controller-v4.x-series/idrac9_4.00.00.00_ug_new/integrated-dell-remote-access-controller-9%E3%83%A6%E3%83%BC%E3%82%B6%E3%83%BC%E3%82%BA%E3%82%AC%E3%82%A4%E3%83%89?guid=guid-5b8de7b7-879f-45a4-88e0-732155904029&lang=ja-jp


最近、Graphics Processing Unit(GPU)を搭載したワークロードの提案がめちゃくちゃ増えています。
問い合わせも多いです!
GPUは画像処理を得意とする処理装置で、これまでゲーマーの要望を満たすためにその機能を強化してきました。
今では企業向けにその高速な演算処理能力から科学技術計算、AI・ディープラーニング・機械学習、CAD-VDIなど、様々な分野で活用されており、研究開発を飛躍的に加速させるツールとして、その導入が進んでいます。
こんな市場的な背景がありx86サーバーにGPUが求められています。

GPUを使うことにフォーカスされがちですが、運用まで考慮できていますか?監視はどうでしょうか?
メトリック情報の収集はどうでしょうか?GPUはものすごく発熱します。熱管理できていますか?

iDRAC9ファームウェア4.x系では上記のような運用ニーズに答える機能が登場しました!

それでは、ご紹介いたします。

まず、大きな変更点としてライセンス体系が下記のように変更され
新たに、「iDRAC Datacenter」エディションがラインナップに加わりました。



エディション毎の新機能/機能強化は下記の通りです。



メジャーバージョンアップのため新機能/機能強化が多いことを理解して頂けたと思います。
全てご紹介すると、とても長くなりますので今回は下記注目すべき機能をご紹介したいと思います。
・ サーバー監視能力の強化
・ 新機能テレメトリ ストリーミング
・ サーマル管理機能の強化



■2.サーバー監視機能の強化

様々なサーバー監視能力が強化されました。
その中でも特に注目していただきたいのは「GPUのインベントリ情報と統計」です。
この機能はDatacenter ライセンスでのみ利用できます。
GPUのステータス状態を監視できることは勿論、電力消費、GPUターゲット温度、最小 GPU減速温度、GPUシャットダウン温度、最大メモリー動作温度、最大 GPU動作温度などが見れるようになりました。

※注意していただきたい点
・この機能は NVIDIA社製 カードに限定されています。
・この機能を利用するにはホストシステムに NVIDIAドライバーがインストールされ、実行中である必要があります。




■3.新機能テレメトリ ストリーミング

「テレメトリ」とは、テレメーター(遠隔計測装置)を使って、遠隔地の測定結果をコントロールセンターにデータを送信すること。受信したデータを分析することです。そんな機能が新たに追加されました。



具体的には、iDRAC上で①~④を設定し分析ツールに転送します。
① 抽出するメトリックを選択(CPU、Memory、Disk、GPUなど)
② 転送方式を選択(Rsylog、Redfishなど)
③ レポート頻度を選択(毎分、毎時、毎日など)
④ トリガーを選択(警告、重大など)

こちらの機能は検証して別途「テクニカル BLOG まとめ」にレポートを出したいと思います。



■4.サーマル管理機能の強化

サーバーを冷却するために必要な電力は、システム全体の電力の大きな部分を占めます。
熱制御は、ファン速度およびシステム電源の管理によりシステム冷却をアクティブに管理します。
これにより、システムの電力消費、エアフロー、システム音響出力を最小限に抑えつつ、システムの信頼性を確保します。熱制御設定を調整し、システム パフォーマンスおよびワット当たりのパフォーマンス要件に合わせて最適化することができます。
つまり、サーバーの熱量を可視化してよく使われているサーバーはよく冷やす。
あまり使われていないサーバーは冷却のパフォーマンスを落とすという調整が可能になります。




■まとめ

お読みいただきありがとうございました。今回はここまでとなります。

昨今、AI(機械学習/深層学習)、VDI(CAD-VDI)、HPC、レンダリングなどのワークロードでは、GPUカードが必須構成パーツとなってきています。以下も併せて参考にしてください。

☆GPUサーバー選定ガイド
 https://japancatalog.dell.com/c/gpu-server_guide/

☆GPUのために設計されたサーバー「PowerEdge C4140」 の実績と実力!
 https://japancatalog.dell.com/c/isg_blog_c4140/

今回のiDRAC9ファームウェア4.xでは、GPUなどのハイエンドオプションを網羅しました。

PowerEdge C4140でGPUシステムを構築し、iDRAC9ファームウェア4.x系で「GPUのインベントリ情報と統計」でデータを取得し、「テレメトリ ストリーミング」で分析するというような構築から運用までの一気通貫した提案を是非お手伝いさせてください。


パートナーセールスエンジニアリング本部
セールスエンジニア
中野 修
2020/7/28



関連記事はこちら

PowerEdgeで簡単システム管理 ~iDRAC編~ はじめの一歩
PowerEdgeで簡単システム管理 ~iDRAC編~ 初期設定
PowerEdgeで簡単システム管理 ~iDRAC編~ 管理画面概要
PowerEdgeで簡単システム管理 ~iDRAC編~ 仮想コンソール機能
PowerEdgeで簡単システム管理 ~iDRAC編~ ログ取得概要
PowerEdgeで簡単システム管理 ~iDRAC編~ アラート設定方法
PowerEdgeで簡単システム管理 ~iDRAC編~ Support Assist概要
PowerEdgeで簡単システム管理 ~iDRAC編~ バックアップ概要
PowerEdgeで簡単システム管理 ~iDRAC編~ ライセンスキーの適用
PowerEdgeで簡単システム管理 ~iDRAC編~ iDRAC9 ファームウェアバージョンアップ
PowerEdge 管理・監視 Tips まとめ
テクニカル BLOG まとめ



   
       
   
       
   
    

 

タグ: , , , , , ,