情報ガイドステーションメニュー
| デル・テクノロジーズのAIソリューション on Kubernetes |
こんにちは。デル・テクノロジーズでAI関連ソリューションを担当している山口です。 現在は第三次AIブームの真っ只中で、インターネットニュースでも多くのAI関連ニュースを目にするのではないでしょうか。ですが、こういったニュースの多くはAIの導入事例や実証実験開始など、AIをどのように活用しているかの紹介でインフラ部分に触れた内容は少ないと思います。 私もお客様とは、AIでどういった課題を解決したいかといった、インフラからではなくAIの導入目的や用途から会話させていただきますが、AIを動かすインフラも実はとても重要です。 AIインフラというとGPUが重要なコンポーネントですが、運用までを考えるとGPUのモデルだけではなくインフラの構成も十分に考慮する必要があり、最近ではAIインフラとしてコンテナ環境、特にKubernetesを利用することも多くなっています。 本記事では、デル・テクノロジーズではAIインフラ向けとして提供しているKubernetesを利用したAIソリューションを紹介します。
Dell EMC HPC Ready Solutions for AI and Data Analytics
「Dell EMC HPC Ready Solutions for AI and Analytics 」は、デル・テクノロジーズのが開発したOmniaを利用して、HPCクラスタやKuberneteクラスタ展開と管理をすることができるオープンソースソフトウェアです。 Omniaが提供するAnsible playbookを利用して、RPMベースのLinuxに対して容易にHPCクラスタやAI/ML向けのKubernetesクラスタ立ち上げと破棄を行うことができるだけではなく、多くのHPC環境で利用されているジョブスケジューラのSlurmや、AI/MLで使われるJupyter Notebook、MLOpsで利用されるKuberflow環境なども容易に構築することができます。 OmniaはGithubでコードが公開されていますので、興味があるかたはぜひアクセスしていただければと思います。 https://github.com/dellhpc/omnia また、HPC Ready Solutions for AI and Data Analyticsのアーキテクチャガイドも公開しているので、合わせて御覧ください。 Architecture Guide—Dell EMC HPC Ready Solution for AI and Data Analytics
Virtualizing GPUs for AI with VMware and NVIDIA Based on Dell EMC Infrastructure
「 Virtualizing GPUs for AI with VMware and NVIDIA Based on Dell EMC Infrastructure 」はPowerEdgeやVxRAIL上でVMware社が提供するTanzuと、NVIDIA社のGPUとNGC(NVIDIA GPU Cloud)を利用するためのReference Architectureです。 IT管理者はこれまで慣れ親しんだvCenterを使って、これまでと同様に仮想マシンの運用と新たに導入するコンテナ環境を1つのインターフェースで管理することができます。また、これまでデータサイエンティストはデータ分析やAIモデルの作成の傍らKubernetesの管理を行っていた場合もありますが、インフラの管理から開放され本来のデータ分析とAIモデルの作成に専念することができます。 また、NVIDIA社がGPUとvSphere with Tanzuに最適化したコンテナイメージをNGCのから入手し利用することもできるため、ソフトウェアやライブラリなどの依存関係の心配もなく迅速にAI開発環境を利用することができます。 Design Guide—Virtualizing GPUs for AI with VMware and NVIDIA Based on Dell EMC Infrastructure
Data Management with Cloudera Data Platform on Intel-powered Dell EMC Infrastructure
最後にご紹介するのが「 Data Management with Cloudera Data Platform on Intel-powered Dell EMC Infrastructure 」です。ClouderaってHadoopでしょ?と思われる方もいるかと思いますが、Cloudera社が提供するCDP Private CloudはRed Hat社のOpenShiftと連携して、Machine Learning環境を導入することができます。 CDP Private Cloudは計算処理とストレージを切り離すことにより堅牢でセキュアなデータ分析基盤と、OpenShiftが提供するコンテナ基盤のメリットを併せ持ったAIインフラを導入することができます。 Clouderaが提供するCloudera Machine LearningのMLOps機能により、モデルの展開、カタログ化、予測モニタリングを簡単に実装することができます。また、NVIDIAのGPUと組み合わせることによってデータ処理とAIモデルの学習を加速させることもできます。 Design Guide—Data Management with Cloudera Data Platform on Intel-powered Dell EMC Infrastructure
AI Experience Zone
今回ご紹介したAIソリューションのいくつかは当社大手町オフィスに設置しているAI Experience Zoneに導入済み/導入予定のソリューションになるので、「どんなことができるのか見てみたい。」、「検証をしてみたい。」といったご要望あれば当社担当営業までお声がけください。 デル・テクノロジーズ 製品本部 シニアシステムエンジニア 山口 泰亜 2022/01/18 関連記事はこちら情報ガイドステーション ソリューションページAI Experience Zone NVIDIA GPUとコンテナでAI環境作ってみた DockerでJupyterlab使ってコード実行してみた GPUのために設計されたサーバー 「PowerEdge C4140」 の実績と実力! AI環境でGPUリソースを有効活用 BitfusionでGPUをプール化(概要編) AI環境でGPUリソースを有効活用 Bitfusionの利用環境と方法 AI環境でGPUリソースを有効活用 BitfusionでGPUのメモリ分割 AI環境でGPUリソースを有効活用 他ソフトウェアと連携してBitfusionをもっと便利に AI環境でGPUリソースを有効活用 ベアメタルサーバもBitfusionで高速化! HPC and AI Innovation Labのご紹介 サンディエゴスーパーコンピューターセンターの新スパコン 「Expanse」 にDellEMCのAMDサーバーが採用! |