▲ 先頭に戻る



掲載資料に関して
ここに掲載した資料は、弊社の調査と見解に基くものであり、資料の中で示されている製品やサービスを提供している各社の公式な見解でも、また、マーケティング戦略に基くものではありません。 あくまで、弊社としての意見だということにご注意ください。 これらの資料の無断での引用、転載を禁じます。

社名、製品名などは、一般に各社の商標または登録商標です。なお、本文中では、特に® 、TMマークは明記しておりません。



SC06 レポート

内容
この10年で大きく変わったコンピューティング・プラットフォームの構成において、現在は、標準化され広く流通しているコンポーネントを効率よく組み合わせることで、製品化されたプラットフォームが、HPC 分野でも主流となっています。 もちろん、特別に設計され、特定の目的のために最適化されたシステムの価値は、依然として高いものがあります。 しかし、今後 10年の HPCシステムの動向を考えた場合、また今後予想されるワークロードや利用モデルにおいてのプラットフォームの進化を考えた場合、標準コンポーネントを利用した HPC プラットフォームが大きな位置を占めることは間違いありません。 このようなHPC プラットフォームの方向性として、弊社では、「HP2C」というコンセプトを提唱し、そのようなコンセプトを実現するためのプラットフォーム事例を積極的に紹介しています。

米国フロリダ州タンパで開催されたハイパフォーマンスコンピューティング、ネットワーキングおよびストレージ関連技術のための年次会議である 「Supercomputing 2006」でも、弊社がHP2Cシステムとしてご紹介しているNEXXUS4000FUSION1200をインテル社のブースで展示され、デモが行われています。

インテル社は、このSC06の開催前に、’Intel Boosts Super-Computing Efforts’という ニュースリリースを行って、その中で次の3点を特に強調して説明しています。
  1. QUADコアプロセッサ
  2. クラスタリングのための新しいソフトウエアツール群

  3. ラックとコストを低減する新しいHPCシステムの構築ブロック

このレポートでは、上記の3点に関して、NEXXUSとFUSIONがどのような位置づけにあるかをブース展示の写真と一緒にご紹介し、HPCプラットフォームの今後の動向を考えたいと思います。

このレポートは、SC06 レポート[日本語 PDF 形式 535KB] でもご覧いただけます。

QUADコアプロセッサ
1996年にインテルが、7264 個の Pentium® Pro プロセッサを搭載したスーパーコンピューターを開発し、1.06 テラフロップスの記録 (Linpack* ベンチマーク) を打ち立てることで破られました。このシステムは、57 台のキャビネットで構成され、その後、9200 個のプロセッサー、84 台のキャビネットに拡張され、最終的な理論最大性能は、1.8 テラフロップとなりました。同じピーク性能を実現するのに、現在のQUADコアプロセッサでは、44個のプロセッサで十分であり、1500ft2 (140m2) の設置面積は、16ft2 (1.5m2) で十分です。消費電力も、800,000 Wattsから10,000 Wattsとなっています。

1996年にインテルが、7264 個の Pentium® Pro プロセッサーを搭載したスーパーコンピューターを開発し、1.06 テラフロップスの記録 (Linpack* ベンチマーク) を打ち立てることで破られました。このシステムは、57 台のキャビネットで構成され、その後、9200 個のプロセッサー、84 台のキャビネットに拡張され、最終的な理論最大性能は、1.8 テラフロップとなりました。 同じピーク性能を実現するのに、現在のクアッドプロセッサでは、44個のプロセッサで十分であり、1500ft2 (140m2)の設置面積は、16ft2 (1.5m2) で十分です。消費電力も、800,000 Wattsから10,000 Wattsとなっています。

既に、マイクロプロセッサは複数の演算コアを実装したデュアルコアプロセッサが一般化しています。今回のSC06では、4つの演算コアを搭載したクアッドコア インテル Xeon プロセッサ5300番台の発表にあわせて、クアッドコアプロセッサを搭載したデル社製のサーバ(写真左)を展示しています。クアッドコア インテル Xeon プロセッサ5300 番台は、64 ビット・コンピューティングに対応したインテル Core マイクロアークテクチャーを採用し、大容量の8MB L2 キャッシュ(2つのコアにつき1つの4MB共有L2 キャッシュ)が統合されたプロセッサであり、システム性能を大きく向上させると同時にプロセッサの消費電力を低減させることが可能となり、DPサーバの密度と消費電力あたりの性能の向上を実現しています

クアッドコアプロセッサを利用したサーバの展示では、9月のIDFでも紹介されたFUSION 1200(右側写真)も展示されています。FUSION 1200は、「共有メモリー並列計算 (SMP) 」システムであり、コンパクトな筐体に48コアを搭載した共有メモリアーキテクチャのシステムとなり、ブースでは、48WayのSMPサーバとして、その性能をデモしています。従来のRISCベースのSMPシステムでは各社が独自のチップセットとインターコネクトなどを開発することが一般的でした。このFUSION 1200は、プロセッサ・チップセットとしては、インテルのDPプラットフォームを利用し、そのDPプラットフォームの持つ高いフロントサイド・バス(FSB)、FB-DIMMの高いスループットと大容量のメモリ、そして、PCI Express(PCIe)の高速性と高い信頼性を最大限に活用し、スケーラブルなSMPシステムの構築を可能としています。
クラスタリングのための新しいソフトウエアツール群
並列アプリケーションの開発には、多くの試行錯誤とプログラムの実行と検証、デバッグといった作業が必要になります。そのプログラムについては、その実行性能の向上を図るためのソースコードの書き換えなどの作業を、プログラムの開発中も開発後も行う必要があります。このような作業を効率良く、また短時間で行うには、優れた開発環境が必要です。 また、そのプログラム開発をより容易に実行するためにOpenMPなどの共有メモリプログラミングをクラスタ環境にまで拡張したCluster OpenMPなども利用可能となっています。クラスタリン グのための新しいソフトウエアツールのデモもNEXXUS上で実行されていました。
Intel Cluster Tools には、以下のようなツールやツールキットが含まれています。 
  • Intel Cluster Toolkit 
    • Intel MPI Library
    • Intel Trace Analyzer and Collector
    • Intel Math Kernel Library Cluster Edition   
  • Cluster OpenMP for Intel Compilers
共有メモリ用のAPIであるOpenMPをMPIのようなメッセージパッシングを利用することなく、クラスタ環境で利用できるようにするのが、Cluster OpenMPです。Cluster OpenMPでは、陽的なメッセージ通信を行うことなく、また、ノード内とノード間のプログラミングモデルやAPIを変えることなくプログラミングを行うことを可能とします。 Cluster OpenMPでは、通常のクラスタシステムにHWの変更を加えることなく、ソフトウェアによって分散共有メモリのサブシステムを構築し、クラスタ全体を一つの共有メモリのシステムとして、OpenMPを同様の共有メモリとしてのプログラミングを可能とします。 インテル クラスター・ツールはクラスタ上でのアプリケーション開発を効率化し、た最新のプロセッサ、プラットフォーム技術に対応したソフトウェアを効率よく開発できます。クラスタを利用することで、より低い導入コストの実現は可能ですが、その上で生産性の高いアプリケーション開発が出来ないと、TCOの低減を図ることは困難です。
ラックとコストを低減する新しいHPCシステムの構築ブロック

クアッドコアプロセッサを利用することで、高密度で低消費電力のHPCプラットフォームを構築することは、より容易になります。しかし、HPCプラットフォームでは、一般のデータセンターで利用されるよりもより高いメモリバンド幅がシステムに要求されます。また、HPCシステムでは、非常に大規模なシステムを構築し、HPCシステムは、数千プロセッサを同時に利用し、数テラバイトのメモリをを利用するような高度なシュミレーションが行われます。そのようなシステムでは、更に高密度でのシステムの実装が求められます。

HPCシステムの要求に対応するために、インテルは幾つかの高密度実装用のサーバボードを提案しています。今回のSC06では、それらの最新サーバボードの展示も行われています。

このようなHPCサーバボードとして製品化された最初のサーバボードは、‘Caretta’ と呼ばれる UPサーバーボード インテル サーバーボード SE7230CA1-Eです。 このサーバーボードは、あえて 1 ソケット構成を採用することで、コア当たりのメモリー帯域幅やネットワーク帯域幅を確保すると同時に、既存の ATX フォームファクターをちょうど半分に切ったようなコンパクトさを実現しています。この‘Caretta’の後継サーバボードとして、インテル Core2 プロセッサ・ファミリ (開発コード名: Conroe) やクアッドコア・プロセッサをサポートしたサーバボードとして、S3000PT(開発コード名:Port Townsend)が、SC06では紹介されています。 さらに、SC06では、DPサーバボードにも関わらず、S3000PTとほぼ同じ大きさのサーバボード(開発コード名:Atoka)が発表になりました。このサーバボードを利用した場合、1Uサイズのサーバ内に、4プロセッサ、16コアが搭載可能となります。デュアルコアプロセッサを搭載した今までの1Uサーバに対して、4倍のプロセッサコアの搭載が可能となります。これらのサーバボードは、HPCシステムが必要とする絶対性能、コスト、設置面積、消費電力の低減などを図るために新しいプラットフォームの構成ブロックとして利用可能となっています。

インテルのブースでは、S3000PTを搭載したサーバやブレードが展示されています。また、S3000PTと搭載したサーバは、インテルのブースだけでなく、他の出展企業のブースでも紹介されています。インテルのブースでは、Ever Case Technology社のブレードが展示されていました。この製品は、4Uのサイズで、10枚のS3000PTの搭載が可能となっています。また、S3000PT搭載のシステムとしては、Ciara Technologies社のNEXXUS 4820PTも展示されています。このNEXXUS 4820PTについては、「パーソナルクラスタ」として、後で説明します。
S3000PTベースのサーバは複数のベンダーが1Uや4U(ブレード)サイズの製品を展示

インテルのブースでは展示されていませんでしたが、Atokaサーバボードも注目を集めています。大きさは、ほとんど、S3000PTと同じで、デュアルコア、クアッドコアのインテルXeonプロセッサを2つ搭載可能となっています。また、このサーバボードは、ボード上に、InfiniBandを搭載し、カードなどを利用することなく、直接スイッチを介しての接続が可能となります。 HPCサーバプラットフォームでは、InifiniBandは、インターコネクトはもちろん、ストレージなどの接続にも利用されており、GbEと同じようにオンボード上に実装されることで、よりスケーラブルなクラスタシステムの構築が可能となります。

  • Atoka(左側)とS3000PT(右側)のサイズの比較

  • Atokaは非常に高密度で実装しており、従来の1Uサイズのサーバの筐体内に、16コアの実装も可能

  • Atokaでは、ボード上にInfiniBandを実装している(写真では、実際にIBケーブルを接続)

Atokaベースのシステムも、複数のベンダーからサーバやクラスタ製品として、発表されています。

▼ パーソナルクラスタ
以上、’Intel Boosts Super-Computing Efforts’としたプレスリリースの内容とインテルのブースの内容を説明してきました。この他に、今回のインテルのブースでは、「パーソナルクラスタ」の展示がなされています。「パーソナルクラスタ」は、HPCシステムの新しい潮流であり、今回のSC06のインテルのブースでも大きく紹介されています。 「パーソナルクラスタ」は、従来のサーバをラックに搭載したクラスタではなく、デスクサイドに設置可能な筐体に複数のプロセッサを搭載し、より容易にクラスタを利用することを目的として、各社から販売されている製品です。インテルのブースでは、この「パーソナルクラスタ」として、TyanのTyphoon PSCとCiara TechnologiesのNEXXUS 4820が展示されています。

Tyan の「パーソナルクラスタ」システム(写真右側)であり、非常にコンパクトな筐体に40 コアを搭載することを可能としています。このような「パーソナルクラスタ」システムは、大規模な解析を行うことに関して、より高い柔軟性とその適用の可能性を大幅に拡張します。パーソナルコンピュータが計算機の利用に多くの進化と革新を可能としたように、スーパーコンピュータの新しい可能性を示すものです。デモでは、環境予測のシュミレーションの結果が示されています。このような高度はシュミレーションのこのようなコンパクトな筐体の計算機で十分に可能であることが示されています。

NEXXUSでは、インテルの新しいHPCシステムの構成ブロックとなるS3000PT(シン グルソケット)を搭載することで、コストの低減とまた非常にコンパクトな形での新しいクラスタ環境の構築が可能なことが示されていました。 また、NEXXUSでは、先にご紹介したAtokaベースのブレードの搭載も予定しています。その場合、デスクサイド(に設置可能なサイズ)に80コアのプロセッサを搭載可能となります。このレポートの最初にご紹介した1996年に構築されたシステムとほぼ同等のシステムをデスクサイドで利用できることになります。

パーソナルクラスタは、スーパーコンピュータをデスクサイドに設置するというよりも一般に利用されているパーソナルコンピュータ(PC)の機能を大幅に拡張するシステムとして、考えることが必要です。その意味では、Windows CCSによるPC環境とのインテグレーションやより広範囲な利用方法(エクセルやMATLABなど)が可能となります。
▼ まとめとして
二極分化するHPCシステムの利用用途やマーケットに対して、従来には無かったコンセプトや新技術の展開も可能となっています。マイクロプロセッサのマルチコア化が急速に進み、従来、HPC分野に対して製品を提供してこなかったマイクロソフトのWindows Compute Cluster Server 2003の発表など、HPCシステムを取り巻く環境は大きく変化しています。そのような環境に応じたHPCシステムは、従来のシステムの延長として、システムを考えるだけでなく、新しい発想と技術によって、大きく変わる可能性もあります。そのような可能性が今回のSC06では示され、HPCプラットフォームのパラダイムシフトの可能性も示されています。
Copyright© 2005-2024 Scalable Systems Co., Ltd. All rights reserved.