Page 5 - Panasas PanFS 8︓ アーキテクチャの概要
P. 5

ホワイトペーパー



            ディレクターノードとストレージ                                      この場合、データのトラフィックがヘッドノードに集中す

            ノードのリニアなスケールアウト                                      ることで明らかにボトルネックが発生する可能性がありま
                                                                 す。高速なファイルアクセスを実行するには高速のバック
            PanFS は、ディレクターノードとストレージノードの両方                        エンドネットワークが必要となるため、システム全体のコ
            をスケールアウトします。メタデータ処理のパフォーマン                           ストが上がります。対照的に、計算サーバ上の DirectFlow
            スを向上させるために、より多くのディレクターノードを                           クライアントは、アプリケーションがアクセスしようとす
            追加することができます。ストレージノードを増設するこ                           る各ファイルに対してそのファイルのデータを保持してい
            とで、ストレージの容量の増加とパフォーマンスの向上を                           る全てのストレージノードとネットワークを介して直接
            図ることが可能となります。                                        データのやり取りを実行します。

                                                                 ディレクターノードは 「Out-of-Band(帯域外)」 にあるため、
            PanFS のようなスケールアウトストレージシステムでは、                        データ転送時のパフォーマンス低下を意識する必要のない
            単純に最大性能や最大容量といった仕様の数値は意味があ                           効率的なアーキテクチャとなり、スケールアウト NAS シス
            りません。ノードを数台追加するだけで、より優れたパ                            テムによく見られるホットスポットやボトルネック、不安
            フォーマンスや大容量を実現することができます。PanFS                         定なパフォーマンスの発生を大幅に抑えることができます。
            はリニアなスケールアウトを実現するように設計されてい
            ます。ストレージノードを 50% 追加すると、容量が 50%
            増加すると同時にパフォーマンスも 50% 向上します。
                                                                        クライアント              クライアント
                                                                      NFS &      帯域外         DirectFlowクライアント
                                                                       SMB     メタデータ
               ある PanFS のお客様は、数年の間に 1 つの PanFS
               レルムへ 1,500 以上のストレージノードと 150 以                            ActiveStor
                                                                        ディレクター
               上のディレクターノードを少しずつ追加していきま
               したが、そのすべての過程においてパフォーマンス
               はリニアに向上しました。このスケールアウトは、                                      DirectFlowパラレルアクセス
               数千人の研究者で構成されるユーザーコミュニティ
               において、すべての研究者が独自に HPC アプリケー
               ションを同時実行している環境に対応している間に                                 OSD   OSD   OSD    OSD   OSD   OSD
               実施されました。
                                                                          ActiveStor Ultraストレージノード


            クライアントからのパラレル転送                                      図2︓パラレル転送とダイレクト転送
            とダイレクト転送                                             ファイルマップ、並列処理、イレ


            PanFS は、標準的な NFS や CIFS/SMB プロトコルよりも数                イジャーコーディング
            桁以上も高い帯域幅を一貫して提供可能なパラレルファイ
            ルシステムです。PanFS によって保存された各ファイルは、                       PanFS は、各ファイルにマップを割り当てることで複数の
            多数のストレージノードにわたって個別にストライプ化さ                           ストレージノードを利用します。このマップは、ストライ
            れているため、ファイルの各構成要素を並列に読み書きす                           ピングされたファイルのすべてのコンポーネントパーツが
            ることが可能で、各ファイルへのアクセスのパフォーマン                           どこにあるか、どのストレージノードが各パーツを保持し
            スが向上します。                                             ているかを示します。DirectFlow クライアントは、そのマッ
                                                                 プを使用して直接または並列アクセスするストレージノー
            また PanFS は、計算サーバがネットワークを介してすべ                        ドを認識します。
            てのストレージノードと直接通信することを可能にするダ                           また PanFS は、そのストライピングの一部としてイレイ
            イレクトファイルシステムでもあります。一般的なエンター                          ジャーコーディング ( 消失訂正符号 ) を使用し、最高レベ
            プライズ製品におけるファイルアクセスは、NFS または                          ルのデータの完全性と信頼性を確保しています。
            CIFS/SMB のサービスを実行している「ヘッドノード」を
            介して実行され、ファイルを保持する HDD または SSD を
            含む他のノードにバックエンドのネットワークを経由して
            転送されます。


                                                                                       Panasas PanFS 8︓アーキテクチャの概要  5
   1   2   3   4   5   6   7   8   9   10