Tap In と Ganglia の統合
Ganglia とは ?
Ganglia は主としてグリッドコンピューティングで使用されるオープンソースの分散化された、スケーラブルな監視システムです。それは階層的なクラスタ設計に基づきます。監視計測項目を収集する低オーバヘッドのモジュールがクラスタ内の各ノードにインストールされます。そのノードはそれら計測項目を、計測項目をまとめるクラスタレベルに転送します。そして、クラスタレベルの計測項目は、グリッドレベルの計測項目に渡されます。
その結果は、性能グラフのセットとRRDToolを使って構築された計測項目となります。収集された計測項目はグリッドで提示され、ユーザはクラスタや個別ノードにドリルダウンできます。
カリフォルニア大学 Berkley 校のグリッドを表示するライブデモが、http://monitor.millennium.berkeley.edu でアクセスできます。
Ganglia のメリットは何か ?
各ノードにインストールされた分散モジュールは、高性能のために設計され、Ganglia 監視のためのオーバヘッドは非常に低くなってます。計測は、他の監視ツールよりも監視対象システムへの影響が少なく、高レート(毎分数回)でサンプリングすることができます。
Ganglia は、多くの種類のオペレーティングシステムに移植されているので、導入はかなり簡単です。多数のサイトに導入されており、堅牢性は証明されています。
高キャパシティな特徴から、Ganglia は数千ノードを持つグリッドをサポートすることができます。
Ganglia の短所はどこか ?
計測項目の計測がコンパイルされたコードで行われるため、Ganglia 監視は他の監視システムと比べて融通が利きません。Nagios のようなスクリプト指向の他の監視システムよりも、新しい監視計測項目の導入が難しくなります。これは、高パフォーマンスを得ることのトレードオフです。
Ganglia は、標準の Ganglia 導入で提供されるオペレーティングシステムのレベルの計測のみの監視が必要なだけであれば、配備は最も簡単です。よりカスタム化した計測項目が必要であれば、計測項目収集プロセスを作成し Ganglia の統合する必要があります。これにはある程度のプログラミングスキルが必要です。
また、これは Ganglia レポートでも同様です。標準レポートはうまく機能しますが、Ganglia データに基づいたカスタムレポートを作成したい場合は、RRD データを使うために独自の Web アプリケーションを開発する必要があります。
Ganglia はパフォーマンスグラフを提供するには良いですが、アラートや自動化アクションを提供しません。ですので、Ganglia はシステムアドミニストレータの性能診断や性能チューニングのための良いツールですが、例外状況を見る必要があるオペレーション担当にはそうでは有りません。
Ganglia はノード外部からのアクティブなサービスレベル監視 - たとえばWeb サーバへの HTTP チェック実行など、を提供しません。この観点から、その内部監視モジュールから分かる計測のみが使用できるといえます。
クラウドの観点で言えば、それはクラウドや仮想化メタデータが分かりません。レポートは、クラウド内では動的に変化するであろうホスト名に基づきます。ホスト名が一時的なため、停止されたインスタンスからのデータは失われるでしょう。
Tap In--Ganglia 統合サーボスが提供するメリットは何か ?
Tap In system のクラウド管理サービスは、下記のメリットを提供するために Ganglia と統合することができます。
どの Ganglia 計測項目監視でもアラートが生成できます。これらのアラートにより、オペレータはサービスに影響を与える問題を抱えるノードを容易に見つけることができます。 Tap In のアラートコンソールを見ることで、Ganglia グリッド全体の可視性が提供できます。通知と他の自動化アクションもこれらのアラートをトリガーにできます。
Ganglia の計測項目をベースとして追加の監視計測項目を作成して、監視することができます。たとえば、Gangliaの "swap total" と "swap free" 計測項目から計算した、計測項目の "swap percent free" が作成して監視できます。これらの計測項目からグラフレポートが作成できます。
Tap In 監視サービスは、すばやく容易に導入されます。Tap In サービスがクラウド内に配備されているため、ハードウェアやソフトウェアのインストレーションが不要です。Ganglia の監視項目が監視されるので、この監視のために監視対象ノードへの負荷が増えることもありません。
付属する Tap In クラウドエージェントがインストールされれば、 Tap In のサービスはクラウドや仮想化のメタデータを組み込むことができます。これにより Tap In レポートがアラートやレポートにクラウドのメタデータを組み込むことができます。
この統合ソリューションはどのように働くか ?
Tap In クラウド管理サービスは Amazon EC2 クライドの中に配備されています。この管理サーバーは Tap In イベントからのイベントを受け取ったり、アクティブ監視チェックを実行することができます。どの Nagios プラグインでもエージェントやサーバ上に配備できます。Tap In のクライアントコンソール・アプリケーションは、そのサーバによって受け取られた監視イベントのビューを提供します。Web レポートは、このイベントデータの履歴のビューを提供します。
特別な Ganglia 監視モジュールが管理サーバに配備されました。サービスがスタートすると、その Ganglia の gmetad ポートが grid 環境の自動検出のため監視され、計測項目のデータが集められます。オペレータは、各グリッド、クラスタやホストレベルに適用するアラートの閾値を指定します。
ソフトウェアをインストールする必要がないため、 Tap In サービスは数分で導入できます。 Ganglia 監視モジュールをカスタマイズするには、アドミニストレータいくつかの Web ページに記入するだけです。コーディングは必要ありません。
詳しくは、info@tapinsystems.com にお問い合わせください。