Linux システム管理アプリケーション | Linux システム監視アプリケーション
イントロダクション
Tap In System のクラウド管理サービスは、サービスチェックを実行し、ステータスとパフォーマンスのイベントデータを Tap In 管理サーバに送って、それを MySQL データベースに保存することで Linux システムとアプリケーションを管理します。ユーザは、Tap In のビューア・アプリケーション -- Tap In QuickView クライアント、Tap In Web アプリケーションおよび、Tap In デスクトップウィジェットを使って、この監視データにアクセスし、分析を行って、アクションを実施できます。
外部チェック
ユーザはふたつのタイプ、外部(external)と内部(internal)のサービスチェックを実行できます。外部チェックは Tap In 管理サーバ上で実行されインターネット越しにそのサービスが使用可能かどうかを調べます。外部チェックには下記があります:
- HTTP/HTTPS
- Ping
- TCP ポート
- SNMP ポーリング
- Web サービス呼び出し
外部チェックは内部インフラストラクチャに依存しないため、貴社の顧客やユーザがそのサービスを参照できているかを調べるのに有用です。外部チェックは Tap In 管理サーバ上の Web インタフェースを使って構成設定します。
内部チェック
内部チェックは Linux システム上で実行されます。それらはデータを収集するために OS に直接アクセスし、その後 Tap In 管理サーバーにその結果のイベントフォームを作って送ります。内部チェックには下記があります:
- CPU
- ロード(負荷)
- ディスク領域
- メモリ
- Swap
- システムとアプリケーションの LOG ファイル
内部チェックは Tap In の Linux エージェントから実行されます。オープンソースとして配布されるエージェントは個々のチェックを実行し、結果を翻訳して Tap IN イベントを作成し、クラウド内の Tap In 管理サーバにイベントを送る Perl スクリプトです。実行するチェックとアラートの閾値などのパラメータは構成ファイルで定義されます。エージェントは通常、crontab でスケジューリングされます。
サードパーティー製ツールとの統合
すでに貴社の一部かすべての Linux システムのを監視するのにツールを使用していて、Tap In を使ってその能力を拡張、強化したい場合、既存のシステムを置き換えるのでなく、統合する選択をするでしょう。下記は、それを Nagios、Big Brother および Ganglia についてどのように行うかの例です
- Nagios。 Tap In の Nagios 統合モジュールは、 Nagios の状態変化が発生した場合に常に Nagios から呼ばれて Tap In サーバにイベントを送出するイベントハンドラです。
- Big Brother。 Tap In の Big Brother 統合モジュールは、Big Brother のステータスログを読み、アップデートイベントを Tap In 管理サーバに送ります。
- Ganglia。 Ganglia はグリッドコンピューティングで使用される高性能の計測値収集ツールです。Tap In は Tap In イベントを作成するために Ganglia の状態情報を読むことができます。これにより個々のスクリプト実行のオーバヘッドをなくします。
レポートとグラフの作成
Tap In 管理サーバに性能データが渡されたら、Tap In はその情報を内部データベースと ラウンドロビンデータベース(Round Robin Databases)の両方に保存します。その後、Tap In は、このデータに基づいて、後述のようにグラフを作成します。これは、どんな追跡が必要な計測値でもグラフ化する簡単な方法です。同様に、収集された計測上を表示するのにレポートが利用できます。たとえば、Tap In は、後述のグラフのように(個々のサーバ計測値に加えて) Linux サーバのグループ全体の平均 CPU 使用率を示すグラフを作成することができます。