目次 表示
このプロファイルは、複数の GroundWork サーバの健康状態と性能をトラッキングする必要がある、大企業配備のためにデザインされました。
含んでいるサービスは、ほとんど local-groundwork-server プロファイルのコピーですが、ssh を介して機能するようになっています。このような方式で監視されるリモートの GroundWork サーバは、ssh を介して監視される他のサーバと同様に、ssh キーのセットアップをする必要があることに注意してください。また、 Nagios のホームディレクトリにローカルのプラグインのコピーが入っているか、 nagios ユーザのログインポイント(通常は、/usr/local/groundwork/users/nagios か /home/nagios)から相対パス ./libexec でアクセスできるよう、リモートの GroundWork サーバ上の Nagios プラグインのディレクトリ (/usr/local/groundwork/nagios/libexec) へのリンクがある必要があります。
Notes:
サービス ssh_cpu_proc と ssh_mem_proc は一般的なものです。これらはそのまま使用するのではなく、特定のプロセスの CPU や メモリ 使用をチェックするために複製して変更することを意図して開発されたものです。それらは、ホストに適用する前にプロファイルから削除する必要があり、そうしないと、それらは critical(障害)ステータスと、ステータスのテキストとしてエラーメッセージをレポートするでしょう。
サービス ssh_disk_varと ssh_disk_home は、サービス ssh_disk_root で計測する root (/) ボリューム以外のマウントポイントの場合に使用することを意図した見本です。これらのマウントポイントが使用されず、異なるボリュームでない場合、それらを削除する必要があります。異なるマウントポイントにボリュームがマウントされている場合、それらを追加するべきです。
サービス - Configuration(コンフィグレーション)内の定義はこの名前の下に格納されています。
コマンドライン - プラグインへ渡される引数付きのサービスコマンド
プラグインのコマンドライン - このサービスのためのNagiosに呼ばれたプラグインスクリプト
注意: 下記のコマンドラインは、一行のコマンドを意味します。
サービス |
コマンドライン |
プラグインのコマンドライン |
ssh_cpu_httpd |
check_by_ssh_cpu_proc!20!30!httpd |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_java |
check_by_ssh_cpu_proc!20!30!java |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_mysql |
check_by_ssh_cpu_proc!20!30!mysql |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_nagios |
check_by_ssh_cpu_proc!20!30!nagios |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_perl |
check_by_ssh_cpu_proc!20!30!perl |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_proc |
check_by_ssh_cpu_proc!<warn>!<crit>!<procname> |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_snmptrapd |
check_by_ssh_cpu_proc!20!30!snmptrapd |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_snmptt |
check_by_ssh_cpu_proc!20!30!snmptt |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_cpu_syslog-ng |
check_by_ssh_cpu_proc!20!30!syslog-ng |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_disk_home |
check_by_ssh_disk!400!200!/home |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_disk_root |
check_by_ssh_disk!400!200!/ |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_disk_var |
check_by_ssh_disk!400!200!/var |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_load |
check_by_ssh_load!5,4,3!10,8,6 |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_httpd |
check_by_ssh_mem_proc!20!30!httpd |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_java |
check_by_ssh_mem_proc!40!50!java |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_mysql |
check_by_ssh_mem_proc!20!30!mysql |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_nagios |
check_by_ssh_mem_proc!20!30!nagios |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_perl |
check_by_ssh_mem_proc!20!30!perl |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_proc |
check_by_ssh_mem_proc!<warn>!<crit>!<procname> |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_snmptrapd |
check_by_ssh_mem_proc!20!30!snmptrapd |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_snmptt |
check_by_ssh_mem_proc!20!30!snmptt |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_mem_syslog-ng |
check_by_ssh_mem_proc!20!30!syslog-ng |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_memory |
check_by_ssh_mem!80!90 |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_nagios_latency |
check_by_ssh_nagios_latency |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_process_count |
check_by_ssh_process_count!80!100 |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
ssh_swap |
check_by_ssh_swap!20%!10% |
$USER1$/check_by_ssh -H $HOSTADDRESS$ -t 60 -I "USER17$" -C "$USER22$/check_procl.sh --cpu -w $ARG1$ -c $ARG2$ -p $ARG3$" |
tcp_gw_listener |
check_tcp_gw_listener |
$USER1$/check_tcp -H $HOSTADDRESS$ -w $ARG1$ -c $ARG2$ -p 4913 |
tcp_http |
check_http!3!5 |
$USER1$/check_http -H $HOSTADDRESS$ -w $ARG1$ -c $ARG2$ |
tcp_nsca |
check_tcp_nsca |
$USER1$/check_tcp -H $HOSTADDRESS$ -w $ARG1$ -c $ARG2$ -p 5667 |
tcp_ssh |
check_ssh |
$USER1$/check_ssh -H $HOSTADDRESS$ -t 60 |
このパッケージには次のファイルが含まれます:
プロファイル定義
service-profile-ssh-groundwork-server.xml
perfconfig-ssh-groundwork-server.xml
プラグインスクリプト
check_http
check_procs
check_mysql
check_nagios_latency.pl
check_nagios
check_tcp
check_procl.sh
性能グラフのプログラム
percent_graph.cgi
number_graph.cgi
label_graph.cgi
GroundWork Monitor には、さまざまなディバイス、システム、アプリケーションに対する多くの監視プロファイルが含まれます。新しいGroundWorkのインストール上にすでにインポートされたプロファイルには、Service Ping、SNMP ネットワーク、SSH UNIXがあります。GroundWork Monitor Configuration(コンフィグレーション)ツールは、更新したプロファイル、および追加設定を要求するプロファイル(プロファイルの XML ファイルと、それに付随する Performance Configuration 定義ファイル)をインポートするために使用されます。インポートの手順は、GROUNDWORK PROFILES > プロファイルのインポート
このセクションでは、このプロファイルを使用した詳細設定を説明します。これらのパラメータは、コンフィグレーションツールによって変更することが可能です。
コマンドパラメータは、サービス設定セクション内のコマンドパラメータは、下記の名前とデフォルト値を持ちます。
ssh_cpu_<process name>
サービス "ssh_cpu_<process name>" は特定のプロセスもしくはプロセスのグループの CPU 使用率を計測します。ある一時点でのこれらすべてのサービスの総合した CPU 使用率は、必ずしも 100% にならないことに注意してください。 Nagios は、それらすべてを異なる時間にチェックし、それら(ssh_cpu_perl など)のいくつかは、他がひとつ以上のグループのメンバーとなっている個々のプロセスをチェックしている間に、プロセスグループを実際にチェックするでしょう。たとえば、ssh_cpu_perl は Perl プログラムである ssh_cpu_snmptt の計測値を含むでしょう。
ssh_disk_home
これは /home パーティションのチェックの見本です。 /home が / と異なるパーティションでない場合、このサービスは削除する必要があります。
ssh_disk_root
root パーティションのディスク使用をチェックします。
$ARG1$ - 使用率がこの値を超えると、WARNING (警告)アラートが生成されます。デフォルト値は、400。
$ARG2$ - 使用率がこの値を超えると、CRITICAL(異常)アラートが生成されます。デフォルト値は、200。
$ARG3$ - パーティション
ssh_disk_var
これは /var パーティションのチェックの見本です。 /var が / と異なるパーティションでない場合、このサービスは削除する必要があります。
ssh_load
$ARG1$ - 5、4、3 分のロードが規定値を超えるならば、WARNING (警告)アラートが生成されます。
$ARG2$ - 10、8、6 分のロードが規定値を超えるならば、CRITICAL(異常)アラートが生成されます。
ssh_mem_<processname>
サービス "ssh_mem_<process_name>" は、CPU 使用の計測と同様に、個々のプロセスのメモリ使用を計測します。実際に、同じプラグイン check_by_ssh_mem_procl.sh が両者のために使用されています。
ssh_memory
$ARG1$ - メモリ使用率がこの値を超えると、WARNING (警告)アラートが生成されます。
$ARG2$ - メモリ使用率がこの値を超えると、CRITICAL(異常)アラートが生成されます。
ssh_nagios_latency
プラグイン check_by_ssh_nagios_latency.pl は、アクティブサービスチェックがスケジュールされた時間と実際に実行された時間を比較します。これは、遅延(latency)といい、サーバの負荷を示します。このプラグインはアラートを発生しませんが、遅延をグラフに表示することができます。
Nagios のサービスチェックスケジュール "遅延" の計測、言い換えると、サービスチェックのスケジュール時間からどれほど遅れて、実施に実行されたか。これは、実行時間のチェックと対照的です。ここで見るべき良い計測値は、平均遅延です。この数値は10秒以下で安定しているべきです。このサービスは閾値を持たず、アドミニストレータに警報をしません。
ssh_process_count
これは、リモートの GroundWork サーバ上のアクティブプロセスの総数チェックです。これは、継続観察するのに良い計測値で、特に、NMS などのアドオンパッケージを使用したり、チャイルドサーバ上で多数のアクティブチェックをしている場合便利です。WARNING (警告)の閾値は 80、CRITICAL(異常)の閾値は 100 です。
ssh_swap
これは、スワップの使用チェックです。スワップの使用が過大だと、システムの性能が劣化します。閾値はスワップの残量で、WARNING (警告)は残り 20% で生成され、CRITICAL(異常)メッセージは残り 10% で生成されます。
tcp_gw_listener
TCP ポートが開いているかのチェックで、この場合そのポートは GroundWork の Foundation データベースの中に状態およびメッセージデータをポストするのに使用されます。これは foundation が稼動中には常に開いている必要があります。注:チャイルドサーバの性能の理由で Foundation が偶に無効にされることがあるため、いくつかのチャイルドサーバインスタンスでは、このポートが閉じていても正常な場合があります。プライマリのサーバ上では開いている必要があり、さもなければ、データベースはデータを受け付けません。
tcp_http
非常に低いレベルでの Web インタフェースの可用性チェック。ユーザが GroundWork の Web ポータルを使えないとアドミニストレータに警報するためにデザインされました。
tcp_nsca
$HOSTADDRESS$上のリスニング TCP 5667番ポートをチェックします。これはリモートホストから通信をリスニングするためにNSCAに使用されるポートです。 GroundWork は、パッシブのホストおよびサービスチェックを受け付けるため、NSCA を Nagios ( 実際には bronx イベントブローカ形式の中)へのアドオンとして使用します。このポートはデフォルトでオープンされており、まれに無効にされますので、ステータスは定期的にチェックされます。
tcp_ssh
優れた実施策として、ssh ポートのチェックを組み込みました。このサービスは、誤報アラームを最小化するために、必要であれば、通知と依存関係実行のルートを作ります。
下記のパラメータは、性能チャートを生成するために使用されます。 これらのパラメータは、Configuration(コンフィグレーション)> Performance tool(パフォーマンスツール) ツールを使用して設定されます。
ssh_cpu_<process name>
プロセスの CPU 使用率をグラフ化。
Nagios のサービス記述に "ssh_cpu_<process name>" の文字列を含む必要があります。
ssh_disk_home, ssh_disk_var は同様です。
ssh_disk_root
root パーティションのディスク使用率をグラフ化。
Nagios のサービス記述に "ssh_disk_root" の文字列を含む必要があります。
ssh_load
1、5 と 15 分のロードアベレージをグラフ化。
Nagios のサービス記述に "ssh_load" の文字列を含む必要があります。
ssh_mem_<processname>
そのプロセスのメモリ使用率をグラフ化。
Nagios のサービス記述に "ssh_mem_<processname>" の文字列を含む必要があります。
ssh_memory
メモリ使用パーセンテージをグラフ化。
Nagios のサービス記述に "ssh_mem" の文字列を含む必要があります。
ssh_nagios_latency
Nagios サービスチェックの遅延をグラフ化。
Nagios のサービス記述に "ssh_nagios_latency" の文字列を含む必要があります。
ssh_process_count
これは、実行中プロセスの数の標準グラフです。
ssh_swap
これは、スワップ使用率の標準グラフです。
tcp_gw_listener
Nagios のサービス記述に "tcp_gw_listener" の文字列を含む必要があります。
tcp_http
これは、ポートの応答時間とデータ転送量の標準グラフです。
tcp_nsca
NSCA デーモンが応答するのにかかる時間をグラフ化します。
Nagios のサービス記述に "tcp_nsca" の文字列を含む必要があります。
上述のように、GroundWork サーバの監視は、ユーザ nagios で、交換したキーによる ssh を介したアクセスができる必要があります。プラグインは -nagios/libexec でアクセスできる必要があります。
Nagios の遅延グラフは Nagios 2.0 のバイナリ /usr/local/groundwork/nagios/bin/nagiostats とプラグイン check_nagios_latency.pl の組み込みバージョンを基にしています。標準のフォーマットでの性能データの作成は変更されました。その他、すべてのチェックは Nagios ために働く必要があります。