フォーラム一覧 - トピック一覧 GroundWork Monitor の設定について Plugin timed out を変更したい | 投稿するにはまず登録を |
スレッド表示 | 新しいものから | 前のトピック | 次のトピック | 下へ |
投稿者 | トピック |
---|---|
nagisuke | 投稿日時: 2012-3-1 11:38 |
新米 登録日: 2012-3-1 居住地: 投稿: 1 |
Plugin timed out を変更したい groundwork-6.0.1、SP2適用の環境です。
Groundwork/NagiosでのPlugin timed outの設定について質問です。 Nagiosから監視対象ホスト上でスクリプトをキックして結果を監視しています。 サーバのリソース状況によって結果が返ってくるのに時間が掛かるときが有り CRITICAL;SOFT;1;CRITICAL - Plugin timed out while executing system call との結果となってしまいます。 nagios.cfgでは service_check_timeout=60 となっており、コマンドラインから実行しても長くても15秒程度で結果が返ってきます。 negateプラグインでラップしてタイムアウト秒を明示的に増やしてもダメでした。 check_result_reaper_frequency=10 が関係するでしょうか? また、nagios.cfgへの設定変更がロードから反映できなかったのですが Web-UIから変更できない値を反映する方法はあるでしょうか? どちらかというとNagiosの質問となってしまって恐縮ですが 宜しくお願い致します。 |
hiro | 投稿日時: 2012-3-1 18:14 |
一人前 登録日: 2008-6-5 居住地: 投稿: 75 |
Re: Plugin timed out を変更したい nagisukeさん、こんにちは。
たしかに、GroundWorkというより、Nagiosプラグインのお話ですね。 どのプラグインでこのエラーメッセージが出ているのかや、コマンドラインでの実行環境と GroundWork/Nagiosでの実行環境にどのような違いがあるか分からないので、 回答にならないかもしれませんが... 参考までに... 1)まず、このエラーメッセージは Soft ステートの Critical であり、実際に監視対象の システム資源が逼迫して監視応答が悪いという「クリティカル」な状況を検出した こと自体は正しいと思います。たまに発生するのであれば許容範囲でしょう。 そのような環境が前提であえて監視項目とするのであれば、時々 SOFT ステート で問題を検出しても HARD ステートになる前に復旧するレベルであれば、望ましい監視 設定状況だと思います。 (SOFT状態から復旧することなく、常にエラー(HARD)となるのでしょうか?) 2)コマンドラインから実行して必ず15秒以内で応答があるのであれば、 service_check_timeout = 60秒なので、問題は service_check_timeout の設定、 つまりタイムアウト時間の設定ではないと思われます。 negate プラグインでタイムアウト秒を増やしてもダメなのは、その証左かも。 3)GroundWork/Nagiosサーバ自体の過負荷の問題があるかもしれません。 たとえば、Nagios関連のフォーラムを覗いてみると、この"Plugin timed out ....”の エラーは、監視マシンが過負荷状態にある場合に検出されており、その問題を検出しない ために service_check_timeout を増やす対策が有効だと説明されている記事もあります。 試してみる価値はあるかもしれません。(Externalコマンド使用の場合ですが) 4)check_result_reaper_frequencyとは直接的な関係はないと思います。 5)GroundWork Monitor が設定するnagios.cfgの設定値を変更して調べたい場合、 # vi /usr/local/groundwork/nagios/etc/nagios.cfg で直接編集してから、 # /usr/local/groundwork/ctlscript.sh restart nagios で nagios をリスタートします。 |
hiro | 投稿日時: 2012-3-5 18:19 |
一人前 登録日: 2008-6-5 居住地: 投稿: 75 |
Re: Plugin timed out を変更したい 参考までの追加情報です。
1)「CRITICAL - Plugin timed out while executing system call」のメッセージは、プラグイン自体から出ています。 つまり、タイムアウト処理を行なってCriticalエラーとしているのはプラグイン自体なので Nagios側のタイムアウト設定(nagios.cfg等)をいじっても変わらない筈です。 詳しくは、NagiosやPluginのソースコードや使用方法の記述を読んでください。 2)上記のエラーを表示するのは、GWMのデフォルトプラグインの中のcheck_apt、check_by_ssh、check_dig、check_dns、 check_game、check_nagiosのようです。 これらのプラグイン実行時の問題だったのでしょうか? 3)プラグイン毎に異なりますので一概にはいえませんが、タイムアウト時間のオプション(例:-t)があるプラグインでは、 それを設定すればタイムアウト時間を延長できると思います。 4)Nagios/GroundWorkMonitorでプラグインオプションを設定するには、コマンドのコンフィグレーションで行なうのが 良いと思います。 |
スレッド表示 | 新しいものから | 前のトピック | 次のトピック | トップ |
投稿するにはまず登録を | |