aeMonitor /GWMonitor-Japaneseコミュニティーサイト

Register Now | Log in | Lost Password

フォーラム

フォーラム一覧   -   トピック一覧
   GroundWork Monitor 一般
     pre-flightはSuccessなのにcommitの最後でFAILED! Restart aborted
投稿するにはまず登録を

スレッド表示 | 新しいものから 前のトピック | 次のトピック | 下へ
投稿者 トピック
ishikawa
投稿日時: 2009-3-7 14:19
新米
登録日: 2009-3-6
居住地:
投稿: 4
pre-flightはSuccessなのにcommitの最後でFAILED! Restart aborted
いつもお世話になっております。

通知設定をしてから、おかしな現象が発生するようになりました。pre-flightはSuccessなのにcommitが完了せず、nagiosが起動できなくなってしまいました。

pre-fligすると、最初にSuccess:と表示され、
Total Warnings: 0
Total Errors: 0

Things look okay - No serious problems were detected during the pre-flight check
となるのですが、その後コミットしても、
Results:はSuccess:ではあるのですが、
最後に

Total Warnings: 0
Total Errors: 0

Things look okay - No serious problems were detected during the pre-flight check
Running configuration check... FAILED! Restart aborted. Check your Nagios configuration.

となってしまいます。
ブックシェルフの「MONARCH(構成)データベースのバックアップとリストア」を参照して、コミット前に取っていたmonarchのバックアップから戻してみたのですが、現象変わりません。

nagiosが起動できなくなってしまっていました。nagiosにアクセスすると、
Whoops!
Error: Could not read host and service status information!

と、言われてしまいます。

調べてみると、nagios.cfgは、/usr/local/groundworkの下に2個あるのですね。

./monarch/workspace/nagios.cfg
./nagios/etc/nagios.cfg

nagios -v で確認したところ、workspaceの下の方はpre-configureと同じ結果になるのですが、etcの下は確かにErrorがあります。(以下に貼り付けます)
Checking contacts...
Error: Service notification command 'service-notify-by-emailservice-notify-by-email' specified for contact 'jdoe' is not defined anywhere!
Error: Host notification command 'host-notify-by-emailhost-notify-by-email' specified for contact 'jdoe' is not defined anywhere!
Error: Service notification command 'service-notify-by-emailservice-notify-by-epager' specified for contact 'nagiosadmin' is not defined anywhere!
Error: Host notification command 'host-notify-by-emailhost-notify-by-epager' specified for contact 'nagiosadmin' is not defined anywhere!
Checked 2 contacts.

2個のnagios.cfgの更新日付はどちらも同じで、コミットのタイミングに作成されていました。
この差が、pre-flightはSuccessなのにcommitの最後でFAILED! Restart abortedとなる原因と考えているのですが、どう対処すればよいのか見当がつきません。どなたかアドバイスいただけませんでしょうか?


hiro
投稿日時: 2009-3-9 11:05
一人前
登録日: 2008-6-5
居住地:
投稿: 75
Re: pre-flightはSuccessなのにcommitの最後でFAILED! Restart aborted
過去、「pre-flightがSuccess」なのにCommitでダメということは、ありました。(既にフォーラムのどこかで話が出た思いますが...)
その時は、DBの中に「日本語文字」を入れてしまい、(削除できないので)DBを直接いじって削除し、おかしくなった...ということだったと記憶していますが。

さて今回の現象ですが、作業状況や nagios -v でのエラー内容を見ると「通知設定をしてから」と言う考えられるは至極もっともですが、問題の根は実はその前にある場合もあります(つまり、通知設定の前行った何かが影響しているかもしれません)ので、少し前の操作も思い出してみて、
通常以外の操作をしていなか思い出してみてください。特に、特殊キャラ(含、日本語文字コード)入力は要チェックです。(間違えて入力したけど保存する前に修正したのなら、まったく問題ないですが、保存してしまうといけません。)

旧い情報ですが、本家のコミュニティ
http://www.groundworkopensource.com/community/forums/viewtopic.php?f=21&t=1466&p=5073&hilit=Commit+FAILED+Restart+aborted.#p5073
で、Prefright が Success なのにCommitでエラーとなる...という現象に「不正な文字が('~$&|'"<>'のような文字)マクロに設定されているのでは?」という回答が出ていました。

なんらかの心当たりがあれば、(多分、何度か前の分のバックアップはまだ残っているでしょうから)、気がかりな処理をしたその時点より前のDBバックアップをリストアして、再度、プリフライト&コミットしてみてください。(通常は、これで直ります。)

で、以下は余談ですが、、、、、、、
nagios.cfg の日付比較ですが、問い合わせの状況から判断するに、 nagios.cfg については多分、 diff しても優位な差は無いと思います。
Nagiosの設定は、nagios.cfg だけで行われているのではなく、nagios.cfg があるディレクトリの中の .cfg ファイル群で行われています。
今回は、 nagios.cfg 以外の .cfg ファイルで問題があるのだと思います。

で、./nagios/etc/nagios.cfg と ./monarch/workspace/nagios.cfg の コンフィグファイルの作成日付ですが、 nagios.cfg とすべて同じでしょうか?

GroundWorkでPreflightやCommitを行った場合、DBからすべての .cfg を同時に作成するはずですので、日付が異なる場合、
その.cfgを作成する際に、データエラーが発生してうまく作成されなかったというような可能性があります。


 
hiro
投稿日時: 2009-4-16 12:27
一人前
登録日: 2008-6-5
居住地:
投稿: 75
Re: pre-flightはSuccessなのにcommitの最後でFAILED! Restart aborted
超遅レスで申し分けありませんが、現象と対策が分かったような気がするので....書いておきます:

PreFligtTestで OK だったのに、commitで Nagios がエラーで立ち上がらない場合に、
# /usr/local/groundwork/nagios/bin/nagios -v /usr/local/groundwork/nagios/etc/nagios.cfg

を実行してチェックしてみますが、その際

Error: Service notification command 'service-notify-by-emailservice-notify-by-email' specified for contact 'jdoe' is not defined anywhere!

などのエラーを検出した...と同じ現象の方がいらっしゃった場合の回避策(案)...

1) 現象について、 'service-notify-by-emailservice-notify-by-email'は、どうやらデフォルトの通知設定(ホスト通知コマンドとサービス通知コマンドの2箇所あります)で、service-notify-by-email と host-notify-by-epager...などの二つが選択されているため、それが原因でくっついてしまったのだと思われます。

2) 回避策ですが、通知コマンドの設定を1つだけにすると直ると思います。

スレッド表示 | 新しいものから 前のトピック | 次のトピック | トップ

投稿するにはまず登録を