統合監視システム「Nagios」(ナギオス)を自宅のCentOS6.3(VMWare Player上)にインストールしました。
インストールは下記の本を参考にしました。この本の手順に従えばインストールできます。
標準プラグインのインストールが上手く行かなかったのですが、OpenSSL入れて再度実行しなおしたらうまくインストールできました。NRPEもインストール。
この本には書いてないけど、NRPEを使う場合はFirewallの設定変更が必要です。ポート5666を開ける必要があります。
いざ監視設定。ホストの追加がわかりにくいんですが、まずは/usr/local/nagios/etc/objects配下に、「ホスト名.cfg」の設定ファイルを作ります。Nagiosユーザで作りました。Ping監視するのであれば以下のとおり。
#-------------------------------------------------- # Router.cfg #-------------------------------------------------- define host{ use generic-switch host_name Router alias Router address 192.168.xxx.xxx hostgroups switches } define hostgroup{ hostgroup_name switches ; The name of the hostgroup alias Network Switches ; Long name of the group } define service{ use generic-service host_name Router service_description PING check_command check_ping!200.0,20%!600.0,60% normal_check_interval 5 retry_check_interval 1 } #--------------------------------------------------
続いて、この「Router.cfg」を読みこませるために、/usr/local/nagios/etcにあるnagios.cfgに以下を追記します。
cfg_file=/usr/local/nagios/etc/objects/Router.cfg
設定にミスがないかチェックするために以下のコマンドを実行。
# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
結構長く出力されますが、最終的に
Total Warnings: 0
Total Errors: 0
Things look okay – No serious problems were detected during the pre-flight check
が表示されればOK。誤記あると以下のようなエラーになります(しっかりとやってしまいました)。
***> One or more problems was encountered while processing the config files…
Check your configuration file(s) to ensure that they contain valid
directives and data defintions. If you are upgrading from a previous
version of Nagios, you should be aware that some variables/definitions
may have been removed or modified in this version. Make sure to read
the HTML documentation regarding the config files, as well as the
‘Whats New’ section to find out what has changed.
エラーなければNagios再起動。
# service nagios restart
これでホストの監視が実行されます。
しかしながら、
・ホスト追加・設定追加がGUIでできない。
・サービス再起動(あるいはHUPシグナル送り)が必要。
という点で、Zabbixでいいんじゃないかなー、という気がします。
本は今年61冊目。