注:转载自
一 . 准备阶段 :
1. 实验环境
包含3台主机,详细信息如下
主机名 | 操作系统 | IP | 作用 |
nagios-server | redhat 9 | 192.168.0.111 | 监控机 |
dbpi | redhat 9 | 192.168.0.100 | 被监控机 |
yahoon | xp | 192.168.0.28 | 被监控机 |
注:
监控机: 安装了nagios 软件的机器, 对监控的数据做处理, 并且提供web 界面查看和管理. 当然也可以对本机自身的信息进行监控.
被监控机: 安装了NRPE 等客户端, 根据监控机的请求执行监控, 然后将结果回传给监控机.
2.nagios 原理
这里引用某位仁兄的话
nagios的功能是监控服务和主机,但是他自身并不包括这部分功能的代码,所有的监控、检测功能都是有插件来完成的。再说报警功能,如果监控系统发现问题不能报警那就没有意义了,所以报警也是 nagios很重要的功能之一。但是,同样的,nagios自身也没有报警部分的代码,甚至没有插件,而是交给用户或者其他相关开源项目组去完成。 nagios安装,是指基本平台,也就是 nagios软件包的安装。它是监控体系的框架,也是所有监控的基础。 打开 nagios官方的文档,会发现nagios基本上没有什么依赖包,只要求系统是linux或者其他nagios支持的系统。不过如果你没有安装apache(http服务),那么你就没有那么直观的界面来查看监控信息了,所以apache姑且算是一个前提条件。关于apache的安装,网上有很多,照着安装就是了。安装之后要检查一下是否可以正常工作。 原文链接 |
3.Nagios 定义的监控状态
nagios定义了4中监控状态,代表不同的严重级别,除了OK代表正常不用关心外,其余3种都要引起重视.如下表
状态 | 代码 | 颜色 |
正常 | OK | 绿色, |
警告 | WARNING | ×××, |
严重 | CRITICAL | 红色, |
未知错误 | UNKOWN | 深××× |
4. 所用软件
nagios-2.9.tar.gz
nagios-plugins-1.4.9.tar.gz
nrpe-2.8.1.tar.gz
NSClient++-0.2.7.zip
注:
前三个的下载地址: ,
后一个的
5. 总体目标
学习嘛,总要有个目标,很简单,就是看到下面这张图
具体信息如下表
主机名 | 要监控的服务 |
nagios-server | 是否活动 |
是否开启ftp | |
磁盘使用情况 | |
dbpi | 是否活动 |
是否开启ssh | |
磁盘使用情况 | |
cpu 负载 | |
swap 分区使用情况 | |
主进程数 | |
当前登陆用户 | |
僵尸进程数 | |
yahoon | 是否活动 |
是否开启80 端口 | |
是否启动W3SVC 服务 | |
cpu 负载 | |
内存使用情况 | |
运行时间 | |
NSClient 客户端版本(NSClient 是一个windows 下的nagios 客户端) | |
C 盘使用情况 | |
D 盘使用情况 | |
explorer 进程运行情况 |
其中蓝色字体的服务是外部服务,也就是说不需要登陆被监控机,直接在外部就可以进行检查.例如我们需要检查被监控机是否打开80端口,就可以在别的一台机器上telnet被监控机的80端口即可.
绿色字体表示是内部服务,意思是必须登陆到被监控机上才能查看.因为它们属于”本地信息”(nagios将之称为LOCAL).很容易理解,你不登陆到被监控机上,如何知道当前磁盘的使用情况呢?
nagios是不是很强大,基本上对监控对象的任何信息都可以一手掌握了.而且不用登陆到目的机就可以看到那台机器私密的”本地信息”,比***还厉害啊.但是别误会,这可不是什么***.nagios有着十分安全的措施.
这确实是一个庞大的工程,你想想这还只是三台机器而已都已经监控这么多服务了,那要是多个几十台怎么办,不用紧张,从现在开始,跟我动手吧.
家庭作业,将所用的软件下载好,配置好监控机192.168.0.111上的apache.