注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

itoedr的it学苑

记录从IT文盲学到专家的历程

 
 
 

日志

 
 

web级系统监控软件openNMS  

2013-05-04 21:16:16|  分类: 系统监控 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
一、功能简介

1、故障事件管理

     当被管理对象的运行状态发生变化时,就会产生事件。如果该事件是由正常变为故障,则会产生故障报警。事件管理是通过收集、确认事件,对事件进行分类和过滤, 关联不同来源的事件完成对事件的处理和响应。通过事件管理,系统管理人员可以方便、迅速、及时掌握系统运行的故障和警报,及时进行处理,保障系统的正常、 稳定运行。

    IT系统管理人员所关注的问题,如系统资源出现短缺、数据库连接失败、网络通信中断、主机文件系统溢出等等都会以事件的形式表现出来。

1.1 关于OpenNMS
OpenNMS是由许多个人及组织,在OpenNMS软件专案这支大旗下,所共同打造的。从最初到2002年,程序代码是由Oculan Corporation开发并以GPL释出,后来后案的管理移交给 Tarus Balog。系统基于java/xml平台,当然跨平台。
目前OpenNMS的赞助企业是The OpenNMS Group,它们也拥有OpenNMS的商标。
OpenNMS是世界上第一个用开放原始码模式开发的企业级网络管理系统。和其它复杂、功能强大的系统一样,需要费一点心力来安装和设置。
1.2 系统支持
opennms构建于java系统以上,目前OpenNMS支持Linux(的很多不同发行版本), Solaris和Mac OS X,WINDOWS。
1.3 最低需求
虽然我们不可能针对特定的环境来精确地估算OpenNMS之系统需求,底下列出安装在 200个设备的网路中之最低需求。当然,只要有更好的硬件,OpenNMS可监控的设备数量百倍于此。
处理器
单处理器,1 GHz Pentium III 等级以上。OpenNMS能运用(系统中的)多处理器。
内存
最低256 MB的RAM,不过强烈建议512 MB。OpenNMS的Java Virtual Machine能运用大量的内存(最多2GB,如果是64-bit的处理器还可以更多)。如果手边的预算可在「更多的内存」和「更快的处理器」之间做个选 择,请选择「更多的内存」。
硬盘
OpenNMS程序本身需要大约25 MB。除此之外,每个资料变项查询结果(data variable collected requires)预设要283 KB。假设每个受控介面需要2 MB,那麼200个介面大约是400 MB(保守估计)。资料库部分,依照所储存的事件数目,你可以假设需要100 MB到200 MB。最後,OpenNMS的各个记录档可能变得很大,特别是在除错模式下。(请编辑OpenNMS设定目录(通常为/opt/OpenNMS/etc 或/etc/opennms)下的档案log4j.properties来变更这些设定。(综合以上所述)以最小系统来说,800 MB到1 GB应该足够了。
注意:除非是个很小的系统,否则请不要让OpenNMS使用RAID-5。如果要使用RAID,我们建议使用RAID-1或RAID-1+0。

2、操作系统监控

Opennms对各种计算机操作系统的可用性、运行状况和故障的集中监控是通过本身的SNMP服务程序完成的。这些SNMP代理程序是SNMP服务的组成部分。在本次建议的方案中,在所有的被监控服务器上其监控的主要内容包括:


CPU利用率,显示系统、用户、空闲时间的百分比;

虚拟内存(Virtual memory)利用率;

文件系统使用情况,显示磁盘空间使用情况;

监视文件系统的使用率,当使用率超过特定阈值时向系统管理员报警;

监控网络端口的输入、输出、错包,以及端口是否被停用或者删除;

UNIX系统还可以监控


3、网络节点配置信息管理

被监控对象节点在数据中的配置信息是IT设备的资产信息,每个网络节点都是一个特定的IT资产设备。每个节点在数据库中有很多属性字段供选择填写,主要有三类属性信息:

配置种类信息:配置分类、告警分类、轮询属性和阈值分类

标识信息:资产描述、厂商、型号、资产编号、操作系统等

位置信息:负责人、部门、楼层、房间、机架编号等


4、全面的节点监控

每个被监控的节点都能被细致的记录和监控。当查看某节点的信息时,有这样几类信息:状态信息、各种网络服务总的可用性、SNMP属性、各个接口熟悉、最近发生的5个事件和最近的故障事件。

在查看某个节点是,界面上的信息分为三类:网络服务可用性报表、当前状态和监控事件信息。在菜单栏还能有很多功能选项:查看故障事件、资产信息、响应时间报表、SNMP性能报表、重新扫描、节点管理和更新SNMP信息。

二、概念解释

界面(Interface)

任何被指定给网络设备, 能响应网络要求的IP地址, 或者, 任何透过SNMP协议回报自称是接口者.

服务(Service)

任何单一, 预先定义指定给一个接口的网络服务.

节点(Node)

任何拥有一个以上接口的实体设备. 一个节点可能有数个接口, 每个接口可能有数个服务. (某一特定 的接口是否"属于"某个节点可以用几种不同的方式来决定, 例如SNMP或NetBIOS名称. 然而, 如果某个特定接口并没有归属于任何节点的信息, 就会被表示为一个独立节点. )

事件(Event)

任何重大发生或发现.

故障(Outage)

一个暂时性的运作停摆, 其特征为无法和一个监控的服务沟通.(无法轮询)

告警(Notice)

当特定事件产生的时候, 系统可以发出告警. 发出告警意味着用电邮或传呼(pagers)或其它方式, 告知使用者或一群使用者, 所发生的事件; 某些情形下可能会触发修正动作.

笔者也想补充一句:那就是zabbix系统也全面有以上功能。

安装与使用(待续)


更多内容>>>(英文)
  评论这张
 
阅读(184)| 评论(1)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017