banner

zabbix学习笔记(1)-zabbix概念

这是一篇来自付生保个人博客的文章,是关于zabbix学习笔记


一般来说公司中的运维工作包括4部分:基础运维,应用运维,运维开发和监控。

基础运维一般负责IDC机房,上架服务器,网络

应用运维一般负责操作系统,也可以叫系统管理员。

运维开发一般负责运维工具的开发,系统开发等工作,例如:监控系统,发布系统之

监控一般是24小时值班的人员,要实时关注网络和系统的状况,出问题要第一时间处理或联系运维及研发。

好的运维架构是什么样子的

1,硬件标准化-包括服务器,内存,系统版本等。

2,软件标准化-应用版本等

3,运维自动化-包括监控、发布、CMDB等。

运维自动化,就是把运维中大量日常重复性工作使用工具让其自动运行,减少人的参与:

1,监控报警:系统数据,应用指标的监控,和出错时及时报警。

2,发布系统:代码发布,发布后的检查,代码的回滚,灰度发布。

3,服务器标准化:cobbler装机加上puppet,可以做到硬件、软件的标准化。每台服务器对于运维来说都是一样的。

4,CMDB:配置管理数据库,存储了所有运维相关数据,包括服务器硬件信息、域名和服务器的关系、IDC容量等。

监控系统在运维自动化里的角色,可以用下面三点来概括。

1,监控数据收集及可视化

2,异常数据报警

3,和其他系统协同工作

监控系统理想状态

1,监控数据收集及可视化

》1,监控系统能够自定义监控内容,可以自己写脚本来收集需要的数据。

》2,数据要保存在数据库中,这样以后需要的时候可以对这些数据进行分析计算。

》3,能够方便、快速地将监控加入到服务器上,不需要繁琐的操作。

》4,数据可视化不需要很花哨,但要直观好用。

2,异常数据报警

》1,可以定义复杂的报警逻辑,可以做到ltem之间的关联报警,二不是只能针对一个。

》2,报警需要被确认,让运维人员知道自己报警已经有人认领并开始处理。

》3,报警方式要能够自定义,可以发邮件和短信,如果能够在IM上通知别人就更好了。

》4,报警内容要可以自行设置,在报警邮件中加入一些简单的分析,而不是让运维人员上服务器敲命令来获取基本信息。

》5,报警后可以自动跑一些命令。这些命令可以是获取需要的信息,也可以是自动修复,比如重启服务等。

3,和其他系统协同工作

》1,有强大的API可以使用,可以让其他系统调用完成工作。

》2,监控数据是开放的,数据库中的数据结构不要太复杂,让人无从下手。

》3,监控可视化的图可以方便的引用,二不是要一大串javascript

推荐阅读:

新安装windows10系统个人自定义设置

我取消了对你的微信置顶 

友情链接

阅读: 778
在同意共创许可协议(CC BY-NC-SA-4.0)的前提下,您可以转载本文。
付生保个人博客
https://shengbao.org/730.html

相关阅读

留言评论

暂无留言