一、网络监控 (可分别在AP和DB服务器上)
1、 从各个外点使用 ping 命令判断网络的连通性。
在数据库服务器和应用服务器正常运行时,在各个外点的Windows客户端分别键入以下命令:
l ping 192.168.0.135 –n 300 –L 1024
说明如下:
l 如果一台服务器 ping 不通,请改 ping 另外一台服务器,如果两台服务器都 ping 不通,则很可能是网络
l 两条命令的作用不尽相同,发送到服务器的数据包大小不同,用于简单测试在不同网络需求的响应
l 可以从 ping 的返回结果,看到丢包率,看到网络稳定状况(平均值Average 越接近最小值 Minimum 则网络越稳定)
C:\>ping 192.168.0.135 -n 300 -l 1024
……………………
Ping statistics for 192.168.0.135:
Packets: Sent = 300, Received = 300, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 3ms, Maximum = 13ms, Average = 3ms
从这个结果可以看到,发送1024字节的数据包的测试,丢包率为零,响应时间平均为3毫秒,最小为3毫秒。
二、数据库监控(在DB服务器上)
1、数据库启动状态
以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):
$ ps -ef | grep ora_
2、数据库监听服务状态
以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):
$ lsnrctl status
说明如下:
客户端访问 Oracle 数据库必须通过监听服务,故此如果监听服务没有启动,则直接影响易拓系统的运行。
启动监听服务的命令为:
$ lsnrctl start
3、数据库连接状态
以 oracle 身份登录系统,输入以下命令 ( “$” 表示系统提示符):
$ sqlplus ds/ds_password@topprod
说明如下:
此命令为通过网络服务登录到 Oracle 数据库,如果用户名和密码正确的情况下不能登录到系统,则说明无法通过网络服务方式登录到数据库,易拓系统无法运行。
4、查看数据库运行日志
以 oracle 身份登录系统,输入以下命令 (“$” 表示系统提示符):
$ vi /u2/oracle/9i/network/log/listener.log
$ > /u2/oracle/9i/network/log/listener.log ( 清空日志 )
$ vi /u2/oradb/admin/topprod/bdump/alert_topprod.log
$ > /u2/oradb/admin/topprod/bdump/alert_topprod.log ( 清空日志 )
5、查看数据库表空间使用情况
以 tiptop 身份登录系统
$ oraq q_tbsFREE ( 根据提示输入system密码)
6、查看数据库表被锁情况情况
$ oraq q_locktables ( 根据提示输入system密码)
三、操作系统监控
1、确认计划任务服务是否已经启动
以 root 身份登录到系统,检查 crond 服务是否已经在运行
# service crond status
说明:如果 crond 服务没有启动,则每天的自动备份无法调度。
2、查看各文件系统的使用情况
# df –h
说明:保证各个关键的文件系统有足够支持运行的空间,如/,/data,/u1,/u2,/backup,/tmp,/repout 等等。
3、查看报表输出目录使用情况
在 Application Server 上输入以下命令:
cd /repout
du –sh
说明:若发现此目录占用的空间超过2GB, 请先备份目录的内容,再使用rm 命令清空目录,否则会影响程序运行过程中的报表的产生。
4、系统性能
使用top命令查看系统资源使用情况,对长时间占用CPU资源较高的进程,要找出原因,及时清除占用资源较高的死进程,确保系统运行顺畅。
5、检查系统日志和目录使用情况,命令如下:
# vi /var/log/messages —可查看系统运行日志
# cd /var
# du -sh log clientmqueue —查看目录使用情况
对于log目录下文件要做好备份再使用下面命令清空文件
# > 文件名
如:# > messages
对于clientmqueue目录下文件可使用rm删除即可
四、系统备份检查
1、检查前一天的备份是否成功
查看硬盘备份的目录
/backup/exp 每天定时备份的数据库
/backup/source 每天定时备份的程序
说明:数据库备份和程序备份一般是每天一次,并会在备份的文件名后面加上日期的描述,如 Mon, Tue 等等,故此备份会保留7天。
查看磁带备份情况
tar tvf /dev/st0
2、检查关键用户的计划任务设置
分别使用 root 和 oracle 身份登录系统,输入以下命令:
$ crontab –l
说明:可以从这里看到这些用户的计划任务设置,root 用户应该有backup_source.sh 的命令,而 oracle 用户应该有 backup_db.sh 的命令,如果缺了这两个命令,则无法时间定时备份。
转载请注明:赫非域 » Tiptop系统日常监控维护