文本内容:
服务器故障解决实例电脑资料 我们有一台SunE250服务器,主要用作用, 在系统运行时亮表示检测到系统错误(任何可能的错误)那个温度计一样的LED指示灯亮表示系统温度过高 知道了LED指示灯带给我们的错误信息以后,我们就开始从机房的环境温度、操作系统故障这两方面来着手解决问题 机房环境温度 我们机房是采用中央空调和独立空调两套空调系统,可以有效的保证室内的环境温度,即使在夏天最热的时候,也可以将温度调节到二十度左右,而且和这台服器并排放在一齐的还有两台同型号的服务器,它们就没有温度过高的告警 操作系统故障 通过查看/var/adm下的messages文件,发现确实有温度过高的日志记录 Aug3119:17:18nsunix:WARNING:TEMPERATUREWARNING:63degreescel siusatlocationCPU0Aug3119:23:33nsunix:NOTICE:TEMPERATURENOR MAL:allsensorsbacktonormalreadings 再查看/var/log目录下的syslog文件,发现有大量重复的告警信息出现,如下 Aug3114:35:45nssendmail
[19588]:NOQUEUE:[
202.
112.
174.17]didn otissueMAIL/EXPN/VRFY/ETRNduringconnectiontoMTA 由此可以基本上判断出是由于这个主机被当作了垃圾邮件的转发器,被某些恶意主机大量利用sendmail程序发送邮件造成了系统负担过重(我们的邮件服务器(同样是是Solaris操作系统,已经利用增加SMTP认证功能有效的杜绝了垃圾邮件的转发,但是这台服务器默认启动了sendmail邮件服务,但是又没有实现SMTP认证功能, 第一步,利用ps-ef|grepsendmail查出sendmail的进程号,再用kill 进程号命令杀掉sendmail进程 第二步,不让sendmail进程随系统启动自动启动,用以下命令实现 cd/etc/rc
2.dmvS88sendmails88sendmail 以上两步完成后,再去服务器那儿一看,告警指示灯就不亮了,经过了近一个星期的观察,...。