服务器两次停机
作者:刚子 日期:2010-04-05
服务器上次停机我就打算写篇文章警告自己,后来偷懒没有写,但是今天再次停机,我必须的写篇文章告诉自己,不能再犯同样的错误了。
因为服务器在国外,出问题的概率比国内服务器大一些,所以我使用了三个监控网站来监控我的网站访问状态(后来去掉了一个)。前几天的某一天,服务器发疯了似的出问题,隔几个小时停机一次,我在他停机之后重启就恢复访问,就这样持续了一天时间,晚上的时候我确认了一下网站没问题就躺下睡觉了。刚躺下监控网站的短信报警又来了,我当时认为是几个小时前的故障报警,所以没在意,继续睡觉。第二天起来发现,昨天正在床上收到的那条报警短信就是当时的访问故障,而我在收到短信后却没有起床,造成了7个多小时访问故障,不过幸亏是凌晨到早上7点,上网人数不多,庆幸。
今天出的事情和上次差不多。昨晚11点左右我去睡觉了,因为手机放在桌子感觉有点乱,所以我就顺手放抽屉里了。谁料到,尽早起床之后发现了两条未读短信,分别是两个不同的访问监控网站发来的告警短信。我马上打开电脑访问网站,确实打不开了。连接远程,卡死,赶快喊机房重启。美国机房的响应速度还算可以,应该不到10分钟吧,重启完毕。8点40左右网站恢复访问,而告警事件是23点15分,停机9小时左右,比上次还惨重。
两次事件我总结了一下以后应该注意的事情:
1.重要网站尽量都是用网站访问监控功能,而且我使用的两家都是免费的。虽然他们不能免费手机提醒,不过可以免费邮件提醒,我使用移动139的手机邮箱,收到邮件后手机也会提示,这样就实现了不花一分钱的手机提醒功能。我使用的两个免费监控网站分别是:jiankongbao.com site24x7.com ,推荐前者。
2.手机要24小时不关机,不离身,不静音。其实我从做了站长以后一直都有手机24小时不关机,不离身,不静音的习惯,因为很多时候网站的故障是出在晚上的。当然偶尔也会例外,以后尽量让这种例外减少。
3.多和关系比较好的站长沟通一下,没事儿的时候让对方打开一下你的网站,如果出现故障可以人工告之。曾经有一次我网站故障,收到了一个站长的短信+另一个站长的电话,感动ing。。。
4.如果有条件要每天进行数据备份和做好网站故障的充分准备。因为我使用了两台服务器,所以每天0点的时候我的A服务器会自动下载B服务器中某个重要网站的数据库到硬盘,这样如果那个网站出现严重故障,那我可以减少很多的数据损失。另外就是我把一个重要的网站分别建立在了两台服务器上,虽然我平时只用到一台,但是一旦服务器出现故障,我无须进行数据转移,直接去dnspod修改解析即可。(注:dnspod现在支持手机wap访问了,非常方便快捷)
5.本来第5条我写的是“暂时没想到,想到补充。”,可是就在提交这篇文章的时候半天没反应,接着是网页无法访问的提示,我问了一下旁边的人,Ta电脑也突然掉线了。我马上新建一个记事本,按下了ctrl+v,因为我在提交之前顺手ctrl+c了一下。那么第5条当然是养成ctrl+c的习惯,不然的话我码了这么多字的文章岂不是白白浪费掉了?
因为服务器在国外,出问题的概率比国内服务器大一些,所以我使用了三个监控网站来监控我的网站访问状态(后来去掉了一个)。前几天的某一天,服务器发疯了似的出问题,隔几个小时停机一次,我在他停机之后重启就恢复访问,就这样持续了一天时间,晚上的时候我确认了一下网站没问题就躺下睡觉了。刚躺下监控网站的短信报警又来了,我当时认为是几个小时前的故障报警,所以没在意,继续睡觉。第二天起来发现,昨天正在床上收到的那条报警短信就是当时的访问故障,而我在收到短信后却没有起床,造成了7个多小时访问故障,不过幸亏是凌晨到早上7点,上网人数不多,庆幸。
今天出的事情和上次差不多。昨晚11点左右我去睡觉了,因为手机放在桌子感觉有点乱,所以我就顺手放抽屉里了。谁料到,尽早起床之后发现了两条未读短信,分别是两个不同的访问监控网站发来的告警短信。我马上打开电脑访问网站,确实打不开了。连接远程,卡死,赶快喊机房重启。美国机房的响应速度还算可以,应该不到10分钟吧,重启完毕。8点40左右网站恢复访问,而告警事件是23点15分,停机9小时左右,比上次还惨重。
两次事件我总结了一下以后应该注意的事情:
1.重要网站尽量都是用网站访问监控功能,而且我使用的两家都是免费的。虽然他们不能免费手机提醒,不过可以免费邮件提醒,我使用移动139的手机邮箱,收到邮件后手机也会提示,这样就实现了不花一分钱的手机提醒功能。我使用的两个免费监控网站分别是:jiankongbao.com site24x7.com ,推荐前者。
2.手机要24小时不关机,不离身,不静音。其实我从做了站长以后一直都有手机24小时不关机,不离身,不静音的习惯,因为很多时候网站的故障是出在晚上的。当然偶尔也会例外,以后尽量让这种例外减少。
3.多和关系比较好的站长沟通一下,没事儿的时候让对方打开一下你的网站,如果出现故障可以人工告之。曾经有一次我网站故障,收到了一个站长的短信+另一个站长的电话,感动ing。。。
4.如果有条件要每天进行数据备份和做好网站故障的充分准备。因为我使用了两台服务器,所以每天0点的时候我的A服务器会自动下载B服务器中某个重要网站的数据库到硬盘,这样如果那个网站出现严重故障,那我可以减少很多的数据损失。另外就是我把一个重要的网站分别建立在了两台服务器上,虽然我平时只用到一台,但是一旦服务器出现故障,我无须进行数据转移,直接去dnspod修改解析即可。(注:dnspod现在支持手机wap访问了,非常方便快捷)
5.本来第5条我写的是“暂时没想到,想到补充。”,可是就在提交这篇文章的时候半天没反应,接着是网页无法访问的提示,我问了一下旁边的人,Ta电脑也突然掉线了。我马上新建一个记事本,按下了ctrl+v,因为我在提交之前顺手ctrl+c了一下。那么第5条当然是养成ctrl+c的习惯,不然的话我码了这么多字的文章岂不是白白浪费掉了?
评论: 0 | 引用: 0 | 查看次数: -
发表评论
上一篇
下一篇

文章来自:
Tags: