在维护服务器的时候一定要小心处理好维护的工作,否则出现错误的话就会影响很大。
软件维护
一、数据库服务
数据库经过长期的运行,需要调整数据库性能,使之进入最优化状态。数据库中的数据是最重要的,这些数据库如果丢失,损失是巨大的,因此需要定期来备份数据库,以防万一。
二、操作系统的维护
操作系统是服务器运行的软件基础,其重要性不言自明。多数服务器操作系统使用Windows 2003或Windows 2008 Server作为操作系统,维护起来还是比较容易的。
在Windows NT或Windows 2003 Server打开事件查看器,在系统日志、安全日志和应用程序日志中查看有没有特别异常的记录。现在网上的黑客越来越多了,因此需要到微软的网站上下载最新的Service Pack(升级服务包)安装上,将安全漏洞及时补上。
三、用户数据
经过频繁使用,服务器可能存放了大量的数据。这些数据是非常宝贵的资源,所以需要加以整理,并刻成光盘永久保存起来,即使服务器有故障,也能恢复数据。
四、网络服务的维护
网络服务有很多,如WWW服务、DNS服务、DHCP服务、SMTP服务、FTP服务等,随着服务器提供的服务越来越多,系统也容易混乱,此时可能需要重新设定各个服务的参数,使之正常运行。
硬件维护
一、除尘
尘土是服务器最大的杀手,因此需要定期给服务器除尘。对于服务器来说,灰尘甚至是致命的。除尘方法与普通PC除尘方法相同,尤其要注意的是电源的除尘。
二、储存设备的扩充
当资源不断扩展的时候,服务器就需要更多的内存和硬盘容量来储存这些资源。所以,内存和硬盘的扩充是很常见的。增加内存前需要认定与服务器原有的内存的兼容性,最好是同一品牌同一规格的内存。如果是服务器专用的ECC内存,则必须选用相同的内存,普通的SDRAM内存与ECC内存在同一台服务器上使用很可能会引起统严重出错。在增加硬盘以前,需要认定服务器是否有空余的硬盘支架、硬盘接口和电源接口,还有主板是否支持这种容量的硬盘。尤其需要注意,防止买来了设备却无法使用。
三、设备的卸载和更换
卸载和更换设备时的问题不大,需要注意的是有许多品牌服务器机箱的设计比较特殊,需要特殊的工具或机关才能打开,在卸机箱盖的时候,需要仔细看说明书,不要强行拆卸。另外,必须在完全断电、服务器接地良好的情况下进行,即使是支持热插拔的设备也是如此,以防止静电对设备造成损坏。
个人工作经验:日常维护的作用在于
(1)知道服务器本身运行情况,保证公司业务顺畅;
(2)在服务器出现异常情况后,从容不迫,胸有成竹。那么,需要做到:
一、针对服务器本身:
a.在官网找到对应型号服务器的页面,下载user guides跟problem determination,过一遍,基础的硬件知识你要懂,比方说这台服务器硬件是如何模块化的,单位里用的IBM x3850,我会去了解它的cpu跟内存模块如何对应,各面板灯的作用,跳线... ...在故障灯亮灯后(突然断电),你起码知道如何定位故障。总之,把user guide跟problem determination这两本pdf过一遍。(这两本书是服务器硬件日常维护基础,不会让你成为专家)
b.这台服务器的业务是提供进存销功能并入库,那么,这个进存销的帮助文档你看懂了吗?如果这个软件崩溃了,你要知道错误码记录位置。了解windows server 2003,按需要开系统日志,一样能记录服务器断电、应用软件崩溃返回码等。然后是数据库,微软的sqlserver2005,了解数据库技术,学会基本的sql查询语句,如果有进存销软件写库或读库出错的情况,排除应用问题后,你要会看数据库的报错。
c.了解备份防灾的知识,保存好你的数据(学会自己写脚本备份数据库吧,然后想办法定期把数据拷贝出来)。
d.硬盘的配置是如何做raid的,硬盘故障后该如何更换。
二、服务器运行依托的环境:
a.服务器网络,服务器用了几块网卡,它的配置是什么,网关、掩码你造吗?服务器如何网络布线的,有做标签吗?如果服务器硬件跟软件运行正常,只是网络断了,你知道如何定位吗?网关是什么路由?思科orH3C,配置你备份了吗?如果是网关出问题了,你该如何处理?有方案准备吗?
b.服务器供电,是UPS供电还是市电直供,会用万用表量电位差吗?电源异常可是会导致服务器宕机的。
懂这些不一定能让你在服务器故障时彻底恢复,但绝对能让你增值,如果不想在服务器故障时束手无策,做好应急准备。