机房维保方案如何拟定?主要包括哪些内容?很多朋友都有这样的疑问,一直以来,基本上每天都有不少朋友在留言关于维保相关的问题,机房维保项目也是弱电最频繁的项目之一,在我们弱电VIP群中,关于维保的方案也是经常有不少项目经理问起。
一、项目情况
机房是重要基础设施,服务网网络系统和服务器系统的维护由如下几个部分组成:
1、网络设备和服务器维护管理:交换机、路由器、服务器、无线网络设备;
2、机房环境维护管理:机房环境卫生、天花板、地板、机柜等、防火门等;
3、网络安全设备维护管理:防火墙、网路安全监测设备、不间断电源;
4、图文、文本、数据维护管理:浙江水利科技服务网内容更新;
5、例行巡检要求:对巡检异常均在故障处理系统上报障
二、维护管理目标
通过专业化、规范化管理,有效改善网络系统性能,增强系统的安全性、可靠性和可维护性;延长系统设备的使用寿命,降低系统的故障率和维护成本;使用户更加熟练操作设备,提高设备利用率;
1、确保浙江水利科技服务网正常运作,通过对机房环境设备定期检测、网络系统和服务器的定期维护保养,保障机房各设备运行稳定,延长设备生命周期,降低故障率。
2、确保设备在突发事故,影响浙江水利科技服务网正常运作情况下,可及时得到设备生产厂家或供应商的产品维修和技术支持,并快速解决故障。
3、对机房进行科学合理的系统扩容和升级规划及跟踪、预测,从而保证系统能够满足不断增长的应用需要。
三、维护管理原则
1、专业化管理
我公司成立由网络工程师、弱电工程师、等各类不同专业认证工程师组成的服务小组,针对不同的专业进行维护管理,恪守其职。由系统工程师负责整个管理服务过程的控制、协调、监督和管理。同时,公司的技术专家组为该项目组成员提供进阶技术支持,实现专业化管理。
2、规范化、标准化管理
在维护过程中,始终坚持规范化、标准化的原则,依次遵循国家标准、行业标准、企业标准、公司制定的维护标准。其中,在同一级别的标准中,依次遵循强制性标准、推荐性标准。
3、及时性原则
及时性包括三点:及时发现问题、及时解决问题和及时详细记录问题。
4、优化系统
通过对每日记录的数据进行分类归纳,形成统一的数据库。在这些数据的基础上,进一步分析数据,对系统优化调整,使系统日趋完善。
5、优质服务
服务态度诚恳,热情地帮助用户解决问题,并详细解答用户的疑问。同时,根据需要,对用户进行适当的培训。
四、维护管理的方法与手段
对水利科技服务网系统维护管理,我们采用如下基本维护管理模式,如图1所示:
基本维护管理模式 图1
我们采用多种维护管理方法和手段,使系统日趋完善,逐步优化,并达到最佳运行状态。
1、定期与不定期检查
针对不同的设备,建立不同的周期性维护制度。针对每一设备在系统中的重要性,其所制定的维护周期也不同,如路由器、核心交换机、UPS电源等将每天维护。
2、详细分类事件
通过对设备详细分类,每一设备建立事件库。同时,每一设备又有详细的事件分类。
3、集中式管理
在多人维护一系统时,容易造成资料、文档的不统一,一个人手中的资料并不一定是最新的版本。这样会给维护带来困难。因此,我们对系统采取集中式管理,各类数据进行分类归纳后,统一入库,使得系统易于维护,易于管理。
4、应急预案
保证一个系统稳定运行,其应急预案是必不可少的。我们根据以往维护的经验和该系统的特点,制定应急预案,使系统故障后,能在最短的时间内恢复使用。
5、质量控制
公司质检部门定期对维护质量作一次评估,提出分析报告和改进意见。如用户投诉维护质量,公司将成立由质检部门、本项目的项目经理、公司领导组成的质量事故处理小组,全力以赴解决质量问题,并及时改善维护质量。做到问题早发现,早解决。
公司的专家组成员和维护工程师,将定期对系统的工作性能、运行状况等进行评估,结合系统信息库的数据,对系统提出优化意见。
6、信息化管理
在长时间的维护过程中,必然会积累大量的数据,往往有时候查找数据花费大量的时间。因此,我们对系统的维护采取信息化管理,使这些数据电子化,建立数据库,方便查询,节约维护时间。其中数据库将包含设备电子档案、事件记录、运行状态、突发事件记录、常见故障、维护技巧等多种数据库。
通过对数据的分析,编写适合本系统的维护管理软件。由我们系统工程师和专业维护人员编写的维护管理软件,将更加专业化,更加适合该系统的维护管理。
五、维护管理及清单
浙江水利科技服务网网络系统,包括如下设备:
1、网络设备
1、机房装修环境及设施维护管理机房环境清洁
机房是浙江水利科技服务网的数据和网络管理中心,良好的机房管理和安全保障,将为高性能计算机系统提供稳定、可靠的工作环境。机房于2006年开始投入使用,需要定期检修和保养、除尘及清洁,例如天花板、地板、机柜等、防火门等;对天花板、地板、机柜等、防火门损耗部分进行修复,破损严重的需及时更换。
2、网络安全设备维护管理
现机房网络安全设备包括防火墙1台、网络安全监测设备2台、不间断电源系统1套。
在维护期间主要检测防火墙和网络安全监测设备运行日志,定期更新网络安全设备固件,清理设备组件和设备外部卫生,及时发现设备运行中存在的错误和隐患,迅速排出故障,保证设备处于稳定运行状态,对于UPS的系统及蓄电池的运行状况、容量、安全性等进行1年4次的定期检测、保养、可预防性对设备进行维修,包括硬件设备的检查、清尘、调整和坏件更换。运行环境检查(如温度、湿度、电池容量、电池老化程度),如发现问题尽早采取措施,排除故障隐患和安全漏洞,及时修复或更换。
机房现有网络安全设备清单如下:
3、图文、文本、数据维护管理
在维护期间主要负责浙江水利科技服务网内容更新,提供网站数据维护服务,保障网站系统正常运行,做好系统和数据备份,如网站系统数据损坏应在24小时修复。
4、例行巡检要求
1)机房的定期巡检(每周一次),以保障设备运行正常并整理巡检结果;
2)按已定制的巡检内容巡检机房各配套设备;
3)定时填写巡检结果;
5、配套应用计算机及其它设备
含系统配套计算机、打印、扫描、传真机。
六、维护管理内容
浙江水利科技服务网网络系统中运行的各种设备,分为可维护型和不可维护型。两者的共性是对运行环境都有一定的要求,需要日常保养。不同之处是,可维护型设备可以查看设备运行状态的数据,可设置参数,能根据这些数据,检查设备故障、排除设备故障;不可维护型的设备,只能在日常使用保养设备,延长其使用寿命。
文档资料管理是网络系统管理最重要的内容,也是维护系统的根据。文档资料管理是根据设备的随机资料、设备运行环境、商家联系资料和日常维护形成的数据,形成的设备维护资料。通过信息化管理,对每一设备建立数据库,与该设备有关的所有资料经过简化后,重要部分登记入库。
所有设备的保养都必须依照设备的要求和标准。设备的日常使用和维护,必须依照设备出厂家的要求。像计算机场地、机房,必须依照有关标准。
各设备根据需要,一周或者两周必须做一次卫生工作;计算机场地的卫生,每一个月除尘一次;视频显示设备的表面,可根据需要,去除表面污渍。所有这些维护工具都有一定的要求,符合质量要求。
每天记录计算机场地和机房的环境参数,如温度、湿度。部分不太常用的设备,在潮湿的天气,必须定期开机维护。
不可维护型的设备主要依据这些设备保养方法来维护。
可维护型设备主要集中在网络设备上,如路由器、交换机可查看大部分的参数。
1)、设备维护
a、当设备配置改动时,严格由网络专业技术人员及设备配置;
b、每月备份系统配置,并查看Flash、NVRAM、内存里的内容;
c、每日查看各端口状态、电源状态;
d、每日查看端口的数据包转发状态,如错误包的数量等;
e、定期测试设备电源;
f、定期检查设备散热系统;
g、定期检测设备性能;
2)网络拓扑管理与QOS
根据安全要求和功能区的变化,及时调整网络拓扑。对网络流量进行监测与管理。设置优先级,首先满足视频数据的高质量传输。
对这些变动,做详细记录。
1)定期检查、及时排除布线系统的线路干扰源,提高网络运行速度。使用fluke或cable tester工具,定期检测网线质量,确保网络可靠运行。
2)做好配线间、设备间设备的布局记录。标明物理布线的拓扑图表、线缆类型与长度、墙板与跳线面板的物理位置;对网线编号。
3)定期做物理链路测试。主要检查线路是否通畅;运行参数是否符合要求;线路环境与周边电磁场干扰情况。
1) 网页文字、图片进行修改以及企业新闻内容每天都能更新,不改 动网站的原来结构和网页模板。信息应随着需求情况及时予以更新,固定检查周期为一天两次。
2) 如需要修改Flash,请提供Flash源文件。
3) 域名和虚拟主机空间维护。
4) 包括文章撰写、页面设计、图形设计、广告设计等服务内容,把 企业的现有状况及时地在网站上反映出来,以便让客户和合作伙伴及时了解到最新动态,管理员也可以及时得到相应的反馈信息,以便做出及时合理的处理。
病毒和网络攻击的防护,将在安全管理部分描述。
定期整理磁盘碎片;
定期清除垃圾文件;
定期对系统做备份,系统软件故障时,能在短时间内恢复。
定期备份注册表,并清理垃圾注册表内容;
及时卸载游戏软件,清除垃圾网页;
定期查看系统状态,优化系统设备;
定期查看应用程序日志和系统日志;
定期查看网络设备;
提供计算机日常使用注意事项;
定期更新系统补丁,如有重大更新,则立即更新系统补丁。
网络安全管理是一项系统工程。在没有防火墙、入侵检测系统、网管软件的情况,我们通过安全设置、病毒防护、网络监控、安全扫描、应急预案等多方面的有机组合,保障网络系统的安全运行。
1)安全设置
局域网:
使用抓包软件,监视网络动态,掌握网络运行数据;
交换机接入端口作用户工作站mac地址限制,并作记录;
根据网络安全和不同的功能区,合理划分用户的vlan;
为每台设备设置访问口令,并定期检查口令更改情况;
设置访问列表,确认访问用户权限级别;
广域网:
与网络供应商配合做好网络配置工作;
系统设置变更时,通过协商与测试,与远端用户共同做好配置调整;
严禁随意存放关键性网络设备的口令,索要口令须经主管批准。
2)病毒防护
针对目前网络中病毒泛滥,时常导致网络瘫痪的严重问题,本方案通过建立全面的多层次网络防病毒体系,合理调整网络结构,对网络实施不间断的侦测扫描,定期和不定期对个人PC机、服务器、网关进行病毒检测和消除,以保障网络安全运行。
定期更新病毒库,如有重大更新,则立即更新病毒库。
建立病毒处理数据库,提供最新病毒动态,并有相关的处理方法。及时解决在网络中传播的病毒,并更新漏洞。
3)网络入侵检测
查看设备配置,是否有人为的变动;
查看端口数据包状态,是否有异常数据包;
查看端口指示灯,是否有端口异常;
通过抓包软件,查看是否存在主动攻击的数据包和被动攻击的数据库。
4)网络安全扫描
采用安全漏洞扫描技术,了解网络的安全配置,探测网络安全漏洞,进行定期网络安全评估与安全加固,调整配置,防范黑客攻击。
5)应急预案
制定应急预案,能在最短的时间内,恢复系统使用。
UPS供电系统的管理工作主要有:
每天检查主机工作状态;
定期测试电源插座;
定期保养UPS电池;
定期检修电源控制柜;
定期记录机房环境参数;
定期检查电源接地及防浪涌装置;
根据检查测试结果采取相应的保障措施,确保UPS不间断电源系统正常工作。
停电后,检查UPS供电系统是否正常运行,并检查系统相关部分是否运行正常。
做好易耗品、电脑配件的登入和登出管理,详细记录这些配件的状态。
各设备建立单独的日志库;
突发事件记录;
系统整体维护日志。
定期对系统进行测试,并形成测试报告。
七、维护管理方式
1、日常维护
维护工程师根据本方案和管理细则进行日常的例行维护,及时响应用户要求。
2、非常维护
在非常期间,可根据需要提供全天24小时不间断维护服务。
3、项目环境调查
调查与服务项目有关政策法律信息,当地政府的相关政策,对我公司的业务有何有利和不利的影响。服务项目内容以及网络系统的规模结构和它的发展趋势的调查,以便制定维护和解决方案。
4、 客户需求调查
通过市场调查,对客户进行市场定位。提供专业的服务项目,调查单位对这个项目的了解和需求程度,需求量有多大,有无其他人或公司提供相同的服务。
客户需求趋势调查。了解客户对服务项目的长期需求态势,了解该服务项目是逐渐被客户认同和接受,还是逐渐被客户淘汰,需求萎缩。了解该服务项目从技术方面的发展趋势。
5、客户情况调查
一是客户需求调查: 了解客户对服务的目标是什么,最终达到何种预期。
二是客户的的基本资料: 应了解这些单位的基本状况,如电话、办公地址,业务负责人具体情况和授权范围,对服务项目的需求程度。
6、竞争对手调查
“知己知彼,方能百战不殆”,了解竞争对手的情况,包括竞争对手的数量与规模,分布与构成,竞争对手的优缺点及营销策略,做到心中有数,才能在激烈的市场竞争中占居有利位置,有的放矢地采取一些竞争策略,做到人无我有,人有我优,人优我更优。
7、维护方式
现场常驻维护,两名专业国家认证工程师长期入驻维护。