你有准备灾难发生吗?
「九一一」美国世贸袭击事件发生后,除了有美国英雄和妖魔化的恐怖份子外,不少信息业内外人士,还想到服务器、个人计算机和所有文件都一次过灰飞烟灭后,应如何才能恢复正常工作,特别是现代化企业非常重视以数据库协助处理业务,一下子系统和备份都失去了,那恐怕是另一个灾难。
虽不算「临急抱佛脚」,但大灾难马上令人联想到如何处理这种情况,因此信息系统的灾难复原(Disaster
Recovery)处理,就突成为最热门的课题。无论是CNN抑或本地的计算机杂志都在分析研究,并介绍各种方案。早前台湾更已经开始提出各种安排,并非先知先觉,而是因为近来台湾真可称得上祸不单行,不但屡遭风灾打击,更受祝融之祸,不少信息科技公司,包括Acer和Seed
net所在的东方科学园就因为大火而破坏了其中两座,不少公司更遭遇严重破坏,而事后证明,不少公司根本完全没有考虑危机处理,大部份的系统备份都放置在同一地点,系统和后备一并被毁,许多公司的信息部门根本不知道该如何重建系统,时间和人力的耗损更为惨重。
作为有规模的机构定然需要有完整和清晰的危机处理和程序,从最平常的停电、不同程度的系统损毁以至于像火灾,甚至和整个地区有关的严重天灾等等,虽然不可能说可以兼顾所有情况,但从损毁程度来策划及处理,是不可轻忽的,更进一步来说,甚至应该根据不同系统的重要性,再评定出各种处理方法。信息系统的危机处理(Contingency
Planning)及灾难复原可以分成下列几种:
1.与日常生产及运作息息相关的关键性系统(Mission
Critical)。例如股票交易系统甚至航空控制等,未经预先计划的停顿可能引致灾难性结果,一般来说不但系统本身拥有高度自动复原能力(High
Availability),系统出现故障时可以迅速继续运作,并且通常会在另一个区域内有全面的后备系统(Replicating
System),而数据会不停更新常规和后备系统,确保出现问题时能迅速地转由遥距的后备系统继续保持不间断的运作。
2.部分机构的重心系统,也会采用类似的架构,但限于同时保持两套遥距系统同步运作不但技术难度高,系统高昂,而通讯和保安也是大难题,折衷方法是容许常规和后备系统有时限上的差异(最常见的情况是24小时),数据不一定能完全同步,后备系统需要若干时间才能上线运作,但一般情况下是足够应用的。有时候配合应用系统增加额外的操作记录(Operating
Log),也能加快备用系统上线。
3.再退一步是在另一地区设立规模较小但架构相同的系统,用离线方法,例如数码磁带复制常规系统后再注入后备内,这种方法执行上其实与离线备份无异,但好处是毋须在紧急时再为寻找后备计算机和设定系统费心,特别是较复杂和专用服务器的系统设置需时,能预先准备可以减少麻烦。
4.最基本的灾难复原当然是利用备份工具,包括数码线性磁带(DLT)、高容量的磁带、磁盘或读写光盘等等,视乎所需备份的数据量来策划。不可不提的是许多系统,特别是与数据库有关的,都有其预设的备份方法,如果没有正确执行可能得物无所用,那问题发生后却发现系统无法恢复,就更令人丧气了。因此备份系统的定期测试也是必须的,万不可以视备份为例行公事而掉以轻心,更理想的方法是定期,例如三个月或半年等作模拟复原试验。而更重要的是保存两个或以上的备份,并把其中一个储存在其它地方。
一般来说,中小企业对系统备份的处理可能觉得有心无力,觉得没有大机构这般倚靠计算机系统,又或者以为备份工作很复杂或费用很高。但实际上基本的备份设备由几千元起,而且操作程序反复如是,只要按照设定程序就可以。况且正因为中小企人力有限,出现问题后再来补救可能根本无从入手,倒不如平日定期进行,更事半功倍。至于找地方储存备份似乎很麻烦,但有时情况也并非必然的,基本的计算机常识告诉我们,其中一套备份必须和常规系统分隔存放,但却毋须考虑甚么保险库或银行保管箱,最容易的方法是把备份放在家中(当然是信得过的员工或老板自己的家中),既可靠又方便兼不费分毫。
与实质的灾祸比较,有时表面平常的情况可能为害更甚。计算机病毒就是最佳的例子。在「九一一」后的一个星期,一种被称为最有创意的新品种计算机病毒Nimda(倒写的Admin),同时采用四种不同性质的病毐,以各种手段测试入侵目标计算机,它的破坏力和影响,是历来最厉害的,面对利用计算机技术进行破坏的「恐怖份子」,这才算是真正要进行的「持久战」。