1、备份的意义
1)保护数据,避免因为各种故障而丢失数据
2、基本术语介绍
Mean Time Between Failure --MTBF
Mean Time To Repair --MTTR
Mean Time To Failure --MTTF
(1)MTBF——全称是Mean Time Between Failure,即平均故障间隔时间。
就是从新的产品在规定的工作环境条件下开始工作到出现第一个故障的时间的平均值。MTBF越长表示可靠性越高正确工作能力越强 。
(2)MTTR——全称是Mean Time To Repair,即平均恢复时间。
就是从出现故障到恢复中间的这段时间。MTTR越短表示易恢复性越好。
(3)MTTF——全称是Mean Time To Failure,即平均无故障时间。
系统平均能够正常运行多长时间,才发生一次故障。系统的可靠性越高,平均无故障时间越长。(MTBF = MTTF + MTTR)
可靠性是最初是确定一个系统在一个特定的运行时间内有效运行的概率的一个标准。可靠性的衡量需要系统在某段时间内保持正常的运行。
目前,使用最为广泛的一个衡量可靠性的参数是MTTF(mean time to failure,平均失效前时间),定义为随机变量、出错时间等的"期望值"。但是,MTTF经常被错误地理解为,"能保证的最短的生命周期"。MTTF的长短,通常与使用周期中的产品有关,其中不包括老化失效。
MTTR(mean time to restoration, 平均恢复前时间),源自于IEC 61508中的平均维护时间(mean time to repair),目的是为了清楚界定术语中的时间的概念,MTTR是随机变量恢复时间得期望值。它包括确认失效发生所必需的时间,以及维护所需要的时间。MTTR也必须包含获得配件的时间,维修团队的响应时间,记录所有任务的时间,还有将设备重新投入使用的时间。
MTBF(Mean time between failures,平均故障间隔时间)定义为,失效或维护中所需要的平均时间,包括故障时间以及检测和维护设备的时间。对于一个简单的可维护的元件,MTBF = MTTF + MTTR。因为MTTR通常远小于MTTF,所以MTBF近似等于MTTF,通常由MTTF替代。MTBF用于可 维护性和不可维护的 系统。
3、数据库故障的类型
1)statement failure
2)user process failure:pmon 自动处理
3)user errors :必须由dba通过备份恢复
4)instance failure: instance recover smon 自动处理
5)media recover:通过备份恢复
4、制定你的备份和恢复的计划
1)根据生产环境的恢复周期,制定详细的备份计划,然后严格执行
2)对备份,要在一定的时间内利用测试环境,进行故障恢复的练习
总机:(010)-88589926,88589826,88587026 QQ讨论群:243729577 182441349 邮箱:cuug_bj@cuug.com
通信地址:北京市海淀区紫竹院路98号北京化工大学科技园609室(CUUG)邮政编码:100089
中国UNIX用户协会 Copyright 2010 ALL Rights Reserved 北京神脑资讯技术有限公司
京ICP备11008061号 京公网安备110108006275号