|
' A3 a7 ]3 b9 q0 [+ c' t
; i" M4 n" e: A% u6 R7 N说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
" O! C3 u! r3 b$ y+ Z. v0 r
- O! s; ?# R$ ]& Q' L: e- 尊敬的用户:
: J& L) e, ] K - ) r8 p5 a! v8 \' ?2 a5 b; R
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
( b' W1 \! V% V* I
5 E% _3 f" t" Q" N9 ~2 x0 v- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;" Z3 q3 e6 _$ u' G# l! M7 A) e
4 O5 g9 [, u% }- 14:08,操作切换DNS以恢复官网及控制台;/ \& z% \( w) O. B- V
. L" z4 c8 d. }) |- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;" { |, T/ {5 Q1 x6 c8 o( f* P/ b
% g, i8 u$ L! j- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;( U3 |2 s4 }4 _: n4 ?
- + O9 {. X* P/ F) I$ ]
- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;1 ]* A6 L+ a9 \, {' U
' E; U: U8 d# O- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
% ]" {/ z6 {" C% J3 k - , }; W9 c5 [+ I; M, |, e
- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
! ?8 Y" F7 O# h - & r1 t. R2 ]. @: i( t3 R7 V
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
5 r9 j# l4 `3 n/ L3 H! S* \2 g
: D; K+ R0 j- n# |3 P+ R4 A2 `- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。4 [" I3 D9 {4 f# ^
- 2 z$ f0 z, C+ t* _9 i: u6 p
- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明
' H' q6 }5 F/ v. ?1 d | - b$ `) N- P ]( X
- 青云QingCloud
复制代码
6 I; O5 r H$ R' g c4 p. K3 a# a8 A% _3 k% g; N5 g
认认真真做事。。必定能成功4 A) r6 U3 M( _/ x! b4 x8 F9 c
|
|