|
|
; Q" g! b7 w4 X+ q6 `1 t
# k& G: y) B( C! {% L' A% ^: M说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:4 D* o3 L+ C* x. [7 T
/ Y. t5 g1 U- _7 b3 c- 尊敬的用户:8 j5 s# B; v9 j. P6 t0 w; }) G
$ R7 a6 s+ A* ~; W8 ]) U" j- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
) v# w$ w& ]# c
4 \. K; W0 [+ e7 H- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;, L. J1 E! b7 L& N) d3 _
2 S5 d7 c2 D: p- 14:08,操作切换DNS以恢复官网及控制台; \0 B0 }0 S4 Z& p, M4 M* Q2 z8 C
- 3 R( |9 k/ K8 v, L1 y9 A
- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;$ C8 j5 S" q$ ^6 ^# N
& a' ~+ \7 X/ M8 T% ?- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;+ }( T! z! V4 c/ n! K& g& f p6 E
+ a) {* I9 N7 Y. l8 P5 s( ~- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;% s4 W+ X1 d6 k8 Q
- ! z% I8 o# c, j! [
- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
1 L1 u9 Z2 g! \# i0 r - " e2 L1 M. I, O% v
- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。; o4 D; U# x0 F
7 U6 ~ H: r' z! u2 E A- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
6 H9 P% V5 X. e+ K+ i9 B1 Q - 3 Y" T% |7 b. X- B5 e" Q; _
- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
2 s9 Z( t$ \2 r/ ?% ]7 m) P c - / K- }$ f( z/ Z3 Y1 R
- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明" }; n w# O! K- ]5 v' |2 D1 D5 u% I
$ C5 o {" r* {2 i5 v2 N- 青云QingCloud
复制代码
' j7 J2 n, ~6 Z: P+ v# u) G- W- e9 D
, P/ t* d5 y2 c5 j" v7 I认认真真做事。。必定能成功; g8 j9 E' t& U3 ~: f
|
|