% T; j$ v, y# b* U4 u: V
+ j' l: h& D$ w. T说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:$ n: m7 h' ] C
2 c* ^$ \ T$ c! \; j0 H/ V- 尊敬的用户:' p3 c8 y- b5 ~( I
- 1 c; Y& y9 f, ]
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:5 ~, O0 O& l* t8 }' D7 b) \; g% [/ l
2 H! B% J9 c) i; v/ Z2 h" C1 f1 [6 d- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;. T, H# \6 F8 K, q; |6 D' r
- & U" f, k" |0 Q9 g3 A
- 14:08,操作切换DNS以恢复官网及控制台;
6 \% N: N) w C: Z& D0 Q& ]+ L( U
: X8 w: v/ X+ I" r+ O" n- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;' p' }: k! @# L5 C0 i( Y
% F6 Z/ Y- s7 n* f m+ @6 A- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
P' }0 I5 W; i4 p) j2 @/ s2 G - & l3 ^8 l2 s0 U3 v! L6 h1 [
- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;- ~+ z1 d3 T7 `5 k8 b
# P; R2 `& m8 h0 _- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
4 y9 V/ \5 n; c5 h8 `
F; e, O; r* ?' [# C4 S- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
# S# D! j$ W7 ^! Q' s/ ^! Q- g, @
- w7 f5 K1 P/ o, J- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
0 s% V" D3 ~0 b! {! b1 P* F, @7 L
' K5 b* g0 J! P- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
' O1 M( V1 ]: @$ V; X( l2 b9 V - & U, k6 O7 e1 O* r" B( M
- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明, w# T2 |: }2 [
7 k- x, ]( e6 l" w; p- 青云QingCloud
复制代码
# x. g2 Z$ e! L
) n9 B3 `5 `+ `' Y: z% C认认真真做事。。必定能成功
+ s2 s8 D' Y, O9 z9 W5 d, O |