|
|
* B1 [+ M9 s( h {: L3 b0 c- x* P1 W$ e% z0 E4 P& j
说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
- a" k) J Z T$ C5 _4 p3 ~) s2 V4 v$ L4 g; [' U
- 尊敬的用户:
) l3 Z# j! ^' E! ~4 s
9 s- @& ?/ P+ x2 a0 V, I- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
; D6 c6 \* p- M$ s! e2 }3 J
0 b+ v+ P( w9 T4 S4 y- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
; e6 M5 J T1 e
8 a/ C2 F( \! J9 ]- L5 W( b- 14:08,操作切换DNS以恢复官网及控制台;
( L8 e$ u# M6 h$ V- ^ - 9 H: T9 l# I) l9 q7 {
- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;/ J6 @. X& B8 f( e+ |( a
- 5 ]( Q0 ]- o# a& O
- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
" z. Z3 ]3 F. S4 u v( i5 j7 | ^/ L - 6 X% N5 Y+ ?5 \. ?, l
- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;1 \ U; l7 M6 U7 w; t& U$ x
9 f: x, k$ k3 o+ n5 {6 [" y- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。: [& |8 z2 b9 K8 ?# M) O
- / f0 a/ Q5 O( `! N) e5 J8 V
- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
) ]1 i3 j8 ~9 D) S! P - j/ `. F$ L! n
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。& Z, x5 r* e: e1 m1 E5 ^4 ^' W
Q" q1 N1 k6 ]# p; ]; P4 _; R; D9 h: h- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。# p _' C- x2 a ~6 R
9 Y6 Y3 G* r) g$ z/ Z- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明5 D; S, h5 |2 }( p. _9 e# n
H0 S1 S0 D0 C2 Z+ p& K" Q8 `- 青云QingCloud
复制代码 6 r! z* j. I( O; T7 t; G
5 i$ }" @* J# T认认真真做事。。必定能成功
0 u6 u7 J9 \8 J |
|