|
|
0 T- \) p% l' K p1 b6 D2 ~2 }2 W
5 P8 s; a7 R; |说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:3 x0 _& y7 F8 d8 A) J! |- t
% u. Z3 O0 P. y
- 尊敬的用户:
% i4 y0 u9 E5 O2 m' d8 { - / |- L" ~* D3 t! t
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
& ?% V9 x o- E$ H9 Z - + G( c& X* }* ?9 ]; ^) u9 A* Y* W
- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
6 S4 C4 F7 u* G* U$ Q. f5 c
: m% j4 q8 |) V# X# q, P- 14:08,操作切换DNS以恢复官网及控制台;
7 Z) b5 h' R/ A' N0 d
4 I, k& N) |" q, n2 q- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;& `' H) f3 A9 U9 u! O; _
) j( ~3 n7 A1 O% X* j. f2 B- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
# c8 L' a, V+ v9 I' K' D8 P/ N- d. w
6 ?8 ?" M" H* p# W- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;. r- S+ Y! w: } b4 }, M
3 h, [/ C( k: S% A: R/ g- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
1 Q$ ~6 S; }, a9 M8 _
3 ^9 ]- d) e( x- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
/ |6 Y9 U# h4 t) c: }8 n
' k7 B& v% l* s5 ]- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
7 @( J* r( A6 X - " m0 Y3 W. v5 `5 T" J
- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。7 v2 y5 [( T" H, O7 P1 _8 m+ u( C
. G6 p8 W* u9 d% r+ l, t. M- W$ {: c- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明8 ]+ K- C) ]) c( i- K
) Z0 E7 y3 Q2 q* [/ ^; G9 Y- 青云QingCloud
复制代码
& _& i& n# _1 S, i" o3 a. C8 g% [: M) Y5 q- A! g8 i T, J4 F
认认真真做事。。必定能成功
3 B2 V8 b" k' I; o) U |
|