|
|
3 ~: _* G y2 J# N& V9 X/ }
j1 y4 v: d/ i6 V3 S说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:$ R2 \& @" E5 @& z& T, C M4 j
) A2 [8 j j! w$ j5 K% {
- 尊敬的用户:
+ }9 r3 d" L1 I( ]9 j9 { - 8 k* W: T8 l7 G3 K0 J+ ?$ R: I
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:+ c$ g8 U. Y4 c( r7 } ?
- + U! k5 q$ Z; i# q7 ?3 U9 c1 c" k3 r
- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
3 d" ?5 \4 x& R* O: C$ T" N - 1 t. x, W) f0 Z: e( s: E# P, p
- 14:08,操作切换DNS以恢复官网及控制台;
1 n* n) w9 q2 }3 c
+ O7 S# o: K: @' n$ K. D' {8 h- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;
\, h. t& r! i1 n5 ^; c ^
* Y! R9 Z. C: U P7 ?- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
8 r u: n6 ?( S9 y) S6 u3 q& N
0 k) D2 ^* X: _" |7 z4 ]' Q- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;
' o8 _1 C6 I5 T" F! e
; g1 D/ S7 D: g4 w3 a. r: d- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。* x, x0 `( q( v' X& C E
- - d8 A: ] t1 x, U
- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。- x1 ~; t! A% R: o4 j8 g
- 3 [* h g+ _' q$ Q* r' X D( g* c
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
3 a$ v- K; W; X7 c& c% {$ g
' {' ?: V9 l) ^( P' P& G3 c- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
8 V& p) q( Z2 T5 O- z. ? - 9 B# l0 t9 H4 j/ n" n2 _* ?. z ]
- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明' `; H# H8 u0 O6 P! _, Q& i
- ' Z5 ~' I6 D* G% N) V' S
- 青云QingCloud
复制代码
! W2 u Z' g) U. H5 ^/ H* D a9 P5 h3 i% {
" Z, Q$ t, q, I7 Y认认真真做事。。必定能成功4 N+ L' y z3 n# u2 p6 W, O
|
|