# o: N% y, Z/ O' X3 l+ ?8 Z
6 M7 j& `0 E, V/ j5 I5 ^ 说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
. R! ^ n) ~8 [% k. Z ; Q: A* l7 [% h
尊敬的用户:
% c$ H! h9 f c; e
0 ^1 j ^$ i1 ]1 f3 r 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:( g& P8 [0 P) N1 G( }3 Y- {$ _* E
6 |. G* {5 S4 r9 r5 D. T& n: B 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
" x: R1 W* O+ B. D' _, y! M
+ B5 N, k6 Q3 Z/ o+ P. t 14:08,操作切换DNS以恢复官网及控制台;
: ?* b1 g6 K8 Y; r& I: q$ a1 | & e( p% k7 U3 N0 e4 w( I5 `
14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;
" c( h) ^ h% t+ {# i
: P# r+ ]( u: g 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
. N' }1 x) q" f8 E8 ^ P9 F ( b6 P) h8 x$ ~ Y# J
15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;1 v4 G* N, U" @* l% U4 Q
! |( I, m( b" V- Z7 ?9 x; y# w* P4 H
16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
( k: U0 e, X: D. A 6 \/ e; l$ _: T, w3 H9 c
本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
! @1 q& s! d: V( v; C: y 2 p1 T" }6 g- N& f, d1 Z
针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。7 H7 e! V8 X7 s- ~% F
8 o. ?& e, [+ \+ v1 x 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
% S' }6 o% w5 B$ s' P
8 E8 v: s5 t) b/ o 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明$ @7 @" G! u- x$ U* D2 g
O$ Z: k- S0 |
青云QingCloud 复制代码 % V& V @5 V* _
. K# T' l1 T o
认认真真做事。。必定能成功
9 d: _' v; Y% m' J. y- Z
相关帖子