|
+ x, q4 p+ m7 |! V5 P6 f) p
6 }" Z0 r7 v3 {' O说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:! P: Z; B3 k$ R) K: Z) {5 e* O( F
. R1 V# o/ W+ I% U, |
- 尊敬的用户:1 ?. r) {$ W; b8 {* V3 M4 T
- " g: k9 s) G- y0 Q+ _
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:9 q- g; U! H9 z) g- P% N
) E! `6 v9 p* O9 y" t& U1 S- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;% _+ X* K5 P; e! P9 w1 Z6 }
, o& {& E/ z5 k: n- 14:08,操作切换DNS以恢复官网及控制台;1 e3 U, {. p+ y" P+ X
4 t0 q6 k& o8 m& L9 @- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;
2 A# D0 W- @$ v
* ]% ?% ?) G9 q+ ~- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;( _+ z6 k5 t- L$ A) u8 j/ d
5 s3 n( I% ?# S6 H6 }" A; R- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;+ C+ ]# q& `1 f# g
- 6 B8 k3 `& I8 x1 d
- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。& h; Z: {3 O' T: X' q
) K: F# I' i1 X- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。: o A3 C$ T0 X) D d m
- " p W* o! G- R5 R# |
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。& v5 M3 {# ]& r& B6 M
( w' X0 D( T! R- @+ j- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
/ A: s: e' l' b9 ?
/ R" E& u/ s$ |& L% u5 W- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明
9 n% @8 _" O1 e - + V% G* @( s- V, n! G( J" U, l. I: X
- 青云QingCloud
复制代码
% k5 M3 X9 a6 _. W0 ^' U+ H& Y+ @8 ?! C& M. `9 f7 z: e
认认真真做事。。必定能成功8 V- Y5 h, P( b+ v+ Z5 B, r
|
|