. o/ ^3 g) E+ r" H- {0 V3 q , B" p# ~5 D1 }$ v1 [
说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
+ _" j" H& _6 I+ i' |3 P
5 l* ~ J X/ d. {7 Z 尊敬的用户:1 @' d, r Y2 B( M- c
/ W$ ^2 d& s' I4 r# \9 P+ g; ` v6 L 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
+ c8 A ~% L' p: A/ i9 w1 j% t
0 Q$ R( b7 J- @; `7 I5 K 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;, \4 N( o3 l3 N1 v5 x. |
( R2 k" w$ I# L! w3 [8 w; B/ { 14:08,操作切换DNS以恢复官网及控制台;
& g4 T* b7 X* a. e2 h. m % X6 B2 ^8 L% e4 H# T
14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;$ Q9 e% \) o% h6 I& m7 d6 F' F
, E9 ]& W% x* v/ R& R# W
14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
" Q6 O1 I, Z# E' R3 q% W$ N6 l& j. D( _
! e/ D# ?$ Y8 o. R/ }, a 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;: f/ t# N% j: Z4 ~9 Z9 a' P. _
: K! Y0 Q- R$ ?: N' A& g
16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。- K# v) D! ]% ]9 d
2 `& E, a8 U7 ~6 ~! H
本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。( U' Z4 L+ u/ l; j
% {) v9 N6 |: a( x
针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
+ f5 S5 \0 K( ], d2 Z 1 d+ P. I4 i4 T" X3 r0 h5 e
再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。( ]# \. P& i2 F: Y& N" u
& g h' n0 Q; q! r2 @% D
关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明9 o1 r% q; B9 K9 ?
3 d1 g7 Y! c6 } 青云QingCloud 复制代码
/ M) j" Q/ b0 M' w0 C5 `
$ @* N$ ^% X% b 认认真真做事。。必定能成功5 p( j. _$ ~. q: ^1 f
相关帖子