|
8 A( p; Q& u) ], e! K+ ^9 U6 z; z* g i; ~4 T4 S* G" c0 v3 Q
说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:. f$ i q8 L. i. X1 a8 J) }
- [2 H0 G7 L2 A' d! i5 x8 C- 尊敬的用户:9 V1 h3 D# l7 J: R* ]( ~$ S
- 9 s) q5 V: H& Z0 J# a
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
" a4 ^$ \* d2 X$ s+ R7 z
2 z0 b( z" B' }- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
- j# L9 D0 |2 `6 j$ }) N9 h3 M - - y& X1 C5 ?' E* F6 T
- 14:08,操作切换DNS以恢复官网及控制台;8 }, W" _4 t) }
) B( A% ~5 a2 C) l- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;
9 Q, Q, r/ l% D: u2 v8 C - 8 ]. H% Q, |9 y! C+ O
- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
: o; @8 h. M; R - ; G: s1 ?- @6 x" @8 F& E
- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;
/ R9 R+ k! [% p2 U6 q( a! E
) }' _# u+ i% A: Z- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
4 k" L8 m& Y0 m) d- T5 y
4 U' I$ w1 f# V- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
4 J, S8 ~2 B; `3 Z; D, W
8 G H @# t* @9 V- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。# j( s5 {: w5 x' o5 S
- ' u% h1 G; Y" G' [0 F* |6 k; |$ r" y
- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
5 J% a7 N3 x0 @# A) j! q& a- _
3 f. r) G6 w( z" Z; t- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明
+ n4 K/ j4 G8 F! S( b - " e. P' Y' [5 o6 {, u
- 青云QingCloud
复制代码
) g) r! a' [6 {: l
4 L2 u. z0 ~, c2 r! m认认真真做事。。必定能成功
+ P* @7 [3 {% x+ x4 M0 ] |
|