|
|
0 G6 ^8 w7 U) {8 R, c/ L' O* i# W/ N3 J; }1 \8 y
说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
5 i' Q* N) s# B' s* ^7 c- V; F$ m; w4 \) ^
- 尊敬的用户:4 s; p w) b1 p) Q1 R
' t4 ?; @5 ~! r# w; c- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:% e' D& m& O7 K& k4 g
- # `' u2 F n4 w! z l) B5 C
- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
3 s4 B- h* C- y
: K3 t, U/ C7 D4 Y( N* k o) S- 14:08,操作切换DNS以恢复官网及控制台;$ o3 ^7 g G) A3 I o
- ) O! n' I9 _& D; r' i4 |
- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;
$ `/ q) p1 Z7 O' T4 ?& k# Y& ~1 w - + z+ N3 L! k! W, g
- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
3 y3 _1 w* ^# a' t - ( |# O9 I/ x/ n7 r. ]! f
- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;# l4 q' H4 M' H% x' Y2 }0 H2 c
- 6 a8 j8 O3 u6 _ b5 a# J
- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
" z/ @" W( i: i# C# `$ |/ @% {
8 n- x5 ~, ]" Q r' k- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。3 o6 v+ B- B% Z5 t
- " {+ X5 J8 o7 n5 W% M8 ~! C
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。. u7 v8 t4 \: g& X4 _8 ]( r
- ^% M5 V/ O9 L1 O7 y+ ~- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。2 m) ^# A5 c2 P0 m4 }. A
/ s( N! S% _. ~( O- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明
$ [. j% s7 E8 A* U$ P& _
o5 C5 I2 G# g$ \! P0 ^- 青云QingCloud
复制代码 / e4 e2 d; T$ \: R, {
7 N# L% i% p' G
认认真真做事。。必定能成功2 A; Y9 p" \3 u3 _ G& d( [" h, t
|
|