7 s. i9 P, {3 z; L
; W) U& i3 \9 h& y( `) V3 [0 ?
说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
7 c) ]" o! z; H4 i. M+ J) @- v
- 尊敬的用户:( G! v/ W& M/ S
2 F" w/ b4 Z: k1 `& k# u2 h* f- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
5 d0 _& t. N# w) B" T - 3 z- c1 o, r+ B
- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;" |) R8 w5 U R
1 w+ p! l5 r8 s0 N. { c& s, a, x) f% L- 14:08,操作切换DNS以恢复官网及控制台;
7 V$ c0 x, m3 N3 J3 y. ?
9 n3 F& @ |5 c& t( b& R! ?! v- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;
: q) C* O, F: e* Z# A# e
6 y3 A) L% y; i. J; k' {4 W' T- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;; [7 t1 _, J/ t6 O
- 4 e& c- r0 ]7 V& h$ s
- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;6 s* l& h* D* Z! y/ l% o
. H6 u4 s }' J, v$ x- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
+ Y. ^- |" I! w) ]& z - , _+ E9 v& R9 k3 \
- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
# E, ~2 z4 \; T3 g" t) @$ O% ?! Z - 8 t* v# w {' ]* D7 y2 T) D/ ?
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
& I5 G: u$ q1 w; f - 4 n& ~- U* l5 r: l2 Z2 a
- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。% s' `; i# p7 q, L5 J6 `$ z) g, n
- ' n% K% d% @" B, S' C& X
- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明0 b* s; ~: u. m5 Q
- 2 Q$ N z! x6 u7 L
- 青云QingCloud
复制代码 7 ] p" C3 |, u, B
* Z0 `* C5 G6 F* z$ A) O( o# @' ?认认真真做事。。必定能成功
6 q6 D# h, d* C2 b r: B% ?/ J |