3月29日KVDB服务故障说明

尊敬的用户,您好:

    2019年3月29日上午07:37分,由于新浪云KVDB服务的内部实现核心服务HBase集群出现事物执行阻塞,导致大量的请求堆积,在超出处理的最大的队列后,客户端读取或者写入KVDB数据时出现RESET现象,影响了数据的读取和写入,导致服务不可用,部分使用此项服务的用户受到不同程度的影响。

    新浪云团队通过服务监控第一时间发现了问题,并争分夺秒处理以尽快恢复服务。通过排查,在定位问题后,先执行了数据备份操作,保证不丢失您的数据,然后执行了恢复操作,四小时后修复阻塞问题,目前服务已全面恢复,经过核实,无数据丢失。如果您的应用服务还没有彻底恢复,请尽快联系我们(在线提工单或联系专属大客户经理 ),我们收到反馈后将第一时间为您处理。

    针对此次平台的问题,我们已对服务故障诱发原因进行全面的复盘,将进行服务架构升级优化避免故障再次发生,恳请大家监督。痛定思痛,我们定将吸取教训,优化系统架构、加强对平台运维工作的监督及执行,尽最大的努力避免平台故障的发生,给您提供一个安全、快捷、稳定顺畅的平台环境。

    在故障期间,有不少用户留言、私信反馈各种测试情况并给予我们充分的理解,这让我们非常感动,并深切的感受到我们工作的意义和肩上背负的重要责任,新浪云不会辜负您的这份信任和支持。

    针对此次故障,新浪云决定对部分受影响的用户进行致歉补偿,以表达我们对大家深深的歉意。

    具体补偿方式为:

    我们会根据您应用KVDB服务在故障前一天的全天云豆消耗值乘以100,作为此次故障的补偿。云豆将会在2天内发放至您的账户,请及时登陆新浪云查看状态。

    补偿云豆数量 = KVDB服务在故障前一天的云豆消耗总值 * 100。

    如果还有其它的意见或疑问,您可以通过提交工单反馈给我们,我们将及时为您解答。

    再次向受此次故障影响的用户致歉,再次感谢每位支持和理解我们的用户,未来的路上,我们将怀着对每一位用户敬畏和负责的初心,砥砺前行!

                                              新浪云
                                           2019年3月29日