Blog de Duplika

Sobre los inconvenientes en gaea.duplika.com

El día 2 de Septiembre a las 6:05AM, uno de los discos rígidos que almacena, entre otras cosas, todas las bases de datos, comenzó a fallar y decidimos desconectar el servidor para impedir la pérdida de datos. Intentamos rectificar los problemas que tenía para evitar demoras pero no fue posible por lo que procedimos a clonar la información en ese disco en uno nuevo, y aprovechando la oportunidad para reemplazarlo por un disco rídigo SAS que suelen ser mas estables.

¿Por qué demoraron tanto en solucionar el problema?

En un principio intentamos rectificar los errores en el sistema de archivos. Avanzamos hasta casi finalizar pero le disco terminó de fallar por lo que tuvimos que proceder con el reemplazo. Para evitar pérdida de datos, tuvimos que utilizar alguna de nuestras copias de seguridad y la clonación y luego, la rectificación de cualquier problema en el sistema de archivos.

¿Se ha perdido información debido a éste inconveniente?

La desconexión del servidor fue realizada a las 6:05AM (GMT -3:00) por lo que, lamentablemente, es muy problable que todos los correos enviados a sus casillas de correo desde ese horario a éste momento hayan sido descartados automáticamente y reenviados a los remitentes. No obstante, todos los archivos de su sitio e emails guardados se encuentran intactos. Las bases de datos MySQL fueron todas restauradas de nuestras copias de seguridad aunque si detectan algún problema, no duden en enviarnos un ticket de inmediato para revisarlo.

¿Qué medidas han tomado para evitar que ésto se repita?

El disco afectado ha sido reemplazado por uno nuevo de una tecnología superior (http://es.wikipedia.org/wiki/Serial_Attached_SCSI). A su vez, tenemos planeado instalar nuevos discos rígidos y configurarlos en RAID 5 (http://es.wikipedia.org/wiki/RAID#RAID_10) para que en caso de que alguno de los discos falle, ésto no afecte a la estabilidad del servidor y pueda ser reemplazado sin desactivar el servidor.

Por supuesto que todos los clientes afectados tienen derecho a solicitar el crédito correspondiente por nuestra garantía de uptime. Para hacerlo, por favor envienos un ticket a través de nuestra mesa de clientes y lo aplicaremos de inmediato. A su vez, si todavía detecta inconvenientes en su sitio, le ruego que nos contacte a través de esa via. Le pedimos disculpas por las molestias ocasionadas y cualquier consulta o duda, estamos a su entera disposición.