Estado de la nube de EGroupware

Avisos de avería

Los servicios de correo y la nube de EGroupware están operativos

Favicon-EGroupware
navbar-email_64

Incidentes anteriores

Servicios en la nube de EGroupware FRA y KA: 2021 de octubre 8.45h (CEST):

Los servicios de EGroupware Cloud, Rocket.Chat y Mail vuelven a estar totalmente disponibles.
Los demás nodos de la base de datos se sincronizarán hoy después del trabajo.

Servicios en la nube de EGroupware FRA y KA: 2021 de octubre 8.30h (CEST):

Hay dos nodos de base de datos disponibles y el tercero es la sincronización. EGroupware Mail y Rocket.Chat están de nuevo en línea. EGroupware Cloud tardará unos 15 minutos en estar en funcionamiento.

Servicios en la nube de EGroupware FRA y KA: 2021 de octubre:

Interrupción de los servicios de EGroupware Cloud en las primeras horas de la mañana. Problema en el clúster de la base de datos que no puede ejecutar más accesos de escritura. Las bases de datos están en proceso de ser detenidas y luego reiniciadas. La segunda y la tercera base de datos tienen que unirse a la primera, lo que puede llevar hasta 30 minutos cada una.

Se espera que los servicios de correo y la nube de EGroupware vuelvan a estar disponibles a las 9 de la mañana (CEST)

 

Servicios en la nube de EGroupware FRA y KA: 2021 29 de septiembre 11.30 (CEST):

Cluster EGroupware: nuevo fallo de un nodo de base de datos. Tenemos que apagar los sistemas temporalmente para volver al funcionamiento normal con al menos 3 nodos de base de datos. Los servicios vuelven a estar totalmente disponibles a partir de las 12.10h (CEST).

Servicios en la nube de EGroupware FRA y KA: 2021 29 de septiembre 08.30 (CEST):

EGroupware Cloud en funcionamiento en dos notas de cluster de base de datos, el resto se sincronizará durante la noche.

Servicios en la nube de EGroupware FRA y KA: 2021 29 de septiembre:

Interrupción de los servicios de EGroupware Cloud por la noche. Problema en el clúster de la base de datos que no puede ejecutar más accesos de escritura. Las bases de datos están en proceso de ser detenidas y luego reiniciadas. La segunda base de datos debe unirse a la primera, lo que puede llevar hasta 20 minutos. Por lo tanto, EGroupware Cloud estará fuera de línea hasta las 08:00h (CEST).

La interrupción también puede afectar a los servicios de correo.

Servicios de correo electrónico de EGroupware: 2021 6 de julio:

Scrub (Filesystem check) se está ejecutando para comprobar todo en detalle. De todos modos, esto llevará algunos días. Hasta que se termine, hemos trasladado la mitad de las instancias a Karlsruhe para no ralentizar la comprobación del sistema de archivos.

Los buzones afectados han sido restaurados desde la KA y vuelven a funcionar correctamente en la FRA.

Servicios de correo electrónico de EGroupware: 2021 5 de julio 10.30 (CEST)

El sistema de almacenamiento en el centro de datos de Frankfurt muestra errores de suma de comprobación y los buzones no están disponibles.

  • He abierto un ticket en el proveedor de servicios del centro de datos IONOS y estoy esperando su respuesta.
  • Se desconectó temporalmente el backend de Mail en Frankfurt, para que la redundancia pudiera hacerse cargo y los servicios de Mail funcionan ahora todos en el centro de datos de Karlsruhe.

Tus datos están guardados, pero el rendimiento será un poco más lento hasta que se pueda volver a conectar Frankfurt.

Informaremos aquí tan pronto como tengamos noticias sobre ese tema.

Ventana de mantenimiento de EGroupware Cloud: 2021 2 de junio de 8 a 9.30 pm (CEST)

Nuestra conjetura sobre el problema de ayer es que una «petición rota» de un cliente en un solo dominio, hace que «Traefik» responda a más de ese cliente durante algún tiempo con un «500 Internal Server Error».

Volveremos a habilitar «Traefik» esta noche e intentaremos averiguar qué petición, dominio e IP está causando el problema.

Se ha identificado el problema con alta probabilidad y se ha restablecido el funcionamiento normal.

Error interno del servidor en Frankfurt: 01.06.2021 21:00 – 23.59 hrs

Hubo un problema en la zona de disponibilidad de EGroupware Cloud en Fráncfort a partir de las 21:00 horas aproximadamente, por lo que allí se produjo una y otra vez el «500 Internal Server Error». La zona de disponibilidad de Karlsruhe no se vio afectada por el problema, o sólo durante un breve periodo de tiempo, después de que hubiéramos cambiado todo a Karlsruhe como solución. Otras investigaciones sugieren que NO hay una conexión directa con la actualización a 21.1, sino más bien un problema con «Traefik» como proxy / Kubenetes Ingress Controller, que sólo entra en juego en condiciones muy específicas.

Como primer paso, actualizamos la versión de «Traefik», que redujo el problema pero no lo eliminó. Una búsqueda en los «Foros Github de Traefik» dio una descripción de error similar en el siguiente post. Para poder ofrecer una nube EGroupware significativamente utilizable hoy en día, hemos eliminado «Traefik» y estamos hablando directamente con Nginx, por lo que entonces no había más «Errores internos del servidor».

Fallo de todos los servicios de EGroupware y correo: 06.04.2021: 17.45 – 19.20 CEST

IONOS ha provocado un problema de red, de ahí la interrupción de los servicios EGroupware y Mail.
Los colegas están trabajando lo más rápidamente posible para limpiar y restablecer las conexiones.

06.04.2021: 18.30h La red de IONOS vuelve a funcionar, pero pasará algún tiempo hasta que EGroupware y Mail vuelvan a estar disponibles.

06.04.2021: 19.20h Los nodos en Karlsruhe y luego en Frankfurt están disponibles de nuevo, por lo que todos los servicios de EGroupware y Mail están funcionando.

FALLO DEL SERVICIO EGROUPWARE NODE KARLSRUHE & FRANKFURT 24.08.2020 15.40 (CEST)

Fallo de servicio del nodo EGroupware Karlsruhe y Frankfurt 24.08.2020 15.40 (CEST)

Estamos en proceso de determinar dónde está el problema.
Actualmente, ambos nodos parecen estar afectados.
Sólo el análisis muestra un problema de conexión en los balanceadores de carga,
por lo que no hay conexión desde el exterior.

18.00 horas (CEST): Todos los sistemas (incluido el clúster de la base de datos). se cerraron.
El primer nodo de la base de datos se ha reiniciado con éxito.
Actualmente el segundo nodo de la base de datos se está iniciando y sincronizando con el primero.
Tan pronto como se haya completado, también reiniciaremos los sistemas restantes.

18.30h (CEST): El EGroupware y los servicios de correo vuelven a funcionar.