Stato di EGroupware Cloud

Rapporti di malfunzionamento

Servizi EGroupware Cloud e Mail operativi

Favicon-EGroupware
navbar-email_64

Incidenti passati

Servizi EGroupware Cloud FRA & KA: 2021 20 ottobre 8.45h (CEST):

I servizi EGroupware Cloud, Rocket.Chat e Mail sono di nuovo pienamente disponibili.
I restanti nodi del database saranno sincronizzati oggi dopo il lavoro.

Servizi EGroupware Cloud FRA & KA: 2021 20 ottobre 8.30h (CEST):

Sono disponibili due nodi di database e il terzo è la sincronizzazione. EGroupware Mail e Rocket.Chat sono di nuovo online. EGroupware Cloud impiegherà circa 15 minuti per essere attivo.

Servizi EGroupware Cloud FRA & KA: 2021 ottobre 20:

Interruzione dei servizi EGroupware Cloud nelle prime ore del mattino. Problema nel cluster del database che non si possono più eseguire accessi in scrittura. I database vengono fermati e poi riavviati. Il secondo e il terzo database hanno bisogno di unirsi al primo database, il che può richiedere fino a 30 minuti ciascuno.

I servizi EGroupware Cloud e di posta elettronica dovrebbero essere nuovamente disponibili alle 9 del mattino (CEST)

 

EGroupware Cloud services FRA & KA: 2021 settembre 29 11.30 (CEST):

Cluster EGroupware: nuovo guasto di un nodo del database. Abbiamo bisogno di spegnere temporaneamente i sistemi per tornare al funzionamento normale con almeno 3 nodi di database. I servizi sono di nuovo pienamente disponibili dalle 12.10h (CEST).

EGroupware Cloud services FRA & KA: 2021 settembre 29 08.30 (CEST):

EGroupware Cloud attivo e funzionante su due note cluster di database, il resto sarà sincronizzato durante la serata.

Servizi EGroupware Cloud FRA & KA: 2021 settembre 29:

Interruzione dei servizi EGroupware Cloud durante la notte. Problema nel cluster del database che non si possono più eseguire accessi in scrittura. I database vengono fermati e poi riavviati. Il secondo database ha bisogno di unirsi al primo database, il che può richiedere fino a 20 minuti. Quindi EGroupware Cloud sarà offline fino alle 08:00h (CEST).

L’interruzione può anche influenzare i servizi di posta.

EGroupware Servizi e-mail: 2021 6 luglio:

Scrub (controllo del filesystem) è in esecuzione per controllare tutto nei dettagli. Questo richiederà comunque alcuni giorni. Finché non è finito abbiamo spostato metà delle istanze ora a Karlsruhe per non rallentare il controllo del filesystem.

Le caselle di posta interessate sono state ripristinate da KA e ora funzionano di nuovo correttamente in FRA.

EGroupware Servizi e-mail: 2021 luglio 5 10.30 (CEST)

Lo Storage System nel datacenter di Francoforte mostra errori di Checksum e le Mailbox non sono disponibili.

  • Aperto Ticket al fornitore di servizi del datacenter IONOS e in attesa di risposta
  • Abbiamo spento temporaneamente il backend di Mail a Francoforte, in modo che la ridondanza potesse prendere il sopravvento e i servizi di Mail sono ora in esecuzione tutti nel datacenter di Karlsruhe.

I tuoi dati sono salvati, ma le prestazioni saranno un po’ più lente fino a quando Francoforte potrà essere riaccesa.

Informeremo qui non appena avremo notizie su questo argomento.

Finestra di manutenzione di EGroupware Cloud: 2021 giugno 2 dalle 8 alle 9.30 pm (CEST)

La nostra ipotesi sul problema di ieri è che una “richiesta interrotta” da un cliente su un singolo dominio, fa sì che “Traefik” risponda a più di quel cliente per qualche tempo con un “500 Internal Server Error”.

Riabiliteremo “Traefik” stasera e cercheremo di scoprire quale richiesta, dominio e IP sta causando il problema.

Il problema è stato identificato con alta probabilità e tutto è stato riportato al funzionamento normale.

Errore interno del server a Francoforte: 01.06.2021 21:00 – 23.59 ore

C’è stato un problema nella zona di disponibilità di EGroupware Cloud a Francoforte dalle 9 di sera circa, per cui il “500 Internal Server Error” si è ripetuto più volte. La zona di disponibilità a Karlsruhe non è stata colpita dal problema o solo per un breve periodo dopo che avevamo spostato tutto a Karlsruhe come workaround. Ulteriori indagini suggeriscono che non c’è una connessione diretta con l’aggiornamento alla 21.1, ma piuttosto un problema con “Traefik” come proxy / Kubenetes Ingress Controller, che entra in gioco solo in condizioni molto specifiche.

Come primo passo, abbiamo aggiornato la versione di “Traefik”, che ha ridotto il problema ma non lo ha eliminato. Una ricerca nei “Forum Github di Traefik” ha dato una descrizione di errore simile nel seguente post. Al fine di essere in grado di fornire un EGroupware Cloud significativamente utilizzabile oggi, abbiamo rimosso “Traefik” e stiamo parlando direttamente con Nginx, quindi non c’erano più “Internal Server Errors”.

Guasto di tutti i servizi EGroupware e di posta: 06.04.2021: 17.45 – 19.20 CEST

IONOS ha causato un problema di rete, da cui l’interruzione dei servizi EGroupware e Mail.
I colleghi stanno lavorando il più rapidamente possibile per pulire e ripristinare le connessioni.

06.04.2021: 18.30h La rete IONOS è di nuovo attiva, ma ci vorrà del tempo prima che EGroupware e Mail siano di nuovo disponibili.

06.04.2021: 19.20h I nodi a Karlsruhe e poi a Francoforte sono di nuovo disponibili, quindi tutti i servizi EGroupware e Mail sono in funzione.

GUASTO DEL SERVIZIO EGROUPWARE NODO KARLSRUHE & FRANCOFORTE 24.08.2020 15.40 (CEST)

Guasto del servizio EGroupware nodo Karlsruhe & Francoforte 24.08.2020 15.40 (CEST)

Stiamo cercando di determinare dove si trova il problema.
Attualmente, entrambi i nodi sembrano essere interessati.
Solo l’analisi mostra un problema di connessione sui loadbalancer,
quindi non c’è nessuna connessione dall’esterno.

Ore 18.00 (CEST): Tutti i sistemi (incluso il cluster del database). sono stati chiusi.
Il primo nodo del database è stato riavviato con successo.
Attualmente il secondo nodo del database si sta avviando e sincronizzando con il primo.
Non appena questo sarà completato, riavvieremo anche i sistemi rimanenti.

18.30h (CEST): EGroupware e i servizi di posta sono di nuovo attivi.