Donnerstag 17th Dezember 2020

Nichterreichbarkeit

Die HPI Schul-Cloud und Schul-Cloud Brandenburg waren am 17.12.2020 zeitweilig nicht erreichbar. Das Problem wurde durch das automatische Monitoring erkannt und eine Task-Force eingesetzt, die das Problem identifizieren und beheben konnte. Ursache für die zeitweilige Nichterreichbarkeit war eine Komponente des Identity-Management-Systems, die aus Sicherheitsgründen nicht genügend skaliert werden kann, sowie daraus resultierende Folgekonflikte. Das Problem konnte durch eine Optimierung des Routings gelöst werden. Es wurden bereits Maßnahmen zur weiteren Stabilisierung der Situation identifiziert, so werden u. a. Ressourcen für einzelne Datenbank-Server ausgebaut und eine aktualisierte Version des Videokonferenzsystems BigBlueButton integriert, die seit gestern verfügbar ist und eine verbesserte Performance und Audiostabilität bietet. Bereits am Montag wurden aufgrund der kurzfristig stark gestiegenen Zugriffszahlen die Serverkapazitäten innerhalb weniger Stunden um knapp 100 zusätzliche Server massiv erweitert. Die aktuelle Auslastung wird kontinuierlich überprüft und notwendige Erweiterungen und Anpassungen bei Bedarf vorgenommen.