Ein Tag im Leben eines Cloud Engineers

Als Kunden haben wir ständig Kontakt mit Produkten und Dienstleistungen. Wir nutzen eine App, sehen ein Dashboard, drücken auf einen Knopf – und freuen uns, dass unsere Daten in Sekundenschnelle um die halbe Welt geschickt wurden. Aber wie funktioniert das eigentlich? Welche Prozesse stecken dahinter? – Hand aufs Herz: Die meisten von uns wissen es nicht. Tatsächlich sind es Mitarbeitende wie Cristian Tatoiu, die solche Dinge möglich machen. Sie sind es, die über die Lösungen dahinter nachdenken, über die Datenarchitektur, die benötigt wird. Ein stabil laufendes Dashboard? Sicher gespeicherte Daten?
Seit fast einem Jahr arbeitet Cristian als Cloud Engineer bei DKV Mobility. Für den Newsroom gibt er uns einen spannenden Einblick hinter die Kulissen und erklärt, was genau ein Cloud Engineer macht – und warum seine Arbeit eng mit der Strategie des Unternehmens und der Schaffung von Mehrwert für die Kunden verbunden ist.
„Ich bin Cristian. Ich lebe in Rumänien und bin Cloud Engineer im Plattform-Team bei DKV Mobility. Und um es direkt vorwegzunehmen: Der Wechsel von einem traditionellen IT-Dienstleister zu einer rein cloudbasierten, agilen IT-Organisation war die beste Entscheidung, die ich treffen konnte. Aber der Reihe nach – ich fange diesen Bericht so an, wie ich meinen Tag beginne: mit einer Tasse Kaffee.
Nach meinem morgendlichen Workout – sei es im Fitnessstudio oder eine Laufrunde – greife ich zur ersten Tasse Kaffee und checke meine E-Mails. Gleichzeitig mache ich einen kurzen Kontrollblick auf die nächtliche Überwachung der DKV Mobility-Infrastruktur, also Datenbanken, virtuelle Maschinen und Pipelines. Auch die Alerts und Monitoring-Tools werden überprüft. Dank der 24/7-Support-Partnerschaft mit dem DevOps-Team der OEDIV GmbH in Deutschland, einem langjährigen Partner unseres Unternehmens, muss ich mir keine Sorgen machen, nachts wegen Notfällen aus dem Bett geholt zu werden. Danach schaue ich, ob es Support-Anfragen oder Informationswünsche von Produktteams aus ganz Europa gibt. Da ich in Rumänien eine Stunde vor unseren Kolleg:innen in der Zentrale in Ratingen, Deutschland, arbeite, kann ich sie manchmal mit bereits fertigen Antworten überraschen, wenn sie ihren Arbeitstag beginnen.
Als Cloud Engineer arbeite ich in der Abteilung Customer Product Services (CPS). Hier bin ich Teil des Platform Teams, das sich auf die skalierbare Azure-Cloud-Infrastruktur konzentriert und die Produktteams dabei unterstützt, erstklassige Entwicklerlösungen bereitzustellen. Für alle, die Azure nicht kennen: Es handelt sich um einen Cloud-Computing-Service von Microsoft, der es ermöglicht, Anwendungen und Services in einer Cloud-Umgebung zu entwickeln und zu verwalten.
Unsere Plattform-Mission lässt sich in zwei Hauptaufgaben zusammenfassen: Support und Beratung. Wir unterstützen die Produktteams in ihrer täglichen Arbeit dabei, wertvolle Services für unsere Kunden zu schaffen und beraten sie zu Best Practices in Bezug auf Cloud-Ressourcen, Monitoring-Lösungen und Deployment-Konfigurationen, um die Plattform kontinuierlich weiterzuentwickeln.
Der Alltag eines Cloud Engineers
Dank flexibler Arbeitszeiten starten wir den Tag als Team meist mit einem Meeting zwischen 9 und 10 Uhr. Hier tauschen wir uns schnell aus, geben Updates zu aktuellen Themen und verteilen Aufgaben aus unserem Backlog. Da wir teilweise remote arbeiten und in ganz Europa verteilt sind, ist es wichtig, uns gegenseitig auf dem Laufenden zu halten. Einmal wöchentlich planen wir unsere Woche gemeinsam. Hier besprechen wir wichtige Themen und priorisieren Projekte, die mehr Ressourcen oder Zeit erfordern. Besonders schätze ich auch unsere monatlichen Retrospektiven, die von einem Scrum Master moderiert werden. In diesen Meetings reflektieren wir, wie wir als Team arbeiten, und überlegen, wie wir uns verbessern können. Zusätzlich gibt es wöchentliche Treffen mit der DevOps-Community, in denen wir uns mit den Produktteams und deren DevOps austauschen. Ich weiß, das mag nach vielen Meetings klingen, aber sie sind alle nützlich. Besonders im Meeting mit meinem Teamleiter habe ich die Möglichkeit, offenes und ehrliches Feedback auszutauschen, Probleme anzusprechen oder über Ideen und Chancen zu sprechen.
Meine tägliche Arbeit lässt sich in vier Kategorien aufteilen:
- Incidents (Vorfälle)
- Anfragen
- Projekte
- „Sidequests“ (oft herausfordernd, aber auch spannend)
Lasst uns das einmal gemeinsam durchgehen. Treten Vorfälle auf, sind schnelle Maßnahmen gefragt. Wir springen sofort ein, gehen in den Problemlösungsmodus über und beheben das Problem. Wir holen eine Bestätigung ein, schließen den Vorfall und dokumentieren die Lösung, falls erforderlich. Um einen guten Überblick über unser Ticket-Management zu behalten, hat sich das Tool Jira als äußerst nützlich erwiesen. Für die Dokumentation verwenden wir Confluence.
Da wir hauptsächlich die von Microsoft Azure verwalteten Dienste nutzen, gibt es nicht allzu viele Vorfälle, da Azure sich als äußerst zuverlässig und robust erwiesen hat, insbesondere der Azure Kubernetes Service (1) und die flexiblen PostgreSQL-Server (2).
Anfragen gibt es in unterschiedlichen Formen und Größen. Es kann sich um eine einfache Anfrage nach Informationen handeln, um eine Einführung für einen neuen Mitarbeiter, eine Pull-Request-Genehmigung, eine Bereitstellung oder auch um eine neue Art von Ressource, die das Produktteam benötigt. Bei DKV Mobility macht die kürzlich eingeführte Self-Service-Pipeline unser Leben viel einfacher, da viele Anfragen nach Ressourcen wie Datenbanken, Speicher oder Servern nun von den Entwicklern oder DevOps-Ingenieuren selbst bearbeitet werden können. Das bedeutet, dass wir mehr Zeit für wertschöpfende Aufgaben haben und neue Features und Services schneller auf den Markt bringen können. Dadurch haben wir den Vorteil, dass unsere Software anstelle von langsamen, manuellen Tätigkeiten viel schneller neue Dienste und Funktionen für die Kunden erstellen kann.
Wir arbeiten an vielen kleineren und größeren Projekten. Ob es darum geht, die richtigen Tools oder Technologien zu identifizieren oder die derzeitige Nutzung zu verbessern, um das Beste aus den verfügbaren Werkzeugen herauszuholen – wir streben ständig danach, unsere Plattform in Bezug auf Skalierbarkeit, Belastbarkeit und Effizienz zu verbessern. Derzeit stellen wir zum Beispiel unsere einzelnen Server von PostgreSQL-Datenbanken auf neue, flexiblere Server um, um den Wartungsaufwand zu verringern und die Hochverfügbarkeitsfunktionalität zu erhöhen. Das bedeutet, dass die Migrationsschritte für alle Produktteams über all unsere Umgebungen hinweg koordiniert werden müssen. Und natürlich für alle Datenbanken und Server – und das ohne jegliche Auswirkungen für unsere Kunden. Diese Aufgabe erfordert eine sehr enge Zusammenarbeit mit den DevOps-Ingenieuren in den Produktteams. Das ist auch gut so, denn wir wollen so viel wie möglich mit den Produktteams verwoben sein. Als motivierendes Ergebnis können wir unseren Kunden weniger Ausfallzeiten, mehr Sicherheit und höhere Zuverlässigkeit für unser DKV COCKPIT (unser Kundenportal) bieten.
„Sidequests“ sind meistens lustige und herausfordernde Aufgaben, die mit einer Nachricht oder einem Anruf eines Kollegen beginnen, der sagt: "Ich habe da mal eine Frage...", und die in der Regel nach sechs Stunden Durcharbeitung von Protokollen, mehreren Team-Calls und dem Austausch mit anderen Teams enden – nicht nur mit einem gelösten Problem, sondern auch mit erweitertem Wissen.
Neben Projekten, Vorfällen oder herausfordernden Aufgaben gehört auch das Lernen zu meinem Arbeitsalltag. In einer Branche, die sich so schnell verändert wie die IT-Branche, muss man sich ständig weiterbilden. Als Mitarbeiter haben wir Zugang zu mehreren Anbietern für Online-Schulungen. Deshalb habe ich immer eine Registerkarte geöffnet – meistens auf A Cloud Guru oder LinkedIn Learning. So bin ich immer bereit, eine 5 bis 10-minütige Lerneinheit einzulegen, wann immer sich die Gelegenheit bietet. Für mich ist das folgendermaßen: Wenn man Spitzenleistungen erbringen will, muss man jeden Tag ein paar Stunden zusätzlich in die Selbstoptimierung investieren. Das ist genau wie bei einem Profisportler: Man muss trainieren, um besser zu werden und seine Fähigkeiten zu verfeinern – den ganzen Tag, jeden Tag.“
(1) https://azure.microsoft.com/en-us/services/kubernetes-service/#overview
(2) https://docs.microsoft.com/en-us/azure/postgresql/