Zürich
Senior Observability Platform Engineer (80-100%)
- 04 Juli 2026
- 80 – 100%
- Festanstellung
- Zürich
Job-Zusammenfassung
Wir suchen einen Senior Observability Platform Engineer in Zürich/Bern.
Aufgaben
- Konfiguration und Verbesserung unserer Observability-Plattform.
- Förderung der besten Praktiken für Observability im Unternehmen.
- Entwicklung von automatisierten Monitoring-Lösungen.
Fähigkeiten
- Mindestens 5 Jahre Erfahrung in der Plattformtechnik.
- Fundierte Kenntnisse in Kubernetes und Docker.
- Erfahrung mit Observability-Tools wie Thanos und Loki.
Ist das hilfreich?
Über den Job
Senior Observability Platform Engineer (80-100%)
Standort: Zürich / Bern
Wir suchen einen hochqualifizierten und erfahrenen Senior Platform Observability Engineer, der unser Team verstärkt. In dieser Rolle sind Sie verantwortlich für die Zuverlässigkeit, Skalierbarkeit und Effizienz unserer Kern-Observability-Infrastruktur, die unsere Engineering-Teams und das kundenorientierte Portal unterstützt. Ihre Arbeit umfasst die Weiterentwicklung dieser Systeme und die Förderung der Einführung von Best Practices im Bereich Observability in der Organisation.
Hauptverantwortlichkeiten
- Konfiguration, Betrieb und Verbesserung unserer Observability-Plattformen und -Frameworks (Clickhouse, Thanos, Loki, Tempo, OpenTelemetry Collector + benutzerdefinierte Prozessoren).
- Kontinuierliche Verbesserung und Förderung der organisationsweiten Einführung von Best Practices im Bereich Observability, um umfassendes Monitoring, Logging und Tracing sicherzustellen.
- Entwicklung und Pflege automatisierter Lösungen für Monitoring, Alarmierung und Incident Response.
Systemoptimierung
- Zusammenarbeit mit Engineering-Teams, um deren Bedürfnisse zu verstehen und robuste, skalierbare Lösungen unter Nutzung der Observability-Plattform bereitzustellen.
- Optimierung der Systemleistung und Sicherstellung hoher Verfügbarkeit durch proaktives Monitoring und Wartung.
- Entwicklung und Umsetzung von Strategien zur Kostenoptimierung, Kapazitätsplanung und Leistungsoptimierung.
Innovation und Verbesserung
- Auf dem neuesten Stand der Branchentrends, Tools und Technologien bleiben, um kontinuierliche Verbesserungen voranzutreiben.
- Experimentieren mit und Implementieren neuer Tools, insbesondere im Bereich Observability und Telemetrie, zur Erweiterung der Plattformfähigkeiten.
- Bewertung und Integration des OpenTelemetry Collectors, wo dies vorteilhaft ist, zur Verbesserung der Telemetriedatenerfassung und -analyse.
Erforderliche Fähigkeiten und Erfahrungen Wesentliche/Erforderliche Fähigkeiten
- Observability-Plattformen: Nachweisliche Erfahrung in der Verwaltung mindestens eines der folgenden Observability-Stacks: Thanos, Mimir, Cortex, Tempo, Loki oder Clickhouse; mit der Fähigkeit, diese Systeme zu konfigurieren, zu betreiben und zu verbessern.
- Kubernetes: Tiefgehendes Verständnis der Kubernetes-Architektur und praktische Erfahrung im Ressourcenmanagement auf Clustern.
- Helm: Erfahrung im Schreiben und Pflegen von Helm-Charts sowie im Verständnis von Drittanbieter-Charts zur effizienten Bereitstellung und Verwaltung von Kubernetes-Ressourcen.
- GitOps: Erfahrung mit Continuous Delivery und GitOps-Praktiken (Versionskontrolle, CI/CD-Pipelines).
- Agentic Development: Praktische Erfahrung mit agentischen KI-Workflows (z. B. GitHub Copilot, Claude Code, Cursor oder Ähnliches) zur Beschleunigung des täglichen Engineerings.
- Docker: Expertise in Containerisierung, Orchestrierung und Optimierung von Docker-Workloads.
Wünschenswerte Fähigkeiten
- Coding-Erfahrung: Programmierkenntnisse in Golang oder einer ähnlichen Sprache.
- Open Source: Beitrag zu einem Open-Source-Projekt, das in Golang oder einer ähnlichen Sprache geschrieben ist.
- OpenTelemetry Collector: Kenntnisse des OpenTelemetry Collectors oder direkte Beiträge zum Projekt.
- KI für Observability: Interesse an der Anwendung von KI/ML im Bereich Observability, wie Anomalieerkennung bei Metriken und Logs, automatisierte Ursachenanalyse, Reduzierung und Korrelation von Alarmgeräuschen sowie natürliche Sprachabfragen über Telemetriedaten.
Soft Skills
- Schnelle Auffassungsgabe: Fähigkeit, neue Konzepte und Technologien schnell zu erfassen und sich an die sich entwickelnden Bedürfnisse der Organisation anzupassen.
- Kommunikation: Hervorragende Kommunikationsfähigkeiten mit der Fähigkeit, komplexe technische Konzepte sowohl technischen als auch nicht-technischen Stakeholdern zu vermitteln.
- Kundenorientierung: Ausgeprägtes Bewusstsein für Kundenbedürfnisse und die Auswirkungen der Plattformoperationen auf interne Engineering-Teams und externe Nutzer.
- Kooperative Denkweise: Starke Fähigkeit zur Zusammenarbeit in funktionsübergreifenden Teams, Beitrag zu einer Kultur der kontinuierlichen Verbesserung und Innovation.
Ausbildung und Erfahrung
- Bachelor-Abschluss in Informatik, Informationstechnologie oder einem verwandten Bereich (oder gleichwertige Erfahrung).
- Mehr als 5 Jahre Erfahrung im Bereich Platform Engineering, Site Reliability Engineering oder einer verwandten Rolle.
- Nachgewiesene Erfahrung in der Verwaltung großskaliger Infrastrukturen und Observability-Plattformen (wie Thanos, Mimir, Cortex, Tempo, Loki, Clickhouse).
- Technische Expertise
- Operations von Observability-Plattformen
- Sie sind begeistert von der Aussicht, mehr als 20 TB Telemetriedaten pro Tag zu verwalten, die von einer Flotte von über 10.000 Knoten stammen (einschließlich Linux-Hosts, K8s-Clustern, VMs).
Was wir bieten:
Sie werden Teil eines Teams sein, das an Folgendes glaubt:
Leidenschaftliches Engagement für die Sicherheit unserer Kunden – Wir sind entschlossen, Probleme zu lösen. Was auch immer es kostet.
Unkonventionelles Denken, um voraus zu sein – Die Welt überrascht uns ständig. Also überraschen wir sie zuerst.
Die harte Arbeit, Dinge einfach zu machen – Etwas gestalten und verfeinern, das durch seine Einfachheit begeistert.
Gemeinsames Arbeiten für den Erfolg – Die Kraft des Teams macht uns immer schneller und besser.
Als Beleg dafür wurde Open Systems als herausragender Arbeitsplatz anerkannt. Sie werden von klugen Teams umgeben sein, die Ihre Erfahrung bereichern und Ihnen Möglichkeiten bieten, Ihre Fähigkeiten zu entwickeln und Ihre Karriere voranzutreiben.
Wir freuen uns auf Ihre Online-Bewerbung (bitte beachten Sie, dass Sie Ihre Bewerbung in zwei Anhänge komprimieren müssen).
Kommen Sie, wie Sie sind! Wir suchen großartige Menschen mit unterschiedlichen Hintergründen, Erfahrungen, Fähigkeiten und Perspektiven. Open Systems begrüßt und fördert Vielfalt am Arbeitsplatz, unabhängig von Rasse, Geschlecht, Religion, Alter, sexueller Orientierung, Behinderung oder Veteranenstatus.
Nur Direktbewerbungen werden berücksichtigt.
Über Open Systems:
Open Systems ist ein internationaler Anbieter von co-managed SASE-Betriebsmodellen, der Unternehmen und Organisationen dabei unterstützt, komplexe hybride und Multi-Cloud-Umgebungen sicher zu betreiben. Das 1990 gegründete Unternehmen mit Hauptsitz in der Schweiz erzielt einen Jahresumsatz von über 100 Millionen USD und unterstützt globale Unternehmenskunden mit mehr als 60.000 Mitarbeitenden in über 180 Ländern.