> job detail
F
👽Other
Senior Site Reliability Engineer (m/w/d)
Flip App · Berlin, Berlin, Germany; Remote (Europe); Stuttgart
// classified as
Other (Adjacent or hard to classify.)
posted
1d ago
location
Berlin, Berlin, Germany; Remote (Europe); Stuttgart
languages
go
tools
azure, grafana, kubernetes
> stack
goazuregrafanakubernetespostgresqlterraform
> description
<div class="content-intro"><h1 style="text-align: left;"><strong>Empower every employee.</strong></h1>
<h3 style="text-align: left;">Our mission is to be the world's most used <span class="notion-enable-hover" data-token-index="0">AI employee experience platform</span> by changing the way frontline employees work.</h3>
<p>Flip ist die führende KI-gestützte Employee Experience Platform für Frontline Worker. Wir revolutionieren, wie die Menschen arbeiten, die die Welt am Laufen halten – in Retail, Manufacturing und Logistics. Eine App. Ein Touch. Alles, was sie brauchen.</p>
<p>Unsere Mission: Connect every employee to everything they need in one touch.</p></div><p> </p>
<h3>Stellenbeschreibung</h3>
<p>Als Senior Site Reliability Engineer in unserem Platform Squad übernimmst du die End-to-End-Verantwortung für kritische Reliability-Bereiche und treibst die technische Ausrichtung innerhalb des Squads voran. Du leitest Architektur-Entscheidungen auf unserer Plattform, mentorst Teammitglieder und legst die Messlatte für Zuverlässigkeit innerhalb des Teams kontinuierlich höher. Diese Rolle ist für Engineers mit einer nachgewiesenen Erfolgsbilanz beim Aufbau und Betrieb von hochverfügbaren High-Throughput-Systemen gedacht, die technische Ownership auf Senior-Level und echten Impact durch tiefgehende Engineering-Arbeit in einem eng vernetzten, klar definierten Team suchen.</p>
<h3>Was dich bei uns erwartet</h3>
<ul>
<li><strong>Co-Owner der Architektur:</strong> Hilf dabei, die Architektur und Weiterentwicklung unserer Cloud-Infrastruktur auf Azure und unserer Kubernetes-Cluster voranzutreiben – konzipiert für hohen Durchsatz und höchste Verfügbarkeit – um Flips schnelles globales Wachstum zu unterstützen.</li>
<li><strong>Die Resilience-Strategie vorantreiben:</strong> Definiere unseren Ansatz für globales Skalieren, Zero-Downtime-Deployments, Rollback-Mechanismen sowie Disaster Recovery und stelle sicher, dass die Plattform rund um die Uhr verfügbar bleibt.</li>
<li><strong>Unseren Observability-Stack weiterentwickeln:</strong> Optimiere unseren LGTM-Stack (Loki, Grafana, Tempo, Mimir) zu einem Fundament, dem unsere Engineers vertrauen können.</li>
<li><strong>Unsere IaC-Plattform verbessern:</strong> Du eliminierst Routineaufwand an der Quelle und machst unsere Infrastruktur für die Engineering-Teams zu einem echten Self-Service.</li>
<li><strong>Führung bei Incidents:</strong> Du übernimmst eine führende Rolle bei größeren Plattform-Störungen, leitest sachliche Fehleranalysen (Blameless Post-Mortems) und wandelst Erkenntnisse in dauerhafte Verbesserungen um.</li>
<li><strong>Mentoring innerhalb des Squads:</strong> Coache Teammitglieder, leite RFCs und Design-Reviews im Team und hilf Engineers dabei, sich zu stärkeren SREs zu entwickeln.</li>
<li><strong>Unsere Roadmap gestalten:</strong> Arbeite partnerschaftlich mit deinem Squad zusammen, um die Richtung der Plattform zu definieren.</li>
</ul>
<h3>Was du mitbringst</h3>
<p>Wir suchen einen Hands-on, SaaS-orientierten Senior Site Reliability Engineer, der Skalierbarkeit und Zuverlässigkeit als erstklassiges Produktmerkmal behandelt.</p>
<p><strong>Must-Have Qualifikationen</strong></p>
<ul>
<li>5+ Jahre Hands-on-Erfahrung als Site Reliability Engineer (SRE), Platform Engineer, DevOps Engineer, Infrastructure Engineer, Cloud Engineer oder Backend Engineer mit starkem Infrastruktur-Fokus.</li>
<li>Nachgewiesene Erfolgsbilanz beim Aufbau und Betrieb von hochverfügbaren High-Throughput-Systemen in der Produktion.</li>
<li>Tiefe Erfahrung auf Produktionsniveau mit Kubernetes auf einem der gängigen Hyperscaler.</li>
<li>Fundierte Erfahrung mit modernen Observability-Stacks (z. B. Prometheus, Mimir, VictoriaMetrics, Dash0, Loki, ELK) und eine klare Sichtweise auf SLIs, SLOs und Error Budgets.</li>
<li>Solide Software-Development-Skills in Go (stark bevorzugt, da unser IaC auf Pulumi in Go läuft) oder Python.</li>
<li>Hands-on-Erfahrung mit Infrastructure as Code (Pulumi, OpenTofu, Terraform) und GitOps (z. B. ArgoCD) + CI/CD Pipeline-Design.</li>
<li>Nachgewiesene Fähigkeit, komplexe Infrastruktur-Initiativen vom Design bis zur Produktion zu leiten – einschließlich des Schreibens von RFCs und des Vorantreibens von Architektur-Entscheidungen in deinem Team.</li>
<li>Erfahrung im Mentoring von Engineers und darin, das technische Niveau innerhalb eines Teams anzuheben.</li>
<li>Souveräne End-to-End-Verantwortung bei kritischen Störungen und die Fähigkeit, daraus gewonnene Erkenntnisse in nachhaltige technische Verbesserungen zu überführen.</li>
<li>Starke Kommunikationsfähigkeiten und verhandlungssicheres Englisch.</li>
<li>Bereitschaft zur Teilnahme an Rufbereitschaften (On-Call), um die Zuverlässigkeit unserer Plattform zu gewährleisten.</li>
</ul>
<p><strong>Nice-to-Have Qualifikationen</strong></p>
<ul>
<li>Rollout von produktionsreifen API-Gateways mit Gateway API (z. B. Envoy Gateway).</li>
<li>Betrieb von Multi-Cluster Service Meshes (z. B. Cilium, Linkerd, Istio).</li>
<li>Deployment und Wartung von Kubernetes Operatoren (z. B. Strimzi, CNPG).</li>
<li>Betrieb von hochverfügbarem PostgreSQL in der Produktion.</li>
</ul>
<p> </p><div class="content-conclusion"><h3><strong>Das bieten wir dir</strong></h3>
<ul>
<li><strong data-start="513" data-end="532">Work-Mode:</strong> Wir sind<em> </em>remote-first und geben dir damit die Flexibilität, von zu Hause aus zu arbeiten. Gleichzeitig schätzen wir den Mehrwert der persönlichen Zusammenarbeit sehr. Je nach Rolle nimmst du gelegentlich an Team-Events, Workshops oder Meetings in unseren Büros in Berlin oder Stuttgart teil – selbstverständlich immer mit ausreichend Vorlauf. Das genaue Verhältnis besprechen wir transparent während deines Bewerbungsprozesses. </li>
<li><strong>Work-Life-Balance:</strong> Wir wollen nicht, dass du an deinem Schreibtischstuhl festwächst und übernehmen deshalb die Kosten für deine E-Gym-Wellpass-Mitgliedschaft und bieten Job-Rad Leasing an.</li>
<li><strong>Erfolge feiern:</strong> Dich erwarten hoch motivierte und engagierte Menschen in einer lockeren Arbeitsatmosphäre.</li>
<li><strong>Mittendrin statt nur dabei:</strong> Du gestaltest Flip aktiv mit. Ganz nebenbei bist du Enabler des rasanten Wachstumsprozesses eines jungen Tech-Unternehmens und wächst an deinen Zielen. Gute Laune garantiert.</li>
<li><strong>Happy to be a Flipster:</strong> Freu dich auf regelmäßige Teamevents und Culture Days, die uns als Flipster zusammenschweißen.</li>
<li><strong>Arbeiten im Ausland: </strong>Bei Flip kannst du auch im europäischen Ausland arbeiten, lass uns im Interview über Workation sprechen.</li>
</ul>
<p><span data-offset-key="d5d1v-0-0">Damit unsere Stellenanzeigen leichter lesbar sind, verwenden wird im </span><span id="decorator-ignored-entity-id-16" data-entity-key="16" data-offset-key="d5d1v-1-0"><span data-offset-key="d5d1v-1-0">Textverlauf</span></span><span data-offset-key="d5d1v-2-0"> die männliche Form der Anrede. Bei Flip sind alle willkommen ganz </span><span id="decorator-corrected-entity-id-11" data-entity-key="11" data-offset-key="d5d1v-3-0"><span data-offset-key="d5d1v-3-0">egal, welches</span></span><span data-offset-key="d5d1v-4-0"> Geschlecht du hast oder wie alt du bist. Sexuelle Identität, </span><span id="decorator-corrected-entity-id-14" data-entity-key="14" data-offset-key="d5d1v-5-0"><span data-offset-key="d5d1v-5-0">Herkunft, Religion</span></span><span data-offset-key="d5d1v-6-0">, Weltanschauung und Behinderungen spielen keine Rolle. Das Wichtigste ist, dass <strong>DU</strong> zu uns passt!</span></p>
<p> </p></div>