πŸ‡«πŸ‡· Senior Site Reliability Engineer (SRE) - Cloud

Role Overview

As a Senior Site Reliability Engineer at Scalingo, you will lead a small SRE team, ensuring the reliability and performance of the cloud platform. Your responsibilities will include improving SRE practices, managing incidents, and driving automation efforts. This senior role requires a strong technical background and offers the opportunity to influence the company's operational excellence.

Perks & Benefits

This position offers a full remote work setup with one quarterly trip to a designated city. Employees enjoy flexible hours, a telework bonus, and comprehensive health insurance coverage. Scalingo promotes a collaborative culture with a focus on continuous improvement and employee autonomy, supporting career growth towards managerial roles.

Full Job Description

<< This job ad is written in French. << < propos de Scalingo Scalingo est une startup technologique en forte croissance. Notre plateforme cloud europenne, robuste et souveraine, libre les quipes techniques des contraintes d infrastructure, pour leur permettre de se concentrer sur ce qui compte vraiment : crer, innover et dlivrer. Notre PaaS permet de dployer et d hberger facilement des applications web et des bases de donnes, sans avoir grer l administration systme ou l infrastructure sous-jacente. Nous accompagnons une grande diversit de clients startups, scale-ups, grands groupes et institutions publiques parmi lesquels le Ministre de l Intrieur ou ENGIE, avec une exigence leve en matire de fiabilit, de scurit et de qualit de service. < Ton rle chez Scalingo En tant que Senior Site Reliability Engineer, tu occupes une position cl l interface des quipes dveloppement, infrastructure, scurit et support.A terme, nous ennvisageons une volution vers un rle managrial. Ton rle est la fois :

technique, avec un fort impact sur la fiabilit et la performance de la plateforme, structurant, en faisant voluer les pratiques et les outils SRE et audel., fdrateur, en accompagnant et faisant monter en comptence une quipe SRE de 2 personnes.

Tu interviens aussi bien sur le fonctionnement quotidien de l activit SRE que sur les projets stratgiques lis la croissance de la plateforme. Rfrent ou rfrente technique, tu incarnes les bonnes pratiques SRE et contribues diffuser une culture de la fiabilit, de l automatisation et de l excellence oprationnelle au sein de Scalingo. > Pourquoi ce rle est essentiel

Garantir la stabilit, la disponibilit et la rsilience des systmes en production. Anticiper les dfaillances et structurer des rponses efficaces aux incidents. Industrialiser et automatiser l exploitation de la plateforme. Maintenir un haut niveau de qualit de service vis--vis de nos clients et de nos engagements contractuels (SLA).

Chaque amlioration que tu apportes contribue directement la robustesse de la plateforme, la rduction des incidents, la matrise des cots oprationnels et l accompagnement de la croissance de Scalingo. > Organisation & volution Rattach directement un Engineering Manager, tu exerces un leadership technique et oprationnel fort, sans responsabilit hirarchique directe dans un premier temps. moyen terme, nous souhaitons que ce rle volue vers le management hierarchique de l quipe SRE. Si cette perspective t intresse, nous t accompagnerons activement dans ta monte en comptences managriale. Vos missions Leadership technique et animation de l quipe SRE

Encadrer techniquement l quipe SRE au quotidien : accompagnement, priorisation, revue des choix techniques et des implmentations. Guider, former et faire monter en comptence les membres de l quipe, en favorisant l autonomie et la prise d initiative. Transmettre les bonnes pratiques SRE (fiabilit, observabilit, gestion d incidents, automatisation). tre moteur dans l organisation du travail de l quipe (processus, rituels, documentation). Porter la vision technique SRE et la dcliner dans les projets structurants.

Fiabilisation et amlioration continue des services

Analyser les performances, identifier les points de contention et proposer des amliorations pour optimiser l utilisation des ressources et la monte en charge. Dfinir, mettre en place et amliorer les outils d observabilit (monitoring, mtriques, logs, alerting), avec une approche proactive de la dtection d incidents. Rdiger des processus d exploitation, les maintenir et les faire voluer. Assurer une veille technologique continue afin de proposer des volutions pertinentes de l infrastructure.

Gestion des incidents et support

Assurer en partie le support client de niveau 3, en lien avec les quipes support et selon les SLA. Participer activement la gestion des incidents, ainsi qu'aux cycles d'astreintes (environ une demi-semaine toutes les trois semaines). Intervenir rapidement lors des incidents critiques afin d en limiter l impact et d assurer la continuit des services. Piloter et animer les rtrospectives d incidents (post-mortems), en identifiant les causes racines et en dfinissant des actions correctives durables. Rdiger et publier les rapports post-mortem la suite des incidents majeurs. Assurer la coordination et la communication de crise, en interne comme auprs des clients.

Scurit, conformit et continuit d activit

Veiller au respect des engagements de service (SLA, RPO, RTO) sur le primtre SRE. Mettre en place des indicateurs de mesure de la qualit des services (SLO). Contribuer activement la conformit ISO 27001 et HDS : respect des processus, participation aux audits internes et externes. Planifier, excuter et analyser les tests rguliers des dispositifs de continuit et de reprise d activit (PCA/PRA).

Collaboration interne et contribution transverse

Collaborer troitement avec les quipes de dveloppement afin d intgrer les exigences d exploitabilit (fiabilit, performance, scurit oprationnelle) ds la conception. tre force de proposition auprs des quipes produit et techniques sur les sujets de fiabilit, d exprience client et des outils d'administration. Contribuer la rdaction, la structuration et au maintien d une documentation oprationnelle claire et jour.

Vos comptences = Ce que tu sais faire en arrivant :

Une solide expertise des environnements cloud et infrastructures distribues, avec une culture forte de la haute disponibilit et de la fiabilit en production. Une matrise des pratiques d observabilit (logs, mtriques, alerting) et une capacit de diagnostic structure sur des incidents complexes. Une bonne comprhension des environnements conteneuriss et de leurs enjeux oprationnels. Des comptences confirmes en bases de donnes en production : fiabilit, sauvegardes, restauration, rplication et monte en charge. Une pratique de l Infrastructure as Code et de l automatisation des environnements. Une sensibilit aux enjeux de scurit oprationnelle. Une aisance dans l utilisation des outils d Intelligence Artificielle pour gagner en efficacit au quotidien. Une capacit voluer dans des contextes complexes, changeants ou incertains, avec rigueur et fiabilit. Une aisance dans la priorisation, y compris en situation d incident. Une communication claire et structure, un got pour la collaboration transverse et le partage des connaissances. Une posture blameless, de la curiosit technique, du sang-froid et une attention porte l impact utilisateur. Une capacit exercer un leadership technique, transmettre et faire progresser les pratiques collectives.

Avantages

Full remote avec 1 dplacement par trimestre (Strasbourg ou autre ville) Evenments d'entreprise : 1 Offsite annuel et des afterworks rguliers Prime de tltravail (57,60) Ticket Restaurant (11,52 par unit) et carte Swile avec ses avantages Mutuelle prise en charge 100% par Scalingo (BENEFIZ) Horaires flexibles en convention de forfait horaires (RTT) Ordinateur portable sous Linux Budget d'quipements complmentaires (participation)

> Processus de recrutement

Call de pr-qualification (30 min) : nous t appelons pour te prsenter l offre et la clarifier si besoin. C est toi qui dcides si tu souhaites poursuivre l tape suivante. Test de pr-screening (30 min) : un test standardis de type QCM, passer en ligne. Il nous permet d valuer les candidatures de manire objective, en limitant les biais de recrutement. Une note minimale est requise pour passer cette tape. Test hard-skill (quelques heures sur 7 jours) : un test technique raliser et nous restituer la date de ton choix, aprs avoir pris connaissance des consignes. L objectif est d valuer tes comptences, tes habitudes et tes bonnes pratiques en lien avec le poste. Nous t'encouragerons dmontrer que tu sais utiliser le meilleur de l'I.A. Premier entretien structur skill & aptitude fit (1h30) : un change avec les membres de l quipe impliqus dans le recrutement, pour discuter de tes comptences et de ton exprience, et valuer leur adquation avec le poste. Second entretien structur culture fit & confirmation mutuelle (1h30) : un entretien avec un co-fondateur ou un autre membre de l quipe, afin de vrifier des deux cts que nous avons envie de travailler ensemble.

<1 La vie chez Scalingo Chez Scalingo, nous sommes un acteur technologique exigeant, au service aussi bien de startups que de grandes entreprises et d institutions publiques, sans tre une mga-corporation. Cette position nous permet de conjuguer haut niveau d exigence technique, impact concret et environnement de travail taille humaine. Nous cultivons une culture du no bullshit : nous faisons ce que nous disons, nous prenons la responsabilit de nos succs comme de nos checs, et nous privilgions des changes honntes et directs. L amlioration continue fait partie de notre ADN : nous questionnons rgulirement nos produits, nos pratiques et notre organisation pour progresser durablement. Chez Scalingo, nous avanons ensemble. La collaboration, la confiance et le soutien mutuel sont au cSur de notre manire de travailler. Nous vitons les silos et favorisons la transparence par dfaut, afin que chacun puisse comprendre les enjeux, les dcisions et le travail des autres. Nous accordons une grande importance l autonomie et la responsabilit. Chacun est encourag prendre des initiatives, faire des choix clairs et contribuer activement l volution de l entreprise, avec un cadre managrial prsent et un suivi rgulier. Enfin, nous croyons fermement l galit des opportunits. Nous recrutons des personnes avant des CV, valorisons la diversit des parcours et veillons crer un environnement respectueux, inclusif et quitable pour toutes et tous.

Similar jobs

Found 6 similar jobs