S

🇫🇷 Senior Site Reliability Engineer (SRE) - Cloud

Scalingo
Full-time
Remote
Worldwide
IT/Tech

🇫🇷 This job ad is written in French. 🇫🇷

🌍 À propos de Scalingo

Scalingo est une startup technologique en forte croissance. Notre plateforme cloud européenne, robuste et souveraine, libère les équipes techniques des contraintes d’infrastructure, pour leur permettre de se concentrer sur ce qui compte vraiment : créer, innover et délivrer.

Notre PaaS permet de déployer et d’héberger facilement des applications web et des bases de données, sans avoir à gérer l’administration système ou l’infrastructure sous-jacente.

Nous accompagnons une grande diversité de clients — startups, scale-ups, grands groupes et institutions publiques — parmi lesquels le Ministère de l’Intérieur ou ENGIE, avec une exigence élevée en matière de fiabilité, de sécurité et de qualité de service.

🎯 Ton rôle chez Scalingo

En tant que Senior Site Reliability Engineer, tu occupes une position clé à l’interface des équipes développement, infrastructure, sécurité et support.
A terme, nous ennvisageons une évolution vers un rôle managérial.

Ton rĂ´le est Ă  la fois :

  • technique, avec un fort impact sur la fiabilitĂ© et la performance de la plateforme,
  • structurant, en faisant Ă©voluer les pratiques et les outils SRE et audelĂ .,
  • fĂ©dĂ©rateur, en accompagnant et faisant monter en compĂ©tence une Ă©quipe SRE de 2 personnes.

Tu interviens aussi bien sur le fonctionnement quotidien de l’activité SRE que sur les projets stratégiques liés à la croissance de la plateforme. Référent ou référente technique, tu incarnes les bonnes pratiques SRE et contribues à diffuser une culture de la fiabilité, de l’automatisation et de l’excellence opérationnelle au sein de Scalingo.

đź§© Pourquoi ce rĂ´le est essentiel

  • Garantir la stabilitĂ©, la disponibilitĂ© et la rĂ©silience des systèmes en production.
  • Anticiper les dĂ©faillances et structurer des rĂ©ponses efficaces aux incidents.
  • Industrialiser et automatiser l’exploitation de la plateforme.
  • Maintenir un haut niveau de qualitĂ© de service vis-Ă -vis de nos clients et de nos engagements contractuels (SLA).

Chaque amélioration que tu apportes contribue directement à la robustesse de la plateforme, à la réduction des incidents, à la maîtrise des coûts opérationnels et à l’accompagnement de la croissance de Scalingo.

🤝 Organisation & évolution

Rattaché directement à un Engineering Manager, tu exerces un leadership technique et opérationnel fort, sans responsabilité hiérarchique directe dans un premier temps.

À moyen terme, nous souhaitons que ce rôle évolue vers le management hierarchique de l’équipe SRE. Si cette perspective t’intéresse, nous t’accompagnerons activement dans ta montée en compétences managériale.

Vos missions

Leadership technique et animation de l’équipe SRE

  • Encadrer techniquement l’équipe SRE au quotidien : accompagnement, priorisation, revue des choix techniques et des implĂ©mentations.
  • Guider, former et faire monter en compĂ©tence les membres de l’équipe, en favorisant l’autonomie et la prise d’initiative.
  • Transmettre les bonnes pratiques SRE (fiabilitĂ©, observabilitĂ©, gestion d’incidents, automatisation).
  • ĂŠtre moteur dans l’organisation du travail de l’équipe (processus, rituels, documentation).
  • Porter la vision technique SRE et la dĂ©cliner dans les projets structurants.

Fiabilisation et amélioration continue des services

  • Analyser les performances, identifier les points de contention et proposer des amĂ©liorations pour optimiser l’utilisation des ressources et la montĂ©e en charge.
  • DĂ©finir, mettre en place et amĂ©liorer les outils d’observabilitĂ© (monitoring, mĂ©triques, logs, alerting), avec une approche proactive de la dĂ©tection d’incidents.
  • RĂ©diger des processus d’exploitation, les maintenir et les faire Ă©voluer.
  • Assurer une veille technologique continue afin de proposer des Ă©volutions pertinentes de l’infrastructure.

Gestion des incidents et support

  • Assurer en partie le support client de niveau 3, en lien avec les Ă©quipes support et selon les SLA.
  • Participer activement Ă  la gestion des incidents, ainsi qu'aux cycles d'astreintes (environ une demi-semaine toutes les trois semaines).
  • Intervenir rapidement lors des incidents critiques afin d’en limiter l’impact et d’assurer la continuitĂ© des services.
  • Piloter et animer les rĂ©trospectives d’incidents (post-mortems), en identifiant les causes racines et en dĂ©finissant des actions correctives durables.
  • RĂ©diger et publier les rapports post-mortem Ă  la suite des incidents majeurs.
  • Assurer la coordination et la communication de crise, en interne comme auprès des clients.

Sécurité, conformité et continuité d’activité

  • Veiller au respect des engagements de service (SLA, RPO, RTO) sur le pĂ©rimètre SRE.
  • Mettre en place des indicateurs de mesure de la qualitĂ© des services (SLO).
  • Contribuer activement Ă  la conformitĂ© ISO 27001 et HDS : respect des processus, participation aux audits internes et externes.
  • Planifier, exĂ©cuter et analyser les tests rĂ©guliers des dispositifs de continuitĂ© et de reprise d’activitĂ© (PCA/PRA).

Collaboration interne et contribution transverse

  • Collaborer Ă©troitement avec les Ă©quipes de dĂ©veloppement afin d’intĂ©grer les exigences d’exploitabilitĂ© (fiabilitĂ©, performance, sĂ©curitĂ© opĂ©rationnelle) dès la conception.
  • ĂŠtre force de proposition auprès des Ă©quipes produit et techniques sur les sujets de fiabilitĂ©, d’expĂ©rience client et des outils d'administration.
  • Contribuer Ă  la rĂ©daction, Ă  la structuration et au maintien d’une documentation opĂ©rationnelle claire et Ă  jour.
Vos compétences

🔎 Ce que tu sais faire en arrivant :

  • Une solide expertise des environnements cloud et infrastructures distribuĂ©es, avec une culture forte de la haute disponibilitĂ© et de la fiabilitĂ© en production.
  • Une maĂ®trise des pratiques d’observabilitĂ© (logs, mĂ©triques, alerting) et une capacitĂ© de diagnostic structurĂ©e sur des incidents complexes.
  • Une bonne comprĂ©hension des environnements conteneurisĂ©s et de leurs enjeux opĂ©rationnels.
  • Des compĂ©tences confirmĂ©es en bases de donnĂ©es en production : fiabilitĂ©, sauvegardes, restauration, rĂ©plication et montĂ©e en charge.
  • Une pratique de l’Infrastructure as Code et de l’automatisation des environnements.
  • Une sensibilitĂ© aux enjeux de sĂ©curitĂ© opĂ©rationnelle.
  • Une aisance dans l’utilisation des outils d’Intelligence Artificielle pour gagner en efficacitĂ© au quotidien.
  • Une capacitĂ© Ă  Ă©voluer dans des contextes complexes, changeants ou incertains, avec rigueur et fiabilitĂ©.
  • Une aisance dans la priorisation, y compris en situation d’incident.
  • Une communication claire et structurĂ©e, un goĂ»t pour la collaboration transverse et le partage des connaissances.
  • Une posture blameless, de la curiositĂ© technique, du sang-froid et une attention portĂ©e Ă  l’impact utilisateur.
  • Une capacitĂ© Ă  exercer un leadership technique, Ă  transmettre et Ă  faire progresser les pratiques collectives.
Avantages
  • Full remote avec 1 dĂ©placement par trimestre (Strasbourg ou autre ville)
  • EvenĂ©ments d'entreprise : 1 Offsite annuel et des afterworks rĂ©guliers
  • Prime de tĂ©lĂ©travail (57,60€)
  • Ticket Restaurant (11,52 € par unitĂ©) et carte Swile avec ses avantages
  • Mutuelle prise en charge Ă  100% par Scalingo (BENEFIZ)
  • Horaires flexibles en convention de forfait horaires (RTT)
  • Ordinateur portable sous Linux
  • Budget d'Ă©quipements complĂ©mentaires (participation)

đź§­ Processus de recrutement

  • Call de prĂ©-qualification (30 min) : nous t’appelons pour te prĂ©senter l’offre et la clarifier si besoin. C’est toi qui dĂ©cides si tu souhaites poursuivre l’étape suivante.
  • Test de prĂ©-screening (30 min) : un test standardisĂ© de type QCM, Ă  passer en ligne. Il nous permet d’évaluer les candidatures de manière objective, en limitant les biais de recrutement. Une note minimale est requise pour passer cette Ă©tape.
  • Test hard-skill (quelques heures sur 7 jours) : un test technique Ă  rĂ©aliser et Ă  nous restituer Ă  la date de ton choix, après avoir pris connaissance des consignes. L’objectif est d’évaluer tes compĂ©tences, tes habitudes et tes bonnes pratiques en lien avec le poste. Nous t'encouragerons Ă  dĂ©montrer que tu sais utiliser le meilleur de l'I.A.
  • Premier entretien structurĂ© – skill & aptitude fit (1h30) : un Ă©change avec les membres de l’équipe impliquĂ©s dans le recrutement, pour discuter de tes compĂ©tences et de ton expĂ©rience, et Ă©valuer leur adĂ©quation avec le poste.
  • Second entretien structurĂ© – culture fit & confirmation mutuelle (1h30) : un entretien avec un co-fondateur ou un autre membre de l’équipe, afin de vĂ©rifier des deux cĂ´tĂ©s que nous avons envie de travailler ensemble.

🌱 La vie chez Scalingo

Chez Scalingo, nous sommes un acteur technologique exigeant, au service aussi bien de startups que de grandes entreprises et d’institutions publiques, sans être une méga-corporation. Cette position nous permet de conjuguer haut niveau d’exigence technique, impact concret et environnement de travail à taille humaine.

Nous cultivons une culture du no bullshit : nous faisons ce que nous disons, nous prenons la responsabilité de nos succès comme de nos échecs, et nous privilégions des échanges honnêtes et directs. L’amélioration continue fait partie de notre ADN : nous questionnons régulièrement nos produits, nos pratiques et notre organisation pour progresser durablement.

Chez Scalingo, nous avançons ensemble. La collaboration, la confiance et le soutien mutuel sont au cœur de notre manière de travailler. Nous évitons les silos et favorisons la transparence par défaut, afin que chacun puisse comprendre les enjeux, les décisions et le travail des autres.

Nous accordons une grande importance à l’autonomie et à la responsabilité. Chacun est encouragé à prendre des initiatives, à faire des choix éclairés et à contribuer activement à l’évolution de l’entreprise, avec un cadre managérial présent et un suivi régulier.

Enfin, nous croyons fermement à l’égalité des opportunités. Nous recrutons des personnes avant des CV, valorisons la diversité des parcours et veillons à créer un environnement respectueux, inclusif et équitable pour toutes et tous.

Apply now
Share this job