Site Reliability Engineer Expérimenté CDI H/F chez ALTEN
En tant que Site Reliability Engineer (SRE), vous jouerez un rôle clé dans le maintien, l’optimisation et la sécurisation des infrastructures informatiques et des systèmes de production. Vous travaillerez en collaboration avec les équipes de développement, d’infrastructure et d’opérations pour garantir une disponibilité et une résilience maximales des services et applications critiques.Missions principales :- Maintien en conditions opérationnelles des systèmes et des applications en production, en optimisant leur disponibilité, performance et évolutivité.- Automatisation des tâches répétitives et des processus de déploiement, de surveillance et d’alerting.- Conception et mise en oeuvre de solutions permettant d’améliorer la fiabilité des systèmes et de réduire le taux de pannes.- Analyse des incidents et gestion des urgences, avec pour objectif de diminuer le Mean Time To Recovery (MTTR) et d’accroître la résilience.- Optimisation des performances des applications et de l’infrastructure, notamment via la gestion des capacités et des coûts.- Collaboration avec les équipes de développement pour favoriser une approche DEVOPS et intégrer les pratiques SRE dès les phases de conception.- Création et suivi de métriques pour mesurer la fiabilité et les performances des systèmes (SLI, SLO, SLA).- Veille technologique pour assurer l’amélioration continue des outils et des processus SRE.