Site Reliability Engineer (SRE)

Introduction

Le Site Reliability Engineer (SRE) est un professionnel chargé de garantir la fiabilité, la disponibilité et la performance des systèmes informatiques d'une entreprise. Il combine des compétences en développement logiciel et en opérations système pour concevoir, mettre en œuvre et maintenir des solutions évolutives et résilientes.

Compétences requises

  • Maîtrise des langages de programmation courants tels que Python, Go, ou Java
  • Connaissance approfondie des systèmes d'exploitation Linux/Unix
  • Expérience en automatisation et en infrastructure en tant que code (IaC) avec des outils tels que Terraform, Ansible, ou Puppet
  • Compréhension des principes de l'architecture distribuée et du design des services
  • Compétences en débogage et en résolution de problèmes complexes à grande échelle
  • Capacité à gérer et à surveiller les performances des applications et des infrastructures
  • Compétences en gestion de la capacité, de la scalabilité et de la résilience des systèmes

Expérience requise

Formation

Stacks possibles

  • Outils de gestion de la configuration : Ansible, Puppet, Chef
  • Technologies de conteneurisation : Docker, Kubernetes
  • Plateformes cloud : AWS, Azure, Google Cloud
  • Outils de surveillance et de monitoring : Prometheus, Grafana, ELK Stack
  • Langages de scripting et d'automatisation : Python, Bash

Métiers associés:

Vous cherchez un nouveau job?

  1. Inscrivez-vous sur notre plateforme
  2. Completez votre profils et indiquez vous critères de recherche
  3. Echangez avec votre Talents Manager pour valider votre compte
  4. changez avec nos entreprises qui recrutent
  5. Validez le poste qui vous correspond