Ingénieur fiabilité des infrastructures

1 month ago
Full-time
Senior
DevOps and Infrastructure
Tecsys

Tecsys

Tecsys is a global provider of transformative supply chain solutions, offering innovative warehouse management software and end-to-end visibility for various industries. With a focus on advancing supply chain management since 1983, Tecsys delivers effi...

Air Freight & Logistics
251-1K
Founded 1983
$52M raised

Description

  • Collaborer avec les équipes d’ingénierie pour soutenir les services avant leur mise en service, notamment par la consultation en conception, le développement de plateformes et les revues de lancement.
  • Maintenir les services en production en surveillant la disponibilité, la latence et l’état général du système.
  • Améliorer l’observabilité en optimisant la surveillance et l’alerte avec Datadog et en définissant des SLO/SLI.
  • Créer des tableaux de bord exploitables et mettre en place le signalement des SLA.
  • Développer et faire évoluer l’automatisation avec les outils internes, les cadres IaC et les pipelines CI/CD.
  • Réduire les interventions manuelles et favoriser des systèmes d’auto-réparation.
  • Piloter une gestion durable des incidents et des analyses post-incident sans reproche.
  • Diriger les revues post-incident (RCA) et suivre les correctifs à long terme pour améliorer la stabilité et l’expérience développeur.
  • Créer et maintenir la documentation technique.
  • Agir comme commandant d’incident pour coordonner la réponse interéquipes, les communications et le rétablissement rapide des services.

Requirements

  • Expérience en ingénierie de fiabilité des infrastructures, SRE ou opérations de plateformes dans un environnement SaaS critique.
  • Expérience de travail avec AWS et Kubernetes.
  • Expérience avec Datadog pour la surveillance et l’alerte.
  • Expérience avec Terraform et GitLab CI/CD.
  • Capacité à gérer des incidents, des RCA et des pratiques d’amélioration continue.
  • Solide sens de l’automatisation et de l’ingénierie de la résilience.
  • Disponibilité pour une rotation en cas d’escalade d’incidents.
  • Disponibilité pour des voyages occasionnels, y compris des visites trimestrielles sur site et des conférences, à moins de 10 %.
  • Être citoyen canadien, résident permanent du Canada ou détenir un permis de travail canadien valide.

Benefits

  • Entreprise privilégiant le travail à distance avec flexibilité de travail.
  • Bureaux bien situés et espaces de travail collaboratifs disponibles.
  • Environnement favorisant le bien-être des employés, la productivité et la réduction des trajets domicile-travail.
  • Opportunités d’apprentissage continu.
  • Employeur offrant l’égalité des chances.
  • Accommodements offerts aux candidats sélectionnés pour une entrevue.
  • Processus d’embauche sans filtrage ou rejet automatisé par IA.

Interested in this position?

Apply directly on the company website

Apply Now

Similar Roles

Senior Database Reliability Engineer

Sezzle 251-1K Diversified Financial Services

Sezzle is hiring a Senior Database Reliability Engineer to design, build, and scale the database platform that supports its applications and helps teams use databases more reliably, securely, and efficiently.

AWS CI/CD Datadog Elasticsearch Encryption Git Go Grafana GraphQL Helm Kubernetes Microservices MySQL New Relic OpenTelemetry PostgreSQL Prometheus Python React React Native REST API Secrets Management Terraform TypeScript
3 hours, 49 minutes ago

Senior Manager, Software Engineering

Anduril Industries 1K-5K Aerospace & Defense

Anduril Industries is seeking a Senior Manager to lead CorpTech Platform software teams that build and operate AI-enabled production systems and improve how internal engineering work is designed, shipped, and maintained.

CI/CD Computer Vision ERP LLM Microservices
5 hours, 31 minutes ago

Senior Site Reliability Engineer - AWS

Filevine 251-1K Specialized Consumer Services

Filevine is hiring a Senior Site Reliability Engineer to embed with cross-functional teams and improve the reliability, automation, and scalability of its AWS-based legal technology platform.

AWS Bash CI/CD EC2 Kubernetes PowerShell Python
5 hours, 49 minutes ago

Senior Database Reliability Engineer

Sezzle 251-1K Diversified Financial Services

Sezzle is hiring a Senior Database Reliability Engineer to design, build, and scale the shared database platform and reliability controls that support its applications across production and development environments.

AWS CI/CD Datadog Elasticsearch Encryption Git Go Grafana Helm Kubernetes Microservices MySQL New Relic OpenTelemetry PostgreSQL Prometheus Python React React Native REST API Secrets Management Terraform TypeScript
7 hours, 55 minutes ago

You're on a roll! Sign up now to keep applying.

Sign Up

Already have an account? Log in

Used by 14,729+ remote workers