Symmetrio

Symmetrio is a top Staffing and Recruiting company in the Philadelphia region, specializing in recruiting qualified full-time candidates, providing staff augmentation services, and offering advisory services to help clients meet their corporate objecti...

Professional Services

Industrials

21 open positions

Links

View All Jobs

Principal Site Reliability Engineer (SRE)

1 month, 2 weeks ago

United States

Full-time

Lead

Site Reliability Engineer (SRE)

DevOps and Infrastructure

Active Directory AWS CI/CD Datadog Django Grafana Kubernetes Python Terraform Windows Server

Apply Now

Symmetrio

Professional Services

View All Jobs 21

Description

Serve as the primary technical owner for production reliability across U.S. customer environments.
Investigate and resolve complex issues across web applications, APIs, backend services, data pipelines, cloud infrastructure, and customer integrations.
Lead production incident response efforts and coordinate cross-functional teams to restore service and reduce customer impact.
Perform root cause analysis and drive corrective actions that improve long-term system stability and resilience.
Partner with software engineering and platform teams to identify recurring reliability risks and implement sustainable solutions.
Design, configure, and validate secure customer connectivity solutions, including Site-to-Site VPNs, Transit Gateway integrations, routing configurations, and secure network paths.
Support customer onboarding by troubleshooting connectivity issues and ensuring consistent implementation processes.
Improve platform observability through monitoring, logging, alerting, tracing, and operational dashboards.
Contribute to CI/CD, infrastructure automation, and deployment processes that improve release safety and operational consistency.
Develop operational tooling for incident response, troubleshooting, onboarding, and system monitoring.
Collaborate with engineering leadership to improve cloud architecture, scalability, security, and operational readiness.
Partner with customer-facing teams to communicate technical issues, remediation plans, and reliability improvements clearly.
Support compliance, security, and risk management initiatives in regulated healthcare environments.

Requirements

6+ years of hands-on experience supporting and managing AWS-based production environments.
4+ years of experience supporting web applications and backend services; Python/Django experience is strongly preferred.
Experience with AWS networking technologies including VPCs, Site-to-Site VPNs, Transit Gateways, routing, NAT gateways, and security groups.
Strong experience with Terraform and infrastructure-as-code deployment practices.
Experience with containerized environments including ECS, Fargate, Kubernetes, or similar technologies.
Experience building and supporting CI/CD pipelines and release automation processes.
Familiarity with monitoring and observability platforms such as Datadog, CloudWatch, Sentry, Grafana, or similar tools.
Experience leading production incidents, outage management, and root cause analysis initiatives.
Exposure to Windows Server environments, Active Directory, Kerberos, and enterprise infrastructure concepts is preferred.
Healthcare technology, healthcare SaaS, clinical software, or other regulated industry experience is highly preferred.
Bachelor’s degree in Computer Science, Engineering, Information Technology, or a related technical field is preferred.

Benefits

Health Care Plan (Medical, Dental & Vision).
Retirement Plan (401k, IRA).
Paid Time Off (Vacation, Sick & Public Holidays).

Interested in this position?

Apply directly on the company website

Apply Now

Similar Roles

SITE RELIABILITY ENGINEER III

Harford County Public Library 51-250 Diversified Consumer Services

Site Reliability Engineer na Stone, atuando no time de Foundation Platform para fortalecer a plataforma interna de tecnologia com foco em observabilidade, automação e estabilidade dos sistemas.

Brazil Full-time Senior Site Reliability Engineer (SRE)

Ansible Argo CD AWS Azure Datadog Docker GCP GitHub Actions Go Grafana Kubernetes Linux Node.js OpenTelemetry Prometheus Python Splunk Terraform

45 minutes ago

Apply

45 minutes ago

Sr. Site Reliability Engineer (Starlink)

SpaceX 10K-50K Aerospace & Defense

SpaceX is hiring a Sr. Site Reliability Engineer for Starlink to improve the reliability, scalability, and performance of the systems supporting its satellite internet service.

United States Full-time Senior Site Reliability Engineer (SRE)

$165k-$265k

Apache Spark C# CI/CD Flink Git Go HDFS Java Kafka Kubernetes Linux Python Scala

1 hour ago

Apply

1 hour ago

Head of Platform Engineering

dLocal 251-1K Diversified Financial Services

dLocal is seeking a senior leader to own its engineering platform, reliability posture, and AI-assisted development transformation across a global payments business serving emerging markets.

Argentina Spain Uruguay Brazil Full-time Lead Platform Engineer Site Reliability Engineer (SRE)

CI/CD Microservices

1 hour, 15 minutes ago

Apply

1 hour, 15 minutes ago

Database Reliability Engineer

Alex Staff Agency 11-50 Professional Services

Senior Database Reliability Engineer for an infrastructure DBA team, responsible for keeping production database services reliable and automating operational work across a multi-database environment.

Poland Armenia Serbia Georgia Spain Greece Full-time Senior Database Administrator Site Reliability Engineer (SRE)

Ansible ClickHouse DNS Grafana Linux MongoDB OpsGenie PostgreSQL Redis Terraform TLS

1 hour, 45 minutes ago

Apply

1 hour, 45 minutes ago

Symmetrio

Tags

Links

Principal Site Reliability Engineer (SRE)

Symmetrio

Description

Requirements

Benefits

Similar Roles

SITE RELIABILITY ENGINEER III

Sr. Site Reliability Engineer (Starlink)

Head of Platform Engineering

Database Reliability Engineer

You're on a roll! Sign up now to keep applying.