Site reliability engineers, or SRE engineers, are coding and software automation experts who optimize information technology (IT) infrastructure and processes. They do this by configuring smart codes, tools and applications that streamline operations and enhance productivity from the beginning to the end of the software development lifecycle (SDLC). Google introduced the SRE engineering role in the early 2000’s to operate at the crossroads between software development and IT operations, or DevOps, and it has been growing in popularity ever since.

 

The SRE role and responsibilities include software automation, monitoring, troubleshooting, problem solving, documentation, and team collaboration. Specifically, the role requires a high level of expertise in writing code to automate processes such as log analysis and testing, while responding to any new DevOps issues that arise. 

 

Automating processes allows the developers to focus on bringing new features quickly to production and reduces the burden on the IT operations team. An SRE engineer applies software engineering principles to ensure reliable and scalable performance of software and IT services. Site reliability engineers regularly work alongside teams of software developers and IT engineers, guiding them along the development.

 

Site reliability engineering is essential for any organization that needs to continuously improve their people, processes, and technology. SREs help teams to transition to a true DevOps culture, offering numerous benefits to increase speed and reliability. Popular job opportunities for site reliability engineers include at major tech companies, for eCommerce companies, or in payments, banking, and medical software development. As technology continues to evolve, so will site reliability engineering. This means, there will be only more opportunities for SRE engineers!

Apply now for a job as a site reliability engineer! 

Reliability Engineer

Location: Groningen

Branche: Industrial Services

Expertise: Operations & Maintenance

Experience: 2 years

Als Reliability Engineer heb jij jouw focus op lange termijn (3-5 year) asset performance, risico’s en kosten.Focus op de lange termijn: Asset prestatie, risico en kosten.Data-analyses en RCA’s op performance killers en cost drivers.RCA’s op grote storingen.Continu verbeteren van installaties en onderhoud hierop.Multidisciplinair change management t.b.v. performance verbeteringen.

Reverse Engineer / Service Engineer (w/m/d)

Location: Mannheim

Branche: Aerospace

Expertise: Planning & Testing

Experience: 1 years

Begutachtung von Schäden an Teilen und Baugruppen von Turbomaschinen Erstellung von Befundberichten und Mengengerüsten als Grundlage für Reparaturangebote Erstellung aller für Reparaturarbeiten in den Werkstätten erforderlichen Unterlagen, Stücklisten und Zeichnungen Sicherstellung der Arbeitssicherheitsanforderungen in der Befund- und Reparaturphase Technische Vertriebsunterstützung

Design Engineer (m/w/d)

Location: Aachen

Branche: Machine & Plant Design

Expertise: Production & Manufacturing

Experience: 2 years

Konstruktion von Verrohrungen für chemische, petrochemische oder pharmazeutische Anlagen Detailkonstruktionen und Ablaufplanung für die interne Fertigung Modell- und Zeichnungserstellung mit Hilfe von E3D (AVEVA) Sicherstellung der Einhaltung von EU und US Normen (EN; ASME) Unterstützung bei der Planung und Umsetzung von Projekten Zusammenarbeit mit internen Abteilungen zur Sicherstellung eines reibungslosen Projektablaufs

Mechanical Engineer

Location: Salzburg

Branche: Biotechnology

Expertise: Engineering & Design

Experience: 1 years

In der Position ist die Erstellung von Basisinformationen für die Planung von Anlagen und die Bereitstellung unterstützender Informationen für Fertigungs- und Montagearbeiten von großer Bedeutung. Sie sind verantwortlich für die Ausarbeitung von Spezifikationen für mechanische Komponenten wie Equipment, Armaturen, Rohrklassen und Sonderteile, und koordiniert gleichzeitig den Stahlbau, einschließlich der Statik, mit sorgfältiger Dokumentation dieser Prozesse. Eine weitere zentrale Aufgabe besteht darin, bei FAT (Factory Acceptance Test) und IBN (Inbetriebnahme) zu unterstützen, um sicherzustellen, dass die Anlagen gemäß höchster Standards funktionieren. Darüber hinaus liegt in Ihrer Zuständigkeit die Erstellung umfassender Handbücher und Dokumentationen, die den Zusammenbau, die Demontage und Wiedermontage von Anlagen sowie die genauen Transportvorschriften abdecken. Ein weiterer wichtiger Aspekt Ihrer Tätigkeiten ist die Entwicklung kundenspezifischer Konzepte, die die Transferwege der Rohrleitungen, Einbringwege und die erfolgreiche Komplettierung der Anlage bzw. die präzise mechanische Fertigstellung sicherstellen. Schließlich unterstützen Sie bei der Projektarbeit und führen eigenständig Arbeitspakete aus, um sicherzustellen, dass die Projekte in höchstem Maße erfolgreich abgeschlossen werden.

Reliability Centered Maintenance Engineer

Location: Doha

Branche: Conventional Energy

Expertise: Planning & Testing

Experience: 5 years

Develop, review, and verify new and existing Equipment Strategies (ES) & PM plans based on Company approved procedures and standards to maximize equipment availability and reliability.Facilitate simple RCM-FMEA sessions with cross functional teams to develop Equipment Criticality (EC) and Equipment Strategy (ES).Communicate and liaise with other Engineering disciplines, Maintenance and Operations to receive guidelines on basic PM tasks and procedures while preparing ES.Prepare and process PMCRs (Preventive Maintenance Change Requests) with all necessary technical documentation to facilitate designated timely approval and SAP implementation as per Company procedures.Monitor the status of PMCR processing based on priority to ensure that the PMCRs are completed in a timely manner.Provide RCM and maintenance engineering support service to stakeholders to confirm equipment strategy is in place for Company and projects.Support maintenance planning & excellence for SAP implementation to ensure all PM plans are in place to mitigate against unreliability.Monitor the quality of implementation of PM in SAP to confirm correct ES are in place with right task lists, work centre, frequency, and schedule.Prepare RCM presentation for asset monthly meetings to report the KPIs and status of PMCRs and key issues during the meetings.Provide coaching and On-Job-Training (OJT) in RCM-FMEA analysis tools and techniques to ensure quality development program for Qatari national graduates.

Software Engineer (f/m/x)

Location: Kaiserslautern

Branche: Information Technology

Expertise: IT & Shared Services

Experience: 1 years

Contribute to the creation of software design by analyzing software requirements Develop and implement embedded software solutions tailored for display and embedded controller applications Ensure the delivery of high-quality and reliable software by performing comprehensive software testing, including unit testing Collaborate closely with the Systems and Product Verification and Validation teams to deliver integrated software solutions that meet the highest quality standards

Operations Engineer (m/w/d)

Location: Berlin, Deutschland

Branche: Infrastructure

Expertise: IT & Shared Services

Experience: 2 years

Übernahme der Verantwortung für gemeldete Kundenprobleme und deren Nachverfolgung bis zur endgültigen Lösung Untersuchung und Diagnose von Problemen in den Services sowie Erarbeitung geeigneter Lösungen Sicherstellung der Einhaltung der festgelegten Eskalationsprozesse bei ungelösten Problemen und deren Weiterleitung an zuständige interne Teams Überwachung von SLO-Alarme und Überprüfung von Fehlerbudgets Management des Incident-Response-Flows, insbesondere im Hinblick auf die verwendeten Anwendungen Identifizierung und Umsetzung von Automatisierungsmöglichkeiten zur Effizienzsteigerung Bearbeitung und Lösung offener Support-Tickets unter Einhaltung der festgelegten SLA Koordination mit verschiedenen Stakeholdern zur Durchführung von blameless Post-Mortems

Quality Engineer (w/m/d)

Location: Cuxhaven

Branche: Machine & Plant Design

Expertise: Quality Management

Experience: 3 years

Organisation und Priorisierung der Qualitätsmeldungen / Non-Conformities in der Fertigung Qualität der Beschreibung der Qualitätsmeldung sicherstellen Zusammen mit dem Production Engineering die direkten Auswirkung der Qualitätsmeldung auf den Produktionsfluss analysieren und ad-hoc Maßnahmen definieren Qualitätsmeldung im Sinne eines Projektansatzes abarbeiten, verfolgen und schließen Aktions-Workflow definieren und mit den Verantwortlichen die Lieferdaten und Liefergegenstände vereinbaren In enger Abstimmung mit dem Production Engineering Team die notwendigen Arbeitsaufträge realisieren Abarbeitung der Aktionen verfolgen, und Ergebnisse aktiv einfordern Aktionen ggf. zur Priorisierung eskalieren Ursachenanalyse wo notwendig einleiten

DevOps Engineer (m/w/d)

Location: Aachen

Branche: BMK1,BMB3

Expertise: Software Development & Application Management

Experience: 2 years

Aufbau und Betreuung der CI / CD-Infrastruktur Aufbau von geeigneten Tools nach CI / CD-Standards Begleitung und Betreuung von Software Release-Prozessen Enge Zusammenarbeit mit dem Entwicklungsteam Entwicklung nach agilen Methoden

Requirements Engineer (w/m/d)

Location: Regensburg

Branche: BMK1,BMB3

Expertise: Project management

Experience: 2 years

Unterstützung des Anforderungsmanagers bei der Analyse, Koordination und Verfolgung von Projektanforderungsaktivitäten in der Organisation Aktualisieren von Dokumentationen im Änderungsmanagement-Tool Erstellen von Statusberichten Organisieren von Requirement Object Reviews in Vorbereitung der Projektmeilensteine Teilnahme an internen Meetings zum Änderungsmanagement (CCB) Analyse der Ereigniskette

Energy Test Engineer (m/w/d)

Location: Ingolstadt

Branche: Automotive

Expertise: Planning & Testing

Experience: 2 years

Your daily work routine: Working with multi-megawatt battery systems Planning of tests and consultation with stakeholders Planning and setting up laboratories and laboratory equipment Working closely with other integration engineers, especially in battery development Analyzing test data and interpreting the results Planning, setting up and maintaining test rooms and equipment Design and operation of test rigs for testing electrical, electrochemical and electromechanical components, including battery abuse testing Testing components for electrical and thermal performance, mechanical, abuse, crash and environmental behavior Coordinating, preparing and conducting tests of battery cells, modules and packs as well as electrical parts and components according to CS-23, DO-160, DO-311 and other standards, internally and with partners Provide critical feedback to relevant stakeholders (suggestions for design changes, process adjustments, software bug fixes, etc.) Support in production planning and end-of-line test setup Work on ad hoc tasks or projects as assigned by management Working with the BMS system and test bench software Preparation of post-mortem analyses and reports Brunel International N.V. is acting as an Employment Agency in relation to this vacancy.

Supplier Quality Engineer (w/m/d)

Location: Saarbrücken

Branche: Machine & Plant Design

Expertise: Quality Management

Experience: 2 years

Als Supplier Quality Engineer verantworten Sie die Qualitätsvorausplanung / APQP - von der frühen Produktentwicklung bis hin zur Serienreife und Erstbemusterung von komplexen Komponenten und Bauteilen im Automotive-Umfeld. Sie bestimmen Qualitätsziele und überprüfen diese fortlaufend. Gegebenenfalls leiten Sie gekonnt notwendige Korrekturmaßnahmen ein. Auch die Bearbeitung und Freigabe von Erstmustern sowie das Kunden- und Lieferantenmanagement liegen in Ihrem Aufgabenbereich. In Ihrer Rolle führen Sie Lieferantenaudits (z.B. VDA 6.3) und Prozessfreigaben durch und definieren Maßnahmen. Sie arbeiten eng mit internen Abteilungen, wie dem Einkauf oder der Qualitätssicherung, zusammen.

Common site reliability engineer roles and responsibilities

A site reliability engineer is responsible for performing a range of important software engineering tasks. Responsibilities may include:

  • Analyzing DevOps processes and IT architecture for areas of optimization for continuous improvement;
  • Monitoring symptoms documenting every action to automate it through code;
  • Improving operational processes and design, build, and maintain core infrastructure for scaling;
  • Being on-call to respond to incidents that impact product or software availability;
  • Troubleshooting and debugging issues to fix them to ensure high productivity;
  • Preventing incidents from happening;
  • Planning and facilitating IT infrastructure growth;
  • Providing support to, and collaborating with, engineers, developers, and specialists to develop and deploy the codes, tools, and applications in software products;
  • Tracking progress and documenting knowledge and processes;
  • Delivering results in line with agreed SRE engineering project timelines and budgets;
  • Delivering software engineering outputs in compliance with relevant requirements, and in line with customer needs and demands;
  • Leading trainings on software engineering and development as needed.

Qualifications for site reliability engineers

SRE engineers should have at least a Bachelor’s degree in Software Engineering, Computer Science, or related.

 

Additional supporting skills and experience include:

  • 2-4+ years of software engineering experience;
  • Solid understanding of coding, DevOps, and IT infrastructures using programming languages such as Python, Go, or Ruby;
  • Excellent analytical and natural problem-solving skills;
  • Proficiency in using diverse software, including Chef, Ansible, Terraform, SaltStack, GitLab CI/CD, Kubernetes, AWS CloudWatch, NewRelic, PagerDuty, VictorOps, Jira and Trello, and similar;
  • Proven experience in project and team management;
  • Strong verbal and written communication skills to be able to work easily with developers, engineers, and other diverse team members.