Site reliability engineers, or SRE engineers, are coding and software automation experts who optimize information technology (IT) infrastructure and processes. They do this by configuring smart codes, tools and applications that streamline operations and enhance productivity from the beginning to the end of the software development lifecycle (SDLC). Google introduced the SRE engineering role in the early 2000’s to operate at the crossroads between software development and IT operations, or DevOps, and it has been growing in popularity ever since.

 

The SRE role and responsibilities include software automation, monitoring, troubleshooting, problem solving, documentation, and team collaboration. Specifically, the role requires a high level of expertise in writing code to automate processes such as log analysis and testing, while responding to any new DevOps issues that arise. 

 

Automating processes allows the developers to focus on bringing new features quickly to production and reduces the burden on the IT operations team. An SRE engineer applies software engineering principles to ensure reliable and scalable performance of software and IT services. Site reliability engineers regularly work alongside teams of software developers and IT engineers, guiding them along the development.

 

Site reliability engineering is essential for any organization that needs to continuously improve their people, processes, and technology. SREs help teams to transition to a true DevOps culture, offering numerous benefits to increase speed and reliability. Popular job opportunities for site reliability engineers include at major tech companies, for eCommerce companies, or in payments, banking, and medical software development. As technology continues to evolve, so will site reliability engineering. This means, there will be only more opportunities for SRE engineers!

Apply now for a job as a site reliability engineer! 

Reliability Engineer

Location: Groningen

Branche: Industrial Services

Expertise: Operations & Maintenance

Experience: 2 years

Als Reliability Engineer heb jij jouw focus op lange termijn (3-5 year) asset performance, risico’s en kosten.Focus op de lange termijn: Asset prestatie, risico en kosten.Data-analyses en RCA’s op performance killers en cost drivers.RCA’s op grote storingen.Continu verbeteren van installaties en onderhoud hierop.Multidisciplinair change management t.b.v. performance verbeteringen.

Mechanical Engineer

Location: Salzburg

Branche: Biotechnology

Expertise: Engineering & Design

Experience: 1 years

In der Position ist die Erstellung von Basisinformationen für die Planung von Anlagen und die Bereitstellung unterstützender Informationen für Fertigungs- und Montagearbeiten von großer Bedeutung. Sie sind verantwortlich für die Ausarbeitung von Spezifikationen für mechanische Komponenten wie Equipment, Armaturen, Rohrklassen und Sonderteile, und koordiniert gleichzeitig den Stahlbau, einschließlich der Statik, mit sorgfältiger Dokumentation dieser Prozesse. Eine weitere zentrale Aufgabe besteht darin, bei FAT (Factory Acceptance Test) und IBN (Inbetriebnahme) zu unterstützen, um sicherzustellen, dass die Anlagen gemäß höchster Standards funktionieren. Darüber hinaus liegt in Ihrer Zuständigkeit die Erstellung umfassender Handbücher und Dokumentationen, die den Zusammenbau, die Demontage und Wiedermontage von Anlagen sowie die genauen Transportvorschriften abdecken. Ein weiterer wichtiger Aspekt Ihrer Tätigkeiten ist die Entwicklung kundenspezifischer Konzepte, die die Transferwege der Rohrleitungen, Einbringwege und die erfolgreiche Komplettierung der Anlage bzw. die präzise mechanische Fertigstellung sicherstellen. Schließlich unterstützen Sie bei der Projektarbeit und führen eigenständig Arbeitspakete aus, um sicherzustellen, dass die Projekte in höchstem Maße erfolgreich abgeschlossen werden.

Application Engineer (w/m/d)

Location: Osnabrück

Branche: Information Technology

Expertise: IT & Shared Services

Experience: 2 years

Ihre Aufgaben:Implementierung und Verwaltung: Sie übernehmen die Verantwortung für die Implementierung, Konfiguration und Verwaltung von Anwendungen in containerbasierten Umgebungen auf OpenShift.Entwicklung von Helm-Charts/Templates: Sie entwickeln und pflegen Helm-Charts und Templates, um eine effiziente Bereitstellung und Konfiguration von Anwendungen sicherzustellen.Automatisierung und Optimierung: Sie automatisieren Routinetätigkeiten, Betriebsaufgaben und zugehörige Prozesse mittels Python/PowerShell und Automic/GitLab und tragen zur kontinuierlichen Verbesserung bei.DevOps Best Practices: Sie arbeiten nach DevOps Best Practices und fördern die teamübergreifende Zusammenarbeit mit Entwicklern, um eine nahtlose Integration und effiziente Prozesse sicherzustellen.Ihr Profil:Verständnis der Systemarchitektur: Sie besitzen ein tiefes Verständnis der System- und Applikationslandschaft sowie der zugrundeliegenden Architektur.Fachliche Expertise: Sie haben umfassende Kenntnisse über die Funktionalität der Komponenten, Prozesse, Abläufe und deren Abhängigkeiten und können komplexe Veränderungsrisiken selbstständig bewerten und auflösen.Schnittstellen-Kompetenz: Sie verfügen über vertiefte Kenntnisse der Funktionsweisen und Abhängigkeiten von Schnittstellen, Plattformen und Services.Entscheidungsfähigkeit: Sie sind in der Lage, fundierte Entscheidungsvorlagen zu erstellen und diese in Projekten umzusetzen.Projektmanagement: Sie übernehmen eigenständig Projekte, sowohl in der Linie als auch in agilen Projektstrukturen, und führen diese erfolgreich zum Abschluss.

Quality Engineer (w/m/d)

Location: Bremen

Branche: Machine & Plant Design

Expertise: Quality Management

Experience: 3 years

Organisation und Priorisierung der Qualitätsmeldungen / Non-Conformities in der Fertigung Qualität der Beschreibung der Qualitätsmeldung sicherstellen Zusammen mit dem Production Engineering die direkten Auswirkung der Qualitätsmeldung auf den Produktionsfluss analysieren und ad-hoc Maßnahmen definieren Qualitätsmeldung im Sinne eines Projektansatzes abarbeiten, verfolgen und schließen Aktions-Workflow definieren und mit den Verantwortlichen die Lieferdaten und Liefergegenstände vereinbaren In enger Abstimmung mit dem Production Engineering Team die notwendigen Arbeitsaufträge realisieren Abarbeitung der Aktionen verfolgen, und Ergebnisse aktiv einfordern Aktionen ggf. zur Priorisierung eskalieren Ursachenanalyse wo notwendig einleiten

Software Requirements Engineer (m/w/d)

Location: kiel

Branche: Aerospace

Expertise: IT & Shared Services

Experience: 2 years

Als Anforderungsmanager / Requirements Engineer sind Sie mit der Erstellung, Verwaltung und Pflege von Anforderungen auf Produkt- und Komponentenlevel betraut. Hierfür überführen Sie Kundenanforderungen in Produktanforderungen und moderieren Entwicklerteams zur Ableitung von Software- und Hardware-Anforderungen in Abstimmung mit dem Projektleiter, Architekten, Entwickler und Tester. Auch stellen Sie die Rückverfolgbarkeit von Requirements sicher und führen Requirements Reviews durch. Darüber hinaus treiben Sie das Change-Management von bestehenden Anforderungen voran und unterstützen bei Schulungen und Coachings des Entwicklerteams. Zuletzt gestalten und entwickeln Sie Methoden und Prozesse weiter.

Security Engineer Cisco (w/m/d)

Location: Regensburg

Branche: Information Technology

Expertise: IT & Shared Services

Experience: 3 years

Du bist verantwortlich für die Planung, Gestaltung und Umsetzung anspruchsvoller Sicherheitslösungen für unsere Kunden im Mittelstands- und Enterprise-Segment. Du betreust und berätst unsere Kunden, während du gleichzeitig ihre Infrastruktur kontinuierlich weiterentwickelst. Unterstütze den Vertrieb durch präzise Beratung im Vorverkaufsprozess.

Reliability Centered Maintenance Engineer

Location: Doha

Branche: Conventional Energy

Expertise: Planning & Testing

Experience: 5 years

Develop, review, and verify new and existing Equipment Strategies (ES) & PM plans based on Company approved procedures and standards to maximize equipment availability and reliability.Facilitate simple RCM-FMEA sessions with cross functional teams to develop Equipment Criticality (EC) and Equipment Strategy (ES).Communicate and liaise with other Engineering disciplines, Maintenance and Operations to receive guidelines on basic PM tasks and procedures while preparing ES.Prepare and process PMCRs (Preventive Maintenance Change Requests) with all necessary technical documentation to facilitate designated timely approval and SAP implementation as per Company procedures.Monitor the status of PMCR processing based on priority to ensure that the PMCRs are completed in a timely manner.Provide RCM and maintenance engineering support service to stakeholders to confirm equipment strategy is in place for Company and projects.Support maintenance planning & excellence for SAP implementation to ensure all PM plans are in place to mitigate against unreliability.Monitor the quality of implementation of PM in SAP to confirm correct ES are in place with right task lists, work centre, frequency, and schedule.Prepare RCM presentation for asset monthly meetings to report the KPIs and status of PMCRs and key issues during the meetings.Provide coaching and On-Job-Training (OJT) in RCM-FMEA analysis tools and techniques to ensure quality development program for Qatari national graduates.

Requirements Engineer Automotive (m/w/d)

Location: Ingolstadt

Branche: Automotive

Expertise: Research & Development

Experience: 2 years

In dieser Tätigkeit sind Sie verantwortlich für die Durchführung und Erstellung von Analysen, Dokumentationen und Spezifikationen sowie die Sicherstellung der Rückverfolgbarkeit der Anforderungen in Zusammenhang mit ISO 26262 sowie Automotive SPICE. Ebenso beinhaltet Ihre Tätigkeit die Analyse von Lücken und Unterschieden zwischen eigenen und Kundenspezifikationen. Sie stellen die Einhaltung des Requirement Engineering Prozesses sicher und berichten in diesem Zusammenhang an die Requirement Autoren und Owner. Ebenso stellen Sie die Voraussetzungen für die Erstellung und Maintenance der Requirements sicher. Ihre Aufgabe wird abgerundet durch die Koordination mit anderen Usern, Sponsoren und Stakeholdern, um alle technischen Belange abzuklären.

Design Engineer (m/w/d)

Location: Aachen

Branche: Machine & Plant Design

Expertise: Production & Manufacturing

Experience: 2 years

Konstruktion von Verrohrungen für chemische, petrochemische oder pharmazeutische Anlagen Detailkonstruktionen und Ablaufplanung für die interne Fertigung Modell- und Zeichnungserstellung mit Hilfe von E3D (AVEVA) Sicherstellung der Einhaltung von EU und US Normen (EN; ASME) Unterstützung bei der Planung und Umsetzung von Projekten Zusammenarbeit mit internen Abteilungen zur Sicherstellung eines reibungslosen Projektablaufs

Energy Test Engineer (m/w/d)

Location: Ingolstadt

Branche: Automotive

Expertise: Planning & Testing

Experience: 2 years

Your role and your team:You will report directly to the Team Leader Energy Testing and work closely with our Component Testing team.The Component Testing team is responsible for various disciplines involving the testing of components, systems and entire aircraft. It is divided into three departments: Testing, Test Management and Test Operations. Our team performs tests that support certification, development and research in the following technology areas: Propulsion Systems, Batteries, Structures, Environmental Testing and Hardware in the Loop (HIL).You will be the contact person for all battery tests and manage the entire test process from requirements analysis and concept development to test execution and data processing, always keeping the goal of qualification and verification of our aircraft components in mind. You will set up and execute tests of small and large prototypes and provide valuable input to electrical, thermal and mechanical battery engineers as well as production. Your daily work routine: Working with multi-megawatt battery systems Planning of tests and consultation with stakeholders Planning and setting up laboratories and laboratory equipment Working closely with other integration engineers, especially in battery development Analyzing test data and interpreting the results Planning, setting up and maintaining test rooms and equipment Design and operation of test rigs for testing electrical, electrochemical and electromechanical components, including battery abuse testing Testing components for electrical and thermal performance, mechanical, abuse, crash and environmental behavior Coordinating, preparing and conducting tests of battery cells, modules and packs as well as electrical parts and components according to CS-23, DO-160, DO-311 and other standards, internally and with partners Provide critical feedback to relevant stakeholders (suggestions for design changes, process adjustments, software bug fixes, etc.) Support in production planning and end-of-line test setup Work on ad hoc tasks or projects as assigned by management Working with the BMS system and test bench software Preparation of post-mortem analyses and reports

R & D Manager / Engineer (w/m/d)

Location: Mannheim

Branche: Life Sciences

Expertise: HSEQ

Experience: 2 years

Als R&D Manager sind Sie Experte für die bestehende Produktpalette und fungieren als Schnittstelle zwischen Kollegen und Kunden. Darüber hinaus unterstützen Sie intern den Vertrieb bei allen technischen und produktbezogenen Aspekten. Kundenseitig unterstützen Sie bei der Reklamationsbearbeitung. Durch Schulungen unterstützen Sie als Schlüsselfunktion den Aufbau und die Aufrechterhaltung von Produktkenntnissen. Abschließend unterstützen Sie verschiedene Abteilungen bei der Organisation und Durchführung wissenschaftlicher Studien bspw. im Bereich Nachhaltigkeit.

Package Unit Engineer (m/w/d)

Location: Mannheim

Branche: Machine & Plant Design

Expertise: Production & Manufacturing

Experience: 2 years

Sie sind verantwortlich für die technische Abstimmung und Klärung von Details mit externen Lieferanten. Sie tragen die alleinige Verantwortung für die Entwicklung und Umsetzung der Projektziele und stellen sicher, dass diese termingerecht und innerhalb des Budgets erreicht werden. In Ihrer Rolle als Package Unit Engineer kommunizieren Sie mit dem Kunden, dem Projektmanagement sowie anderen Fachabteilungen und sorgen für die reibungslose Abstimmung. Sie überwachen den Projektfortschritt, das Budget, die Termineinhaltung sowie die Qualität der Arbeit und leiten bei Abweichungen geeignete Maßnahmen ein. Sie sind für die Entwicklung und Nachverfolgung wettbewerbsfähiger Package Unit-Konzepte verantwortlich und gewährleisten deren erfolgreiche Umsetzung.

Common site reliability engineer roles and responsibilities

A site reliability engineer is responsible for performing a range of important software engineering tasks. Responsibilities may include:

  • Analyzing DevOps processes and IT architecture for areas of optimization for continuous improvement;
  • Monitoring symptoms documenting every action to automate it through code;
  • Improving operational processes and design, build, and maintain core infrastructure for scaling;
  • Being on-call to respond to incidents that impact product or software availability;
  • Troubleshooting and debugging issues to fix them to ensure high productivity;
  • Preventing incidents from happening;
  • Planning and facilitating IT infrastructure growth;
  • Providing support to, and collaborating with, engineers, developers, and specialists to develop and deploy the codes, tools, and applications in software products;
  • Tracking progress and documenting knowledge and processes;
  • Delivering results in line with agreed SRE engineering project timelines and budgets;
  • Delivering software engineering outputs in compliance with relevant requirements, and in line with customer needs and demands;
  • Leading trainings on software engineering and development as needed.

Qualifications for site reliability engineers

SRE engineers should have at least a Bachelor’s degree in Software Engineering, Computer Science, or related.

 

Additional supporting skills and experience include:

  • 2-4+ years of software engineering experience;
  • Solid understanding of coding, DevOps, and IT infrastructures using programming languages such as Python, Go, or Ruby;
  • Excellent analytical and natural problem-solving skills;
  • Proficiency in using diverse software, including Chef, Ansible, Terraform, SaltStack, GitLab CI/CD, Kubernetes, AWS CloudWatch, NewRelic, PagerDuty, VictorOps, Jira and Trello, and similar;
  • Proven experience in project and team management;
  • Strong verbal and written communication skills to be able to work easily with developers, engineers, and other diverse team members.