Senior AWS DevOps Engineer (Remoto)

IT · Remoto

Inscribirme

Descripción

En Vermont Solutions buscamos un/a Senior AWS DevOps Engineer para liderar la evolución operativa y estratégica de una plataforma cloud empresarial basada íntegramente en AWS.

Esta posición tendrá un papel fundamental en la definición de la visión técnica del área de SRE, impulsando iniciativas de automatización, resiliencia, optimización de costes y mejora continua, además de coordinar técnicamente equipos multidisciplinares responsables de la operación y evolución de la plataforma.

Si buscas un reto donde combinar liderazgo técnico, estrategia cloud y excelencia operativa en un entorno internacional, esta oportunidad es para ti.


🛠️ Responsabilidades


Definir y liderar la estrategia de Cloud Operations y Site Reliability Engineering para garantizar una plataforma altamente disponible, segura, escalable y eficiente, alineando las necesidades operativas con los objetivos tecnológicos y de negocio de la organización.


Liderazgo Técnico y Estrategia SRE

  • Definir la visión técnica y la hoja de ruta del equipo de Cloud Operations y SRE.
  • Liderar iniciativas estratégicas orientadas a mejorar la fiabilidad, resiliencia y escalabilidad de la plataforma.
  • Establecer estándares, mejores prácticas y modelos operativos para entornos cloud empresariales.
  • Actuar como principal referente técnico para decisiones relacionadas con infraestructura, operaciones y automatización.


Cloud Operations & Platform Reliability

  • Liderar la gestión operativa de infraestructuras AWS de misión crítica.
  • Garantizar altos niveles de disponibilidad, rendimiento y resiliencia de los servicios.
  • Impulsar la mejora continua de la observabilidad, monitorización y gestión proactiva de eventos.
  • Definir e implementar estrategias de capacidad, escalabilidad y continuidad operativa.


Advanced Incident Management

  • Liderar la gestión de incidentes críticos y situaciones de alta severidad.
  • Coordinar la respuesta ante incidencias complejas en colaboración con equipos de ingeniería, soporte y negocio.
  • Realizar análisis de causa raíz (Root Cause Analysis) y definir planes de mejora permanentes.
  • Impulsar la reducción del riesgo operativo mediante automatización y optimización de procesos.


Infrastructure as Code & Automation

  • Definir la estrategia de automatización de infraestructura y operaciones.
  • Supervisar el diseño y evolución de soluciones Infrastructure as Code (IaC).
  • Promover el uso de Terraform, GitHub Actions y herramientas de automatización para minimizar tareas manuales y mejorar la eficiencia operativa.
  • Liderar iniciativas de Platform Engineering y automatización avanzada.


CI/CD & Cloud Platform Engineering

  • Supervisar la estrategia de despliegue continuo y automatización de pipelines.
  • Garantizar procesos de entrega seguros, fiables y escalables.
  • Colaborar con equipos de desarrollo para mejorar la eficiencia de los ciclos de entrega y operación.


Gestión de Costes y Optimización

  • Liderar iniciativas de optimización de costes cloud (FinOps).
  • Analizar patrones de consumo y proponer mejoras en el uso de recursos.
  • Garantizar el equilibrio entre rendimiento, disponibilidad y eficiencia económica.
  • Impulsar una cultura de optimización continua en la gestión de infraestructuras AWS.


Colaboración y Liderazgo Organizacional

  • Trabajar estrechamente con equipos de Engineering, Security, Support, Platform y Application Owners.
  • Asegurar la alineación entre la estrategia técnica y los objetivos operativos del negocio.
  • Facilitar la toma de decisiones técnicas transversales.
  • Mentorar y desarrollar a ingenieros SRE y Cloud Operations, promoviendo el crecimiento del equipo.


✅ Requisitos


Experiencia y Conocimientos Técnicos

  • Experiencia sólida liderando equipos o funciones de Cloud Operations, SRE o Platform Engineering.
  • Conocimiento avanzado de arquitecturas AWS empresariales.
  • Experiencia extensiva en:
  • AWS Landing Zone (LZ)
  • AWS Direct Connect
  • AWS Organizations
  • Service Control Policies (SCPs)
  • Experiencia avanzada en:
  • Amazon EKS
  • Kubernetes
  • CI/CD
  • Operación de plataformas cloud a gran escala
  • Dominio de Infrastructure as Code:
  • Terraform
  • GitHub Actions
  • Automatización de infraestructura y operaciones


Site Reliability Engineering

  • Experiencia liderando procesos de monitorización avanzada y observabilidad.
  • Gestión de incidentes de alta criticidad.
  • Root Cause Analysis.
  • Definición de métricas de fiabilidad y disponibilidad.
  • Gestión de plataformas altamente resilientes y escalables.


Herramientas y Procesos

  • Experiencia en herramientas de gestión de incidencias y operación:
  • ServiceNow (SNOW)
  • Jira
  • Gestión y optimización de pipelines CI/CD.
  • Liderazgo de iniciativas de automatización y mejora operativa.


Liderazgo

  • Experiencia demostrable liderando equipos técnicos o funciones transversales.
  • Capacidad para definir visión técnica y estrategias de infraestructura.
  • Excelentes habilidades de comunicación, influencia y gestión de stakeholders.
  • Capacidad para coordinar iniciativas complejas en entornos internacionales.


Idiomas

  • Inglés mínimo B2 (imprescindible).
  • Nivel C1 altamente recomendable para la interacción con equipos internacionales y stakeholders globales.


🎁 ¿Qué ofrecemos?


En Vermont Solutions, creemos que trabajar debe ser divertido y satisfactorio. Aquí tienes algunas de las ventajas de unirte a nuestro equipo:


  • Plan de Formación y certificaciones técnicas.
  • Desarrollo profesional y plan de carrera definido.
  • Flexibilidad horaria
  • Plan de retribución flexible acorde a tus necesidades (seguro médico privado, cheques formación para estudiar idiomas, cheques guardería, tarjeta transporte...).
  • Modelo de gestión sostenible y políticas de igualdad efectiva, ambientes de trabajo abiertos e inclusivos.


Si buscas un nuevo proyecto, ¡en Vermont Solutions estamos deseando conocerte!