Data Engineer/Architect AWS Glue-EMR Expert
Elegir Capgemini significa elegir una empresa donde tendrás la libertad de diseñar tu carrera profesional como desees, con el respaldo y la inspiración de una comunidad colaborativa de colegas en todo el mundo. Aquí podrás reinventar lo que es posible. Únete a nosotros y ayuda a las organizaciones líderes en el mundo a descubrir el valor de la tecnología y construir un mundo más sostenible e inclusivo.
Acerca del rol
¿Te apetece sumarte al equipo y participar en un programa de modernización y migración ETL hacia un stack cloud-native en AWS? Tendrías la oportunidad de rodearte de un equipo internacional trabajando en poner foco en data processing/transformations, asegurando paridad funcional, observabilidad, seguridad baseline y un handover robusto a equipos de aplicación.
¿Qué harás en el proyecto?
- Diseñar y construir pipelines de transformación en AWS Glue (PySpark / Spark) y/o Amazon EMR (Spark) para migraciones ETL.
- Participar en el assessment técnico: análisis de workflows, complejidad, dependencias, riesgos y recomendaciones de target.
- Definir/implementar orquestación y scheduling con servicios AWS (p. ej., comparativas tipo Step Functions vs Airflow según necesidades).
- Asegurar calidad y reconciliación: validación de datos (comparativas origen/destino), evidencias de equivalencia funcional y pruebas de rendimiento.
- Implementar monitorización/alertas y buenas prácticas de operación (logs, troubleshooting, runbooks).
- Aplicar un baseline de seguridad y compliance: cifrado, roles, auditoría, y prácticas alineadas con políticas corporativas.
- Colaborar con perfiles de plataforma y equipos de aplicación en transferencia de conocimiento (paso de ETL “GUI” a enfoque code-centric).
Tu perfil.
Para sentirte a gusto en la posición es necesario que puedas desenvolverte bien con:
- Experiencia sólida (senior) en AWS Glue y PySpark/Spark en entornos de datos.
- Experiencia con Amazon EMR (Spark) o ejecución de workloads Spark a escala.
- Experiencia real en migraciones/modernización ETL (idealmente desde herramientas tradicionales hacia AWS).
- Capacidad de diseñar soluciones completas de data processing con componentes de orquestación, operación y costes.
- Buenas habilidades de comunicación (perfil “consultivo” y orientado a decisiones con evidencia).
- Inglés alto (oral y escrito).
Se valorará:
- Experiencia con Data Catalog / lineage / metadata tracking.
- Experiencia con CloudWatch u observabilidad equivalente para pipelines.
- Conocimiento de Informatica (PowerCenter / IICS/IDMC) a nivel de integración o convivencia.
- Experiencia con enfoques de automatización de migración (aceleradores/conversión, frameworks internos, etc.).
- Conocimiento de optimización de costes en entornos serverless / pay-per-use (tuning Spark, particionamiento, etc.)
Valoramos todas las candidaturas y ofrecemos formación presencial, online y certificaciones. Aunque no cumplas el 100% de los requisitos, ¡queremos conocerte!
¿Qué te gustará de trabajar aquí?
- Proyectos variados y desafiantes: Trabajarás en retos multisectoriales, evitando la rutina y exponiéndote a tecnologías diversas.
- Flexibilidad y modelo híbrido: Cultura orientada al equilibrio vida‑trabajo.
- Aprendizaje continuo:
- Formación en tecnologías cloud, data governance, visualización…
- Participación real en proyectos con IA generativa, Business AI y tecnologías emergentes del dato.
- Diversidad de clientes e innovación constante: Proyectos de impacto real con organizaciones líderes.
- Entornos colaborativos e inclusivos: Equipos dinámicos, multiculturales y orientados al crecimiento.
- Crecimiento profesional y “challenge” técnico: Autonomía, mentoring, certificaciones y oportunidades de ampliar tu rol dentro del área de Data & AI.
¿Por qué Capgemini? Nuestros compromisos y prioridades
Capgemini es un socio global en transformación empresarial y tecnológica, que ayuda a las organizaciones a acelerar su doble transición hacia un mundo digital y sostenible, generando un impacto tangible tanto en las empresas como en la sociedad. Somos un grupo responsable y diverso, con 340.000 profesionales en más de 50 países. Con más de 55 años de trayectoria, nuestros clientes confían en Capgemini para aprovechar el valor de la tecnología y cubrir todas sus necesidades de negocio. Ofrecemos soluciones completas que abarcan desde la estrategia y el diseño hasta la ingeniería, impulsadas por nuestras capacidades líderes en inteligencia artificial, IA generativa, cloud y datos, junto con un profundo conocimiento del sector y una sólida red de partners.
MAKE IT REAL. ¡Únete al equipo! www.capgemini.com/es-es
Madrid, ES