Intern - I&D (DE&C)
Perfil que buscamos
Objetivos Generales
- Comprender y experimentar con las tecnologías, herramientas y procesos actuales utilizados en la Ingeniería de Datos, incluyendo ingestión, transformación, modelado y almacenamiento de datos.
- Participar en la evaluación crítica de la calidad, eficiencia y seguridad de los procesos de tratamiento de datos dentro de un entorno corporativo.
- Aprender buenas prácticas para la integración responsable, segura y eficiente de pipelines y sistemas de datos en productos y servicios reales.
Funciones y Tareas / Actividades a Desarrollar
Ingestión, Procesamiento y Transformación de Datos
- Diseño, evaluación y uso de pipelines de datos para tareas específicas, como ingestión desde APIs, bases de datos, ficheros o servicios externos.
- Desarrollo de procesos de limpieza, validación, transformación y normalización de datos mediante Python, SQL u otras herramientas de procesamiento.
- Comparativa de rendimiento y eficiencia entre diferentes métodos y tecnologías de procesamiento (por ejemplo, bases de datos relacionales vs. NoSQL, procesos batch vs. streaming).
Desarrollo e Integración de Soluciones
- Diseño y construcción de pipelines de datos para soportar casos de uso como analítica, reporting o consumo por aplicaciones internas.
- Uso de herramientas de orquestación y automatización (como Airflow, Prefect, cron, u orquestadores internos) para gestionar flujos de datos.
- Desarrollo de soluciones de integración entre distintas fuentes de datos, incluyendo APIs, bases de datos corporativas y sistemas externos.
- Integración de pipelines de datos en servicios backend desarrollados en Python u otros lenguajes, así como en paneles o aplicaciones de visualización (por ejemplo, Power BI, Streamlit o dashboards internos).
Evaluación, Seguridad y Gobernanza del Dato
- Diseño y ejecución de tests de calidad de datos (validaciones, controles automáticos, seguimiento de integridad y consistencia).
- Revisión de aspectos éticos y de seguridad en el manejo del dato: privacidad, tratamiento de información sensible, permisos y gobernanza interna.
- Documentación de procesos, datasets, resultados y aprendizajes de forma clara y estructurada para el equipo de ingeniería y analítica.
Madrid, ES