Lead Data Engineer Palantir Foundry
Choisir Capgemini, c'est choisir une entreprise où vous serez en mesure de façonner votre carrière selon vos aspirations, où vous serez soutenu et inspiré par une communauté d’experts dans le monde entier, où vous pourrez réécrire votre futur. Rejoignez-nous pour redéfinir les limites de ce qui est possible, contribuer à libérer la valeur de la technologie pour les plus grandes organisations et participez à la construction d’un monde plus durable et inclusif.
Vos missions
En tant que Lead Data Engineer Palantir Foundry au sein de la practice Insights & Data, vous interviendrez sur tout le cycle de vie data/ops dans Foundry :
- Co-concevoir l’Ontologie métier en lien avec les équipes produit et métiers, afin d’aligner les jeux de données et modèles sur des concepts réels et opérables.
- Définir et industrialiser des Data pipelines (PySpark, SQL) : ingestion, normalisation, qualité, historisation, optimisation des coûts/performances, scheduling et monitoring.
- Garantir la qualité, la sécurité et la gouvernance : versioning, traçabilité/lineage, contrôles d’accès, normes de code et de tests. en s'appuyant sur les mécanismes de gouvernance Foundry et les guidelines PySpark).
- Animer et faire grandir l’équipe : cadrage technique, mentoring, pair programming, revues de conception, diffusion des standards Foundry & Spark.
- Piloter l’amélioration continue : définir et suivre des KPI (fraîcheur, SLA, fiabilité, coût), automatiser la détection des régressions et l’observabilité des jobs.
Votre profil
-
Vous justifiez de 6 ans et plus d’expérience (hors stages et alternance) en ingénierie Data, avec une expérience significative sur Palantir Foundry en environnement de production.
-
Vous maîtrisez PySpark et Spark SQL pour le traitement distribué de données : optimisation des performances, partitionnement, joins, gestion des shuffles, broadcast joins, UDF et pandas UDF.
-
Vous avez une solide expérience dans le développement d’Actions orientées opérations (function-backed), en TypeScript et/ou Python, incluant l’intégration applicative et l’automatisation des workflows.
-
Vous êtes capable de concevoir et modéliser une Ontologie exploitable (objets, relations, propriétés, actions) et de travailler en co‑conception étroite avec les équipes métiers et produit.
-
Vous connaissez les APIs Foundry (REST, OAuth) pour exposer des services et assurer l’intégration avec l’écosystème du système d’information.
-
Vous démontrez un leadership technique reconnu : encadrement de développeurs, définition et diffusion de standards, accompagnement des équipes dans leur montée en compétences.
Quelques raisons de nous rejoindre
Projets variés et innovants : intervenez sur des missions à fort impact dans des secteurs durables et technologiques (énergies renouvelables, transports, IA, data…), avec des opportunités d’évolution.
Apprentissage en continu : accédez à des ressources dédiées telles que notre GenAI Campus, certifications techniques (SAP, databricks, Agile…) et des plateformes de formation.
Événements et partenariats : participez à des conférences sectorielles et événements partenaires (AWS, Snowflake, SAP…).
Nos engagements et priorités
Le groupe Capgemini encourage une culture inclusive dans un cadre multiculturel et handi-accueillant. En nous rejoignant, vous intégrez un collectif qui valorise la diversité, développe le potentiel de ses talents, s’engage dans des initiatives solidaires avec ses partenaires, et se mobilise pour réduire son impact environnemental sur tous ses sites et auprès de ses clients.
Capgemini est un leader mondial, responsable et multiculturel, regroupant près de 350 000 personnes dans plus de 50 pays. Fort de 55 ans d’expérience, nous sommes un partenaire stratégique des entreprises pour la transformation de leurs activités en tirant profit de toute la puissance de la technologie et des innovations dans les domaines en perpétuelle évolution tels que le cloud, la data, l’Intelligence Artificielle, la connectivité, les logiciels, l’ingénierie digitale ou les plateformes.
Toulouse, FR