Je recherche Un Data engineer, 4 ans d’expérience ayant de solides compétences sur le Framework Spark, une grande autonomie sur les services AWS associés et une appétence pour la gestion du cycle de vie des données.
Framework Spark (Développement et Optimisation de cluster)
Python (Pyspark) Maitrise Spark DF et Pandas
Usage du service EMR pour le déploiement des clusters
Intégration avec les services connexes d’AWS (Lambda, Batch, ECS, )
SQL
Terraform
Gitlab CI
Git