Les meilleurs développeurs informatique freelances sont sur Codeur.com

Ingéniérie et science de données

 Fermé·Plus de 10 000 €·18 offres·579 vues·11 interactions


Dans le cadre du projet européen COESO pour le développement d'une plate-forme de science citoyenne appelée VERA, le WP5 intégrera des mesures de la coopération (cooperation analytics) dans les projets Pilots qui utilisent la plate-forme. Une batterie d’indicateurs de la coopération est déjà disponible mais doit être rendue opérationnelle dans le cadre de cette plate-forme et doit mobiliser des techniques d’ingénierie linguistique pour traiter les sources recueillies à partir de l’activité des équipes des projets pilotes.
Le WP5 est sous la direction de Dominique Boullier, professeur des universités en sociologie à Sciences Po, chercheur au CEE, en coordination avec Jessica Pidoux, assistante de recherche, et en collaboration avec l’équipe de Net7 qui développe la plate-forme VERA.
La langue de travail est l’anglais.
Toutes les solutions proposées seront développées en Open Source ou mobiliseront des packages disponibles en open source (sauf exception à discuter).
Le projet comporte deux types d’activité principalement : data engineering et NLP.
Data engineering : finalisation, test et validation d’un data pipeline à partir de sources hétérogènes en vue de rendre opérationnels les indicateurs de coopération déjà développés.
Familiarisation avec les enjeux et les visées du projet Coeso et notamment à partir du livrable fourni pour le WP5 en Septembre 2021 (disponible en ligne [URL visible pour les membres Pro] ) .
Reprise des outils et du code déjà développés pour le développement des analytics
Utilisation de la grille d’analyse produite et de la liste d’indicateurs déjà construits (n=30). Ces indicateurs mobilisent et croisent des métadonnées, des données structurées (profils d’utilisateurs par exemple) et des données non structurées (conversations en messagerie).
Nettoyage, formatage et optimisation des données pour les futurs traitements
Finalisation du développement de ces indicateurs en lien étroit avec les partenaires de Coeso qui implémentent la future plate-forme.
Pondération des indicateurs construits à partir de datasets déjà disponibles extraits de sources variées, différentes plateformes et formats (mail, messageries, textes de travail, blogs, minutes de réunion, enregistrements de réunions, logs des échanges sur tous systèmes, déclarations d’activité sur les profils des personnes, etc.)
Test de faisabilité des méthodes d’extraction des données
Présentation des résultats des tests par écrit, lors des réunions hebdomadaires avec l’équipe interne ou avec les membres du consortium
Spécification du schéma général de workflow et de data processing, sachant que ces indicateurs devront être calculés à la volée selon une périodicité à définir tout au long de chaque projet monitoré.
Assistance à la rédaction et vérification de la conformité du data management plan avec le RGPD et mise en conformité par toute méthode possible (le DMP de référence est celui de COESO disponible en ligne [URL visible pour les membres Pro] ).
Intégration et mise en production des indicateurs dans VERA à partir des sources fournies par 5 projets pilotes (sur données réelles et pendant la durée des projets).
Coordination avec Net7 pour les API exploitables sur la plate-forme et pour l’extraction de données.
Coordination avec Net7 pour les spécifications d’un tableau de bord de cooperation analytics compatible avec le design adopté pour la plateforme
Exploration (et implémentation à évaluer) des solutions de dataviz adaptées à l’utilisation des analytics par des utilisateurs non experts (User experience)
Documentation technique et guides d’utilisation

Traitement de données langagières : méthodes d’analyse des patterns de coopération en utilisant des méthodes de NLP sur des données textuelles de travail entre partenaires dans les projets pilotes.
Mettre en œuvre des méthodes de NLP adaptées aux indicateurs des types de coopération
Finalisation d’un dictionnaire générique des activités coopératives des sciences citoyennes (uniquement termes en référence aux formes de la coopération et de la communication relatives à ces sujets) à partir d’un cadre théorique des sciences humaines et sociales
Construction des indicateurs de topics, de topic drifting, d’interlocution, de prévalence des répertoires d’un domaine par rapport à un autre.
Production de la chaîne de traitement à la volée à partir des traces textuelles des interactions en cours d’action.
Test de faisabilité de chacune des méthodes et du protocole adopté
Comme pour la partie de data engineering, il est nécessaire de prévoir la présentation des résultats, l'implémentation et la mise en production des méthodes dans la plateforme VERA, ainsi que la rédaction des documentations légale, technique et d’utilisation.

Phases du projet
Le projet sera organisé en deux phases, la première de juin à fin septembre sera plus intensive pour parvenir à spécifier la mise en production des indicateurs, la seconde de Octobre à Décembre pour assurer le suivi, le réglage et la maintenance des solutions trouvées pour les cooperation analytics avec 5 projets pilotes.
Format des réponses
Les candidats préciseront les compétences précises des personnels mobilisés, les tarifs jours pratiqués et le nombre de jours mobilisés selon les phases du projet.
L’institution contractante est la FNSP (Fondation Nationale des Sciences Politiques).
Candidatures à envoyer à Dominique Boullier, professeur à Sciences Po Paris. Contact possible pour toute précision sur le projet.
[E-mail visible pour les membres Pro]
Date impérative de remise des réponses : 30 mai 2022 à midi.

Budget indicatif : Plus de 10 000 €

Publication : 17 mai 2022 à 13h13

Profils recherchés : Développeur spécifique freelance, Développeur Python freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

18 freelances ont répondu à ce projet

13 propositions de devis en moins de 2h

+11

Montant moyen des devis proposés : 800 €

Estimation du délai : 6 jours

Publier un projet similaire

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

Votre navigateur Web n’est plus à jour. Il ne permet pas d’afficher correctement le site Codeur.com.
Nous vous invitons à mettre à jour votre navigateur ou à utiliser un autre navigateur plus récent.