Les meilleurs développeurs Java freelances sont sur Codeur.com

Collecte d'un corpus fait de tweets

 Fermé · Moins de 500 € · 1 offre · 942 vues · 8 interactions


Bonjour,

j'ai besoin d'une personne compétente pour réaliser le projet suivant :
collecte d'un corpus fait de tweets par exemple (vous pouvez utiliser
l'API Tweeter et collecter avec Talend si à l'aise avec java, sinon
vous pouvez collecter les tweets et travailler ensuite en C).
Les tweets comportent des hashtags, si la collecte se fait sur une
période il y a +hashtags qui se présentent. L'idée serait de
classifier les hashtags selon les catégories que vous aurez fixé au
préalable et ensuite construire un lexique sémantique avec des mots
qui font partie de ces catégories mais qui ne sont pas des hashtags.
Si cela vous intéresse vous devez travailler pour collectionner votre corpus.
Ensuite vous pouvez associer des catégories aux hashtags, ensuite
tokenisation des tweets (d'abord on enlève les mots grammaticaux),
TF-IDF pour voir éventuellement les thèmes via les fréquences et
création lexique suivant des critères que vous aurez fixé au préalable

vous pouvez utiliser des outils existant ou vous en inspirez (ex.:
[URL visible pour les membres Pro] [2])

cordialement,

Budget indicatif : Moins de 500 €

Publication : 29 novembre 2017 à 10h18

Profils recherchés : Développeur Java freelance , Développeur C++ freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients