Les meilleurs développeurs informatique freelances sont sur Codeur.com

Data Cleaning pour site comparateur

 Fermé · Moins de 500 € · 1 offre · 705 vues · 4 interactions


Bonjour,

Je cherche a réaliser un site comparateur d'un type produit en particulier;
J'ai scrappé un certain nombre de sites internet pour alimenter mon data feed et ainsi atteindre un bon millier de produits à comparer via une vingtaine de sites.
La problématique que je rencontre aujourd'hui est la suivante : je ne dispose ni de moyen de reconnaissance ni d'analyse syntaxique automatique pour regrouper un même produit et ainsi comparer les différents prix.

J'ai bien essayer de nettoyer mes données avec Google Refine mais le travail est long et fastidieux.

Je recherche donc une solution automatique et évolutive pour assigner un ID pour chaque produit identique;
La solution devra, suivant une marge d'erreur durant la reconnaissance, ajouter le produit dans une "liste d'attente" pour une validation manuelle.
Elle peut fonctionner sous Talend Open Studio ou autre.

Merci d'avance pour vos propositions
Cordialement

Budget indicatif : Moins de 500 €

Publication : 09 octobre 2016 à 12h20

Profils recherchés : Développeur spécifique freelance , Spécialiste data mining freelance , Data scientist freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients