Les meilleurs développeurs JavaScript freelances sont sur Codeur.com

Crawler de sites pour récupérer des flux RSS

 Fermé·300 à 800 €·4 offres·818 vues


Bonjour,

Je cherche à faire développer un crawler multithreaded, capable de tourner en ligne de commande, et qui selon une liste de sites donnée en entrée (BDD) parcourt chacun des sites en entier à la recherche des fichiers contenant des flux RSS.

Il ne faut pas seulement se baser sur l'extension du fichier, mais inspecter chaque fichier encapsulé dans un lien à la recherche de balises spécifiques que je fournirai.

Pour chaque site je souhaite récupérer la liste des liens vers les flux RSS qui m'intéressent.

Idéalement, le crawler saura parser du JS pour récupérer les liens dynamiques (affichés au clic) de certains sites.

Le résultat du crawl est la liste des liens vers ces fichiers détectés, à inscire en BDD.
Des informations sur le déroulement des opérations seront inscrites dans une table de la BDD permettant de suivre l'avancement du crawl.

Paris-dev

Budget indicatif : 300 à 800 €

Publication : 31 octobre 2013 à 09h15

Profils recherchés : Développeur JavaScript freelance, Développeur PHP freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

4 freelances ont répondu à ce projet

3 propositions de devis en moins de 2h

Publier un projet similaire

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

Votre navigateur Web n’est plus à jour. Il ne permet pas d’afficher correctement le site Codeur.com.
Nous vous invitons à mettre à jour votre navigateur ou à utiliser un autre navigateur plus récent.