Les meilleurs développeurs JavaScript freelances sont sur Codeur.com

Crawler de sites pour récupérer des flux RSS

 Fermé · 300 à 800 € · 4 offres · 876 vues


Bonjour,

Je cherche à faire développer un crawler multithreaded, capable de tourner en ligne de commande, et qui selon une liste de sites donnée en entrée (BDD) parcourt chacun des sites en entier à la recherche des fichiers contenant des flux RSS.

Il ne faut pas seulement se baser sur l'extension du fichier, mais inspecter chaque fichier encapsulé dans un lien à la recherche de balises spécifiques que je fournirai.

Pour chaque site je souhaite récupérer la liste des liens vers les flux RSS qui m'intéressent.

Idéalement, le crawler saura parser du JS pour récupérer les liens dynamiques (affichés au clic) de certains sites.

Le résultat du crawl est la liste des liens vers ces fichiers détectés, à inscire en BDD.
Des informations sur le déroulement des opérations seront inscrites dans une table de la BDD permettant de suivre l'avancement du crawl.

Paris-dev

Budget indicatif : 300 à 800 €

Publication : 31 octobre 2013 à 09h15

Profils recherchés : Développeur JavaScript freelance , Développeur PHP freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

4 freelances ont répondu à ce projet

3 propositions de devis en moins de 2h

BiKay Agence de développement mobile
AW-360 Agence de développement e-commerce
FrancoisDev Développeur WordPress
ECINETIC Développeur
Publier un projet similaire

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients