Bonjour, Dans le but de créer par la suite un corpus sémantique en langue anglaise, je cherche une personne en mesure de scrapper des pages web.

Je fourni une liste excel ou .txt de 4 723 Urls qui sont des articles issu de 38 sites internet US (des domaines différents, mais tous sont des CMS Wordpress). A vous de les scraper pour en extraire les contenus.

Ce qu'il me faut au final : sur plusieurs colonnes d'un fichiers excel ou CSV, il faudra extraire : Colonne 1 > url de la page, Colonne 2 > title de la page, Colonne 3 > description seo de la page (si il y en a une), Colonne 4 > h1 de la page (titre de l'article), Colonne 5 > l'ensemble du contenu de l'article en texte brut (pas de code html, balises ou autre, pas de code de liens, pas d'images ...) mais ceci en gardant sa forme initiale (avec les interlignes et les sauts de ligne) et, si cela est possible, il faut garder aussi en place les balises des intertitres.

Outils : celui que vous voulez, votre script ou alors RDDZ, ScrapeBox, Apify, ParseHub, Scrapinghub ...

Merci de me donner en exemple de ce que vous pouvez extraire / avoir comme rendu final , afin de vérifier que cela correspond à nos besoins et me confirmer que vous pouvez scraper la liste de données ci dessus. Merci de me préciser si vous pouvez garder les H2 suite à l'extraction.

Merci de me donner votre tarif pour cette mission, votre délai de réalisation, votre protocole et moyen de paiement et la confirmation que vous pouvez faire une facture. Je suis ouvert aux prestataires off shore.

Budget indicatif Moins de 500 €
Publié le 30 mars 2018 à 02h13
Début du projet Tout de suite

Vous avez aussi besoin d'un expert ?

Déposez une annonce en décrivant votre projet et recevez gratuitement des devis en quelques minutes

Déposer une annonce gratuite

Offres pour ce projet :

Offre déposée le 30/03/2018 à 02h16
Offre déposée le 30/03/2018 à 09h14
Offre déposée le 30/03/2018 à 09h00
Offre déposée le 30/03/2018 à 12h30
Offre déposée le 30/03/2018 à 06h10
Offre déposée le 30/03/2018 à 11h36
Offre déposée le 30/03/2018 à 08h03
Offre déposée le 30/03/2018 à 10h33
3 jours Montant privé
Déposez un projet similaire
Publication 100% gratuite
Recevez 10 devis en moyenne
Pas de commission à payer

Vous êtes prestataire et vous cherchez des missions ?

Remplissez rapidement votre carnet de commandes en utilisant Codeur.com pour contacter des nouveaux clients.

Créer un compte gratuitement

Gérer mon projet

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

En utilisant ce site, vous acceptez l'utilisation de cookies. permettant de vous proposer des contenus et des services adaptés à vos centres d'intérêts.

Vous utilisez actuellement Internet Explorer. Pour profiter pleinement de Codeur.com, veuillez utiliser un des navigateurs suivant :