Bonjour,

Le dev qui avait été sélectionné sur la mission n'ayant pas été en mesure de faire ce qui avait été commandé malgré un brief très clair, et ayant disparu dans la nature, nous relançons cette mission à l'identique :

Votre mission : Dans le but de créer par la suite des corpus sémantique en langue anglaise, je cherche une personne en mesure de scrapper des articles sur des pages web depuis une liste d'urls pour en extraire les articles (titres + textes des articles).

Je fourni : une liste sous excel de 89 258 urls d'articles de taille variables qui sont des articles issu de sites internet US qui sont tous sous wordpress (89 domaines différents mais 64 ont exactement la même structure et parasites).

Ce qu'il me faut au final : sur plusieurs colonnes d'un fichiers excel ou CSV, il faudra extraire : Colonne 1 > url de la page, Colonne 2 > titre h1 de l'article, Colonne 5 > l'ensemble du contenu texte de l'article en texte brut sans les parasites. On souhaite aussi garder sa forme initiale (les interlignes, sauts de ligne, et aussi les listes à chiffre ou à puces ) et les balises des intertitres (h2 et h3, h4).

Ce que je ne veux pas garder : pas de codes html parasites (balises, pub, images ou autre parasites), pas de code des liens (mais on garde l'ancre de celui ci), pas d'images, pas de pubs, pas de signature, de lire aussi ...

Outils : celui que vous voulez, votre script ou alors RDDZ, ScrapeBox, Apify, ParseHub, Scrapinghub ...

Format du rendu : pas besoin de votre outil / code, il me faut le fichier excel / CSV avec les datas

Test : Pour un test afin de vérifier qu'on se comprend bien sur nos besoins et le rendu final merci de me demander 3 urls en message privé. Merci de me redonner ensuite l'exemple de ce que vous pouvez extraire / avoir comme rendu final ,sous excel ou CSV afin de vérifier que cela correspond à nos besoins et me confirmer que vous pouvez scraper la liste de données ci dessus et exclure ce qui n'est pas nécessaire .

Merci de me donner :
- votre tarif pour cette mission,
- votre délai de réalisation,
- votre protocole et moyen de paiement
- votre confirmation que vous pouvez faire une facture (offshore possible).

Merci d'avance pour votre devis,

Budget indicatif500 € à 1.000 €
Publié le10 mars 2020 à 17h35
Profils recherchés :

Vous avez aussi besoin d'un expert ?

Déposez une annonce en décrivant votre projet et recevez gratuitement des devis en quelques minutes

Déposer une annonce gratuite

Offres pour ce projet :

Offre déposée le 10/03/2020 à 17h37
Offre déposée le 10/03/2020 à 18h49
Offre déposée le 10/03/2020 à 17h45
Offre déposée le 10/03/2020 à 18h05
Offre déposée le 10/03/2020 à 18h40
Offre déposée le 10/03/2020 à 17h45
Offre déposée le 10/03/2020 à 18h22
Déposez un projet similaire
Publication 100% gratuite
Recevez 10 devis en moyenne
Pas de commission à payer

Vous êtes prestataire et vous cherchez des missions ?

Remplissez rapidement votre carnet de commandes en utilisant Codeur.com pour contacter des nouveaux clients.

Créer un compte gratuitement

Gérer mon projet

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

En utilisant ce site, vous acceptez l'utilisation de cookies. permettant de vous proposer des contenus et des services adaptés à vos centres d'intérêts.

Vous utilisez actuellement Internet Explorer. Pour profiter pleinement de Codeur.com, veuillez utiliser un des navigateurs suivant :