Les meilleurs rédacteur webs freelances sont sur Codeur.com

Scraps ou copié / collé de 464 urls d'articles

 Terminé·Moins de 500 €·10 offres·717 vues·31 interactions


Bonjour,

Mission : Dans le but de créer par la suite un corpus sémantique en langue anglaise, je cherche une personne en mesure de scrapper 464 urls d'articles, soit en utilisant un logiciel ou, si vous n'en avez pas, en les copiant / collant.

Je fourni : une liste sous excel de 464 url d'articles de taille variable (en gros de 300 à 2000 mots) qui sont des articles issu de sites internet (quasiment tous sur des domaines différents > en gros +/- 464 domaines # ).

Votre mission : les scraper avec un logiciel ou les copier / coller pour en extraire les articles (titres et textes des articles).

Ce qu'il me faut au final : sur plusieurs colonnes d'un fichiers excel ou CSV, il faudra extraire : Colonne 1 > url de la page, Colonne 2 > titre / h1 de l'article, Colonne 5 > l'ensemble du contenu de l'article en texte brut (pas de signature, pas de code html, balises ou autre, pas de code de liens, pas d'images ...) mais ceci en gardant sa forme initiale (avec les interlignes et les sauts de ligne) et, si cela est possible, il faut garder aussi en place les balises h2 et h3 des intertitres.

Outils : celui que vous voulez, votre script ou alors RDDZ, ScrapeBox, Apify, ParseHub, Scrapinghub ... ou un copié collé à la mano :- ) !

Test : Pour un test je vous fournirais qlq urls en message privé. Merci de me donner ensuite l'exemple de ce que vous pouvez extraire / avoir comme rendu final, afin de vérifier que cela correspond à nos besoins et me confirmer que vous pouvez scraper la liste de données ci dessus. Merci de aussi me préciser si vous pouvez garder les H2 et H3 suite à l'extraction.

Merci de ne pas omettre dans votre offre :
- votre tarif pour cette mission,
- votre délai de réalisation,
- votre protocole et moyen de paiement
- votre confirmation que vous pouvez faire une facture.

Merci d'avance pour votre devis,

Budget indicatif : Moins de 500 €

Publication : 28 décembre 2018 à 03h12

Profils recherchés : Rédacteur web freelance, Développeur spécifique freelance, Développeur Windev freelance, Développeur PHP freelance, Correcteur freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

10 freelances ont répondu à ce projet

10 propositions de devis en moins de 2h

S
+3

Montant moyen des devis proposés : 300 €

Estimation du délai : 2 jours

Publier un projet similaire

Projet réalisé par jago

jago
lome, 7225

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

Votre navigateur Web n’est plus à jour. Il ne permet pas d’afficher correctement le site Codeur.com.
Nous vous invitons à mettre à jour votre navigateur ou à utiliser un autre navigateur plus récent.