Les meilleurs développeurs Python freelances sont sur Codeur.com

Robot leboncoin / seloger / pap + meilleur agents

 Fermé·Moins de 500 €·6 offres·1233 vues·14 interactions


Objectif : développer un « robot » qui va scraper régulièrement des sites d’annonces immobilières en France (une fois par jour par exemple), pour filtrer les annonces intéressantes et envoyer un mail avec les liens pour les annonces retenues.

Les résultats de ces sites d'annonces, notamment le prix par m2, devront être contre-chercker par rapport au prix moyen m2 par ville diponible sur le site meileurs agents. Uniquement les nouvelles et meilleurs annonces seront envoyés par email.

Site à scraper :
- seloger.com / le bon coin / pap

On complétera par la suite avec d’autres sites
Pour commencer, je pense que tous les extracts et enregistrements devront être effectués sur un drive sur le cloud (google drive). Ainsi, nous pourrions tous les deux y avoir accès.

Informations à scraper :
Pour commencer, je pense qu’il faudrait, une fois par jour par exemple, aller sur seloger ensuite rentrer les informations suivantes :
- Sélectionner : « acheter » c’est-à-dire biens en vente (et non pas en location)
- Localisation : Paris
- Trier par date => afin d’avoir les offres récentes (le but étant de ne pas scraper 2 fois la même annonce, donc si 200 nouvelles annonces ont été publiées depuis hier, le scrap d’aujourd’hui doit s’arrêter quand il aura scraper ces 200 annonces et qu’il retrouve par la suite une annonce qu’il a déjà scrapé la veille)
Il faudrait ensuite, pour les nouvelles annonces, extraire les annonces suivant les colonnes suivantes (sous forme d’un CSV enregistré à chaque scrap sur le drive) :
1. Référence incluant la référence unique à chaque annonce
2. Arrondissement
3. Quartier
4. Titre annonce
5. Prix (P)
6. Surface (S)
7. Prix par m² (Psqm = P / S)
8. Description
9. Etage
10. Présence d’ascenseur ou pas (en vérifiant si les chaines de caractères suivantes existent dans la description par exemple : « sans ascenseur » ou « par escalier de service »)
11. Surface normalisée (Sm) :
a. si les chaines de caractères « carrez » ou « LC » n’existent pas dans la description alors Sm = S ;
b. dans le cas contraire, il faut choper le nombre qui est juste avant ces chaines de caractères qui sera égal à Sm
 exemple : si dans la description, on lit « un appartement de 30 m² au sol et 25 m² en loi carrez » ou « un appartement de 30 m² au sol et 25 m² LC » alors Sm = 25 m²
12. Prix normalisé (Pm) : il faut d’abord calculer une décote D (voir ci-dessous), le prix normalisé sera alors calculé selon la simple formule : Pm = P / (1 – D)
a. si l'appartement se situe au RDC (étage = 0), alors D = 25% (25% étant une hypothèse)
b. si l'appartement se situe au 1er étage, alors D = 10% (10% étant une hypothèse)
c. si l'appartement se situe à un étage autre que RDC ou 1er étage, alors :
 s'il n'y a pas d'ascenseur, il y aura une décote de 5% (idem hypothèse) par étage au-delà du 2ème étage
 dans le cas contraire, D = 0 (pas de décote)
13. Prix par m² normalisé : Psqmm = Pm / Sm
14. Station métro détectée d’abord à partir du titre, ensuite si aucune station n’est trouvée dans le titre, chercher dans la description (la liste des station est sur ce lien : [Url visible pour les membres Pro] )
 Si aucune station n’est détectée, alors rentrer « na »
15. Prix par m² dans la station trouvée (disponible sur ce lien : [Url visible pour les membres Pro] ), que l’on nommera Ps
16. Prime = (Psqmm / Ps) – 1, exprimée en %
 Si aucune station n’est détectée, alors rentrer « na » également pour la prime
17. Lien de l’annonce
ð Voici donc le tableau qu’il faudra enregistrer à chaque scrap
Elimination des annonces non intéressantes et envoi par mail des annonces retenues :
Si une annonces intègre une des conditions suivantes, elle sera automatiquement éliminée :
 Eliminer les annonces dont la description contient une des chaines de caractères suivantes : « senior », « sénior », « hespérides », « nue-propriété », « nue-propriete », « vedette », « péniche », « viager », « résidence de service », « résidence service », « résidences avec service » « résidence avec service » « amaré » « amarré » « sanibroyeur » => on pourra en rajouter d’autres plus tard s’il le faut
 Eliminer les annonces où la donnée de la colonne Prime est :
o égal à « na » ; ou
o supérieure à zéro
Pour les annonces non éliminées, envoyer un mail avec les liens correspondant.

Budget indicatif : Moins de 500 €

Publication : 17 février 2019 à 17h53

Profils recherchés : Développeur Python freelance, Spécialiste data mining freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

6 freelances ont répondu à ce projet

3 propositions de devis en moins de 2h

Montant moyen des devis proposés : 250 €

Estimation du délai : 4 jours

Publier un projet similaire

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

Votre navigateur Web n’est plus à jour. Il ne permet pas d’afficher correctement le site Codeur.com.
Nous vous invitons à mettre à jour votre navigateur ou à utiliser un autre navigateur plus récent.