Objectif : développer un « robot » qui va scraper régulièrement des sites d’annonces immobilières en France (une fois par jour par exemple), pour filtrer les annonces intéressantes et envoyer un mail avec les liens pour les annonces retenues.

Les résultats de ces sites d'annonces, notamment le prix par m2, devront être contre-chercker par rapport au prix moyen m2 par ville diponible sur le site meileurs agents. Uniquement les nouvelles et meilleurs annonces seront envoyés par email.

Site à scraper :
- seloger.com / le bon coin / pap

On complétera par la suite avec d’autres sites
Pour commencer, je pense que tous les extracts et enregistrements devront être effectués sur un drive sur le cloud (google drive). Ainsi, nous pourrions tous les deux y avoir accès.

Informations à scraper :
Pour commencer, je pense qu’il faudrait, une fois par jour par exemple, aller sur seloger ensuite rentrer les informations suivantes :
- Sélectionner : « acheter » c’est-à-dire biens en vente (et non pas en location)
- Localisation : Paris
- Trier par date => afin d’avoir les offres récentes (le but étant de ne pas scraper 2 fois la même annonce, donc si 200 nouvelles annonces ont été publiées depuis hier, le scrap d’aujourd’hui doit s’arrêter quand il aura scraper ces 200 annonces et qu’il retrouve par la suite une annonce qu’il a déjà scrapé la veille)
Il faudrait ensuite, pour les nouvelles annonces, extraire les annonces suivant les colonnes suivantes (sous forme d’un CSV enregistré à chaque scrap sur le drive) :
1. Référence incluant la référence unique à chaque annonce
2. Arrondissement
3. Quartier
4. Titre annonce
5. Prix (P)
6. Surface (S)
7. Prix par m² (Psqm = P / S)
8. Description
9. Etage
10. Présence d’ascenseur ou pas (en vérifiant si les chaines de caractères suivantes existent dans la description par exemple : « sans ascenseur » ou « par escalier de service »)
11. Surface normalisée (Sm) :
a. si les chaines de caractères « carrez » ou « LC » n’existent pas dans la description alors Sm = S ;
b. dans le cas contraire, il faut choper le nombre qui est juste avant ces chaines de caractères qui sera égal à Sm
 exemple : si dans la description, on lit « un appartement de 30 m² au sol et 25 m² en loi carrez » ou « un appartement de 30 m² au sol et 25 m² LC » alors Sm = 25 m²
12. Prix normalisé (Pm) : il faut d’abord calculer une décote D (voir ci-dessous), le prix normalisé sera alors calculé selon la simple formule : Pm = P / (1 – D)
a. si l'appartement se situe au RDC (étage = 0), alors D = 25% (25% étant une hypothèse)
b. si l'appartement se situe au 1er étage, alors D = 10% (10% étant une hypothèse)
c. si l'appartement se situe à un étage autre que RDC ou 1er étage, alors :
 s'il n'y a pas d'ascenseur, il y aura une décote de 5% (idem hypothèse) par étage au-delà du 2ème étage
 dans le cas contraire, D = 0 (pas de décote)
13. Prix par m² normalisé : Psqmm = Pm / Sm
14. Station métro détectée d’abord à partir du titre, ensuite si aucune station n’est trouvée dans le titre, chercher dans la description (la liste des station est sur ce lien : [Url visible pour les membres Pro] )
 Si aucune station n’est détectée, alors rentrer « na »
15. Prix par m² dans la station trouvée (disponible sur ce lien : [Url visible pour les membres Pro] ), que l’on nommera Ps
16. Prime = (Psqmm / Ps) – 1, exprimée en %
 Si aucune station n’est détectée, alors rentrer « na » également pour la prime
17. Lien de l’annonce
ð Voici donc le tableau qu’il faudra enregistrer à chaque scrap
Elimination des annonces non intéressantes et envoi par mail des annonces retenues :
Si une annonces intègre une des conditions suivantes, elle sera automatiquement éliminée :
 Eliminer les annonces dont la description contient une des chaines de caractères suivantes : « senior », « sénior », « hespérides », « nue-propriété », « nue-propriete », « vedette », « péniche », « viager », « résidence de service », « résidence service », « résidences avec service » « résidence avec service » « amaré » « amarré » « sanibroyeur » => on pourra en rajouter d’autres plus tard s’il le faut
 Eliminer les annonces où la donnée de la colonne Prime est :
o égal à « na » ; ou
o supérieure à zéro
Pour les annonces non éliminées, envoyer un mail avec les liens correspondant.

Budget indicatif Moins de 500 €
Publié le 17 février 2019 à 18h53
Début du projet Tout de suite

Vous avez aussi besoin d'un expert ?

Déposez une annonce en décrivant votre projet et recevez gratuitement des devis en quelques minutes

Déposer une annonce gratuite

Offres pour ce projet :

Offre déposée le 18/02/2019 à 11h13
Offre déposée le 17/02/2019 à 19h32
Offre déposée le 17/02/2019 à 21h43
Offre déposée le 20/02/2019 à 17h11
1 jour Montant privé
Offre déposée le 20/02/2019 à 14h06
20 jours Montant privé
Offre déposée le 17/02/2019 à 21h11
1 jour Montant privé
Déposez un projet similaire
Publication 100% gratuite
Recevez 10 devis en moyenne
Pas de commission à payer

Vous êtes prestataire et vous cherchez des missions ?

Remplissez rapidement votre carnet de commandes en utilisant Codeur.com pour contacter des nouveaux clients.

Créer un compte gratuitement

Gérer mon projet

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

En utilisant ce site, vous acceptez l'utilisation de cookies. permettant de vous proposer des contenus et des services adaptés à vos centres d'intérêts.

Vous utilisez actuellement Internet Explorer. Pour profiter pleinement de Codeur.com, veuillez utiliser un des navigateurs suivant :