Les meilleurs développeurs PHP freelances sont sur Codeur.com

Intégrer mon proxy tor sur scrapy

 Terminé·Moins de 500 €·2 offres·367 vues·6 interactions


Bonjour,

Je suis à la recherche d'un freelance pour m'aider dans le développement de mon scraper avec Scrapy sur Python 3.8+.

Mon objectif est de scraper des sites .onion (Tor). J'ai déjà mis en place un cluster de socks5 Tor avec un load balancer, et j'ai vérifié que cela fonctionne en utilisant Curl de la manière suivante :

curl --socks5-hostname IP:80 [URL visible pour les membres Pro]

Et cela fonctionne, cependant, je rencontre des difficultés lors de l'intégration du socks5 à Scrapy. J'ai essayé avec PySocks et divers packages, mais j'obtiens toujours la même erreur :

[Téléphone visible pour les membres Pro]:03:14 [scrapy.core.scraper] ERROR: Error downloading <GET [URL visible pour les membres Pro]
Traceback (most recent call last):
File "C:\Users\PC\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\twisted\internet\defer.py", line 1693, in _inlineCallbacks
result = context.run(
File "C:\Users\PC\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\twisted\python\failure.py", line 518, in throwExceptionIntoGenerator
return g.throw(self.type, self.value, self.tb)
File "C:\Users\PC\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\scrapy\core\downloader\middleware.py", line 54,
in process_request
return (yield download_func(request=request, spider=spider))
File "C:\Users\PC\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\twisted\internet\defer.py", line 892, in _runCallbacks
current.result = callback( # type: ignore[misc]
File "C:\Users\PC\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.11_qbz5n2kfra8p0\LocalCache\local-packages\Python311\site-packages\twisted\internet\endpoints.py", line 1022, in startConnectionAttempts
raise error.DNSLookupError(
twisted.internet.error.DNSLookupError: DNS lookup failed: no results for hostname lookup: pbqttnffb5sh6ckgnz4f5by55w25gd6tuw5f5qcctmnyk62eyhgx6rad.onion.

Je pense que je ne suis pas parvenu à intégrer correctement le socks5 dans Scrapy.

Je suis donc à la recherche d'une personne capable de résoudre ce problème.

Merci.

Budget indicatif : Moins de 500 €

Publication : 03 juillet 2023 à 19h09

Profils recherchés : Développeur PHP freelance, Développeur Python freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

2 freelances ont répondu à ce projet

2 propositions de devis en moins de 2h

Publier un projet similaire

Projet réalisé par Houssem H.

Houssem H.
ezzahra, 2034

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

Votre navigateur Web n’est plus à jour. Il ne permet pas d’afficher correctement le site Codeur.com.
Nous vous invitons à mettre à jour votre navigateur ou à utiliser un autre navigateur plus récent.