Les meilleurs développeurs informatique freelances sont sur Codeur.com
Fermé · 1 000 € à 10 000 € · 33 offres · 691 vues · 49 interactions
créer un package python
Contexte et objectif
Nous disposons d’un ensemble de documents PDF « mixtes » : ils ne sont pas entièrement scannés, mais contiennent des zones (images, photos, logos, graphiques…) susceptibles d’inclure du texte ou d’autres informations visuelles intéressantes. L’objectif est de confier à un(e) freelance la réalisation d’un module/script capable de :
Parcourir un PDF et identifier automatiquement toutes les images embarquées (quelle que soit leur taille ou leur format d’encodage).
Pour chaque image détectée :
Extraire (via OCR) le texte qui s’y trouve ;
Conserver, dans le PDF final, la ou les zones texte détectées aux emplacements exacts d’origine (coordonnées X/Y, largeur/hauteur) ;
Générer, en sus, une description textuelle de l’image elle-même (ex. : “logo d’entreprise”, “carte de visite”, “schéma technique”, etc.), idéalement en exploitant GPT-Vision ou une solution équivalente.
Réinjecter ces informations (texte OCR et métadonnées de l’image) dans le même PDF, de façon à ce qu’un lecteur humain ou un outil de recherche interne puisse :
Voir le texte issu de l’image dans son contexte graphique ;
Disposer d’un “tag”/commentaire/annotation pour chacune des images, décrivant son contenu (par exemple, “Logo Société X” ou “Code-barres 2D”) ;
Conserver la mise en page globale du PDF (champs texte originaux, images, graphiques, etc.).
En résumé, nous voulons un “OCR augmenté” : plutôt que de traiter l’intégralité du PDF, on cible uniquement les zones images, on y applique des méthodes avancées (classiques + IA), on récupère le texte et on commente l’image, puis on reconstitue un PDF enrichi.
Budget indicatif : 1 000 € à 10 000 €
Publication : 04 juin 2025 à 08h29
Profils recherchés : Développeur spécifique freelance , Développeur Python freelance , Développeur API freelance , Développeur Machine Learning freelance
33 freelances ont répondu à ce projet
30 propositions de devis en moins de 2h
Montant moyen des devis proposés : 3 250 €
Estimation du délai : 19 jours
Nos ressources utiles
Allez plus loin avec nos ressources liées à ce projet !
Simulateur de prix : Combien coûte une refonte de logo ?
Simulateur de prix : Combien coûte un logo ?
Téléchargement : Cahier des charges pour créer un logo