Les meilleurs développeurs informatique freelances sont sur Codeur.com

Détection d’images dans PDF & OCR optimisé + enrichissement LLM

 Fermé · 1 000 € à 10 000 € · 33 offres · 691 vues · 49 interactions


créer un package python
Contexte et objectif

Nous disposons d’un ensemble de documents PDF « mixtes » : ils ne sont pas entièrement scannés, mais contiennent des zones (images, photos, logos, graphiques…) susceptibles d’inclure du texte ou d’autres informations visuelles intéressantes. L’objectif est de confier à un(e) freelance la réalisation d’un module/script capable de :

Parcourir un PDF et identifier automatiquement toutes les images embarquées (quelle que soit leur taille ou leur format d’encodage).

Pour chaque image détectée :

Extraire (via OCR) le texte qui s’y trouve ;

Conserver, dans le PDF final, la ou les zones texte détectées aux emplacements exacts d’origine (coordonnées X/Y, largeur/hauteur) ;

Générer, en sus, une description textuelle de l’image elle-même (ex. : “logo d’entreprise”, “carte de visite”, “schéma technique”, etc.), idéalement en exploitant GPT-Vision ou une solution équivalente.

Réinjecter ces informations (texte OCR et métadonnées de l’image) dans le même PDF, de façon à ce qu’un lecteur humain ou un outil de recherche interne puisse :

Voir le texte issu de l’image dans son contexte graphique ;

Disposer d’un “tag”/commentaire/annotation pour chacune des images, décrivant son contenu (par exemple, “Logo Société X” ou “Code-barres 2D”) ;

Conserver la mise en page globale du PDF (champs texte originaux, images, graphiques, etc.).

En résumé, nous voulons un “OCR augmenté” : plutôt que de traiter l’intégralité du PDF, on cible uniquement les zones images, on y applique des méthodes avancées (classiques + IA), on récupère le texte et on commente l’image, puis on reconstitue un PDF enrichi.

Budget indicatif : 1 000 € à 10 000 €

Publication : 04 juin 2025 à 08h29

Profils recherchés : Développeur spécifique freelance , Développeur Python freelance , Développeur API freelance , Développeur Machine Learning freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

33 freelances ont répondu à ce projet

30 propositions de devis en moins de 2h

Killian Rochet Développeur Python
Mirai-Tech Agence développement spécifique
Spidrontech - Votre Partenaire Mobile Et Web Agence de développement web
Kévin  Guiot Développeur full-stack
EncureIT_Systems Agence IA
Jayan Grondin Développeur web
Jaidi Wael Développeur full-stack
+26

Montant moyen des devis proposés : 3 250 €

Estimation du délai : 19 jours

Publier un projet similaire

Nos ressources utiles

Allez plus loin avec nos ressources liées à ce projet !

Simulateur de prix : Combien coûte une refonte de logo ?

Simulateur de prix : Combien coûte un logo ?

Téléchargement : Cahier des charges pour créer un logo

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients