Les meilleurs développeurs informatique freelances sont sur Codeur.com

Extraction texte pdf complexe en colonne

 Fermé · Moins de 500 € · 10 offres · 808 vues · 23 interactions


Je cherche un développeur Python pour créer un script d’extraction de texte depuis un PDF complexe contenant des annonces légales (en arabe, structurées en colonnes) vers un fichier CSV organisé par ligne d’annonce.

Objectifs du script :
Entrée : PDF (structure répétitive, publié chaque semaine)
Sortie : fichier CSV avec les colonnes suivantes :
Nom d’entreprise
Texte de l’annonce (en arabe)
Numéro de page

Contraintes techniques :
Texte en arabe avec mise en page en colonnes
Précision maximale exigée : les annonces doivent être restituées à l’identique

À fournir :
Script Python fonctionnel, bien documenté
CSV conforme aux spécifications

Je fournirai :
3 éditions PDF pour le développement <br /> Le script sera validé sur d’autres éditions avant paiement

Exigences :
Expérience en extraction de PDF complexes et en texte arabe

Exemple du pdf :
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]

---------------------------------------------------------------------------
I'm looking for a Python developer to build a script that extracts text from a complex PDF containing legal announcements in Arabic (structured in columns) and outputs it as a CSV file, organized with one row per announcement.

Script objectives:
Input: PDF (repetitive structure, published weekly)
Output: CSV file with the following columns:
Company name
Announcement text (in Arabic)
Page number

Technical constraints:
Arabic text with multi-column layout
Maximum precision required: the announcements must be reproduced exactly as in the original

Deliverables:
A functional, well-documented Python script
A CSV file that fully complies with the required structure

What I will provide:
3 sample PDF editions for development
Final validation will be done using other editions before payment

Requirements:
Proven experience in extracting text from complex PDFs and handling Arabic script
------------------------------------------------------------------------------------------------
أبحث عن مطوّر Python لإنشاء سكريبت يقوم باستخراج النص من ملفات PDF معقّدة تحتوي على إعلانات قانونية باللغة العربية (منسّقة في أعمدة)، وتحويلها إلى ملف CSV منظم، يحتوي على كل إعلان في سطر مستقل.

أهداف السكريبت:
المدخل: ملف PDF (هيكل متكرر، يُنشر أسبوعياً)
المخرج: ملف CSV يحتوي الأعمدة التالية:
اسم الشركة
نص الإعلان (باللغة العربية)
رقم الصفحة

القيود التقنية:
النص باللغة العربية ومنسق على شكل أعمدة
الدقة القصوى مطلوبة: يجب أن يتم استخراج الإعلانات مطابقة تماماً للنص الأصلي

المخرجات المطلوبة:
سكريبت Python جاهز للتنفيذ، موثق بشكل جيد
ملف CSV متوافق تماماً مع المواصفات المذكورة

ما سأوفره:
3 نسخ PDF لاستخدامها أثناء التطوير
سيتم اختبار السكريبت على نسخ أخرى قبل اعتماد الدفع

المتطلبات:
خبرة مؤكدة في استخراج النصوص من ملفات PDF المعقدة والتعامل مع اللغة العربية
------------------------------------------------------------------------------
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]

Budget indicatif : Moins de 500 €

Publication : 06 mai 2025 à 13h50

Profils recherchés : Développeur spécifique freelance , Développeur Python freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

10 freelances ont répondu à ce projet

9 propositions de devis en moins de 2h

Addfi Développeur full-stack
Leila Khouas Développeur Python
aseto Développeur spécifique
MODON Développeur spécifique
Patrick Zermatten Développeur blockchain
Ad_Astra Développeur Python
Tristan Hérou Développeur back-end
+3

Montant moyen des devis proposés : 350 €

Estimation du délai : 2 jours

Publier un projet similaire

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients