Les meilleurs développeurs informatique freelances sont sur Codeur.com
Fermé · Moins de 500 € · 10 offres · 808 vues · 23 interactions
Je cherche un développeur Python pour créer un script d’extraction de texte depuis un PDF complexe contenant des annonces légales (en arabe, structurées en colonnes) vers un fichier CSV organisé par ligne d’annonce.
Objectifs du script :
Entrée : PDF (structure répétitive, publié chaque semaine)
Sortie : fichier CSV avec les colonnes suivantes :
Nom d’entreprise
Texte de l’annonce (en arabe)
Numéro de page
Contraintes techniques :
Texte en arabe avec mise en page en colonnes
Précision maximale exigée : les annonces doivent être restituées à l’identique
À fournir :
Script Python fonctionnel, bien documenté
CSV conforme aux spécifications
Je fournirai :
3 éditions PDF pour le développement
<br /> Le script sera validé sur d’autres éditions avant paiement
Exigences :
Expérience en extraction de PDF complexes et en texte arabe
Exemple du pdf :
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]
---------------------------------------------------------------------------
I'm looking for a Python developer to build a script that extracts text from a complex PDF containing legal announcements in Arabic (structured in columns) and outputs it as a CSV file, organized with one row per announcement.
Script objectives:
Input: PDF (repetitive structure, published weekly)
Output: CSV file with the following columns:
Company name
Announcement text (in Arabic)
Page number
Technical constraints:
Arabic text with multi-column layout
Maximum precision required: the announcements must be reproduced exactly as in the original
Deliverables:
A functional, well-documented Python script
A CSV file that fully complies with the required structure
What I will provide:
3 sample PDF editions for development
Final validation will be done using other editions before payment
Requirements:
Proven experience in extracting text from complex PDFs and handling Arabic script
------------------------------------------------------------------------------------------------
أبحث عن مطوّر Python لإنشاء سكريبت يقوم باستخراج النص من ملفات PDF معقّدة تحتوي على إعلانات قانونية باللغة العربية (منسّقة في أعمدة)، وتحويلها إلى ملف CSV منظم، يحتوي على كل إعلان في سطر مستقل.
أهداف السكريبت:
المدخل: ملف PDF (هيكل متكرر، يُنشر أسبوعياً)
المخرج: ملف CSV يحتوي الأعمدة التالية:
اسم الشركة
نص الإعلان (باللغة العربية)
رقم الصفحة
القيود التقنية:
النص باللغة العربية ومنسق على شكل أعمدة
الدقة القصوى مطلوبة: يجب أن يتم استخراج الإعلانات مطابقة تماماً للنص الأصلي
المخرجات المطلوبة:
سكريبت Python جاهز للتنفيذ، موثق بشكل جيد
ملف CSV متوافق تماماً مع المواصفات المذكورة
ما سأوفره:
3 نسخ PDF لاستخدامها أثناء التطوير
سيتم اختبار السكريبت على نسخ أخرى قبل اعتماد الدفع
المتطلبات:
خبرة مؤكدة في استخراج النصوص من ملفات PDF المعقدة والتعامل مع اللغة العربية
------------------------------------------------------------------------------
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]
[URL visible pour les membres Pro]
Budget indicatif : Moins de 500 €
Publication : 06 mai 2025 à 13h50
Profils recherchés : Développeur spécifique freelance , Développeur Python freelance
10 freelances ont répondu à ce projet
9 propositions de devis en moins de 2h
Montant moyen des devis proposés : 350 €
Estimation du délai : 2 jours