Les meilleurs développeurs PHP freelances sont sur Codeur.com

Nettoyer et améliorer le code php d'une page

 Fermé·Moins de 500 €·5 offres·1362 vues·9 interactions


J’ai un moteur de recherche en full text (php-mysql), ce dernier fonctionne dans son ensemble. Par contre, j’ai un souci selon les mots clefs cherchés et certainement des doublons dans mes choix.…

La page a nettoyer est celle ou s'affiche les résultats de mon moteur de recherche (Full text, php, mysql)

En intro, je scrape selon une url soumise, le titre, mots-clés, description et le texte de la home page d’un site, le tout passe par un enregistrement mysql.

Ma recherche :

Elle s’effectue en fulltext avec les booléens, si aucun résultat n’est trouvé, je coupe les 2 premiers mots clefs de plus de 4 caractères pour y ajouter un * (pommes deviendrait pomm* etc..) et être ainsi plus large dans ma requête de recherche fulltext… Si à ce stade, rien n’est toujours trouvé, je switch une dernière fois pour effectuer la recherche en LIKE… [AME]

La recherche prend en compte des mots clefs de 3 à plus de caractères.
La recherche doit tenir compte des opérateurs disponibles avec la recherche en Full text (*, <, (), ~ etc..) [AME]

Affichage des résultats :

Selon les résultats trouvés, j’affiche d’office : le titre, l’url puis la description avec des conditions pour cette dernière…

Conditions :
Initialement, la description affichée est obtenue par le texte (16'000 caractères maxi), j’en garde que 400 caractères maxi selon les mots clés trouvés, généralement 3 blocs de texte de 130 caractères positionné selon un snippet (selon ce qui suit ou précède le ou les mots clefs suivi d’une coupure au premier espace trouvé et suivi de ..) [AME]

Les mots clés trouvés sont colorés (mis en gras) et ce, uniquement sur la description (peut-être utile de le faire sur le titre et l’url.. je ne sais pas encore..), après je ne sais pas s’il faut coloré tous les termes trouvés ou uniquement ceux de plus de 3 lettres (histoire d’éviter de colorer les de, le, les, ce etc…) [AME]

Si je n’ai pas de mots clefs trouvés dans le texte, j’affiche simplement la description initialement scrapé.. mais j’aimerai éviter cela.. (le cas où les mots clefs serait trouvés que dans le titre ou l’url..), j’aimerais si c’est le cas, également afficher 3 blocs de 120 caractères mais se rapprochant le plus possible de mots clés (si le premiers mots clef est pomme, qu’il regarde si un texte pourrait s’afficher avec comme mots clé pomm* par exemple et le coloré.. [CORR]

Conclusion :

Pour les questions que je me pose ou que je ne suis pas certain, si une fonction est proposée, je pourrais adapter mes besoins à future (genre coloration des mots de min x lettres etc..)

Mon code sur la page de recherche en question fait ~650 lignes et est commenté au mieux (selon mes maigres connaissances..)

Le but de ma démarche est d’améliorer mon code et de le corriger, pas de tout refaire.

Mon script fonctionne, mais n’est certainement pas optimisé ou codé avec des doublons ou pas codé assez simplement.. Toutes suggestions est la bienvenue ;-) Tout est en UFT-8 mais je travail avec les différents charset récupérés des sites scrapés.

[AME] = Code à améliorer
[COR] = Code à corriger

Comme le site est en ligne, il est fortement souhaitable d’effectuer les corrections sur une page2 de mon fichier, celle-ci pourra donc se tester en ligne.
Merci d’avance
Steve

Budget indicatif : Moins de 500 €

Publication : 04 avril 2017 à 15h24

Profils recherchés : Développeur PHP freelance

Le profil du client est reservé aux prestataires abonnés

Créer un compte

5 freelances ont répondu à ce projet

5 propositions de devis en moins de 2h

H

Montant moyen des devis proposés : 250 €

Estimation du délai : 1 jour

Publier un projet similaire

Chaque jour, des centaines de clients utilisent Codeur.com pour trouver un prestataire. Créez votre compte dès maintenant, remplissez votre profil et trouvez de nouveaux clients.

Trouver des nouveaux clients

Votre navigateur Web n’est plus à jour. Il ne permet pas d’afficher correctement le site Codeur.com.
Nous vous invitons à mettre à jour votre navigateur ou à utiliser un autre navigateur plus récent.