Un article de mon ancien blog qui rencontrait un franc succès était un simple parseur php qui permet de lire les logs apache d’un serveur web pour en extraire les informations essentielles, les entrer en base etc.
Comme tout SEO qui se respecte le sait, analyser des logs apache et le comportement de GoogleBot (ou Yahoo Slurp! etc.) est essentiel. lorsque j’ai démarré, j’ai mis du temps a apprendre à lire et utiliser correctement des logs apache.
Voici donc un petit script d’une simplicité ultime qui pourra aider ceux qui débutent à découvrir le monde merveilleux des robots d’indexation ! Ce script peut aussi être utilisé pour analyser les visites …
Pré-requis :
- Un serveur dédié sous linux (ou un accès SSH à l’hébergement et aux logs apache)
- Php 4 ou 5 installé en mode client (sudo apt-get install php5-cli…) , mais peut aussi fonctionner avec apache (en supposant que ce dernier ai les droits de lecture sur les fichiers de log)
- L’accès au dossier contenant les logs apache et au format combined (logique jusque là…)
- Un peu de patience !
Commencez par téléchargez le script ici, décompressez le et copiez le sur votre hébergement. Vous devez alors renseigner les 2 variables suivantes avec vos propres informations :
- $folder= »/var/log/apache2/ »; // Chemin complet vers le dossier de vos logs
- $mask= »blog-access »; // Masque de vos fichier (il peut y avoir plusieurs sites)
Une fois que c’est fait, lancez simplement le script en l’appelant via apache ou en mode client (prefered) :
php log_parser.php
Vous pouvez alors modifier à loisir le script pour insérer vos hits sous mysql et faire des comptages plus précis etc.
Amusez vous bien !










