a74
Pages: 1
Post reply
$exclude="news;crawler;spider;rss;crossdata;whois;gigabot;diaporama;crossdomain; kassiopea_networks;guestbook;majestic;_comments;twiceler;BenChannels;Jeeves;gigamega; majestic;interface;flashme;favicon;libwww-perl;HTTPConnect;favicon;access;w00t;rss;crossdata; ia_archiver;playlist;REF1;swf ;ico ;jpg ;txt ;gif ;css ;png ;js ; service ;logs/;_p.html ;flv ;spicons;goto.php;a.html ;bendot;sql/;admin/;VoilaBot;s215394373;s201850272;style;inc/Piframe"; #des motifs pour exclure les lignes de logs dont on s'en tappe :] $contents=file_get_contents($file,0,NULL,$offset,$length);#php5 required $Lines=explode("\n",$contents);#chaque ligne FOREACH($Lines as $k=>$v){#instructions} Ainsi on ne conserve que les lignes importantes, le script peut traiter 30M de données en <1m En Ajoutant des filtres, il est très judicieux de raccourcir les champs "user agent" function RAK($v){#FRAK $v=ereg_replace("\"([^\"]+)Firefox([^\"]+)\"","\"Firefox\"",$v); $v=ereg_replace("\"([^\"]+)MSIE([^\"]+)\"","\"MSIE\"",$v); $v=ereg_replace("\"([^\"]+)Slurp([^\"]+)\"","\"Slurp\"",$v); $v=ereg_replace("\"([^\"]+)Googlebot([^\"]+)\"","\"ggbot\"",$v); $v=ereg_replace("\"([^\"]+)Apple([^\"]+)\"","\"Mac\"",$v); $v=ereg_replace("\"Googlebot([^\"]+)\"","\"ggbot\"",$v); $v=ereg_replace("\"([^\"]+)msnbot([^\"]+))\"","\"msnbot\"",$v); return $v; } La concat s'effectue sur un fichier, semaine par semaine, en conservant l'auto incrément, on parvient rapidement à obtenir des statistiques en temps réel de tous ses serveurs :] Les résultats de WebAlizer étant bien plus probants et exploitables que google Analytics .. une petite moulinette du genre tournant en cron sur le serveur s'avère très efficace :]
Offline