Простейший скрипт для распознавания поисковых ботов
Пользователи, просматривающие топик: none
|
Зашли как: Guest
|
Имя |
Сообщение |
<< Старые топики Новые топики >> |
|
|
Простейший скрипт для распознавания поисковых ботов - 2009-02-06 17:15:21.283333
|
|
|
azimzaim
Сообщений: 320
Оценки: 0
Присоединился: 2009-01-04 22:14:32.760000
|
Скрипт сохраняет информацию о поисковых ботах. <?
$usd=$_SERVER['HTTP_USER_AGENT'];
$usd=strtolower($usd);
$botname=array("yandex"=>"Yandex","googlebot"=>"Google",
"mediapartners-google"=>"Mediapartners-Google (Adsense)","slurp"=>"Hot&nbsp;Bot&nbsp;search",
"webcrawler"=>"WebCrawler&nbsp;search","zyborg"=>"Wisenut&nbsp;search",
"scooter"=>"AltaVista","stackrambler"=>"rambler","aport"=>"Aport","lycos"=>"Lycos",
"webalta"=>"WebAlta","yahoo"=>"Yahoo","msnbot"=>"msnbot/1.0",
"ia_archiver"=>"Alexa search engine","fast"=>"AllTheWeb");
foreach($botname as $key=>$value)
{if (strstr($usd, $key))
{$bot=$value; break;}
}
if(isset($bot))
{ extract($_SERVER);
$data = fopen("bot.cli", "a+");
fwrite($data, $bot."|".@$HTTP_REFERER."|".@$HTTP_ACCEPT_LANGUAGE."|".@$REMOTE_ADDR."|".@$HTTP_HOST.@$REQUEST_URI."|".time()."|||||||\r\n");
fclose($data);
}
?>
Скрипт можно кинуть куда угодно, а потом только require_ once("имя этого файла"); И не забудьте имя файла в который будет сохраняться инфа (у меня bot.cli) променять на свое или используйте MySQL.
|
|
|
RE: Простейший скрипт для распознавания поисковых ботов - 2009-02-06 21:19:06.113333
|
|
|
Marsipan
Сообщений: 51
Оценки: 0
Присоединился: 2008-11-02 11:00:50.740000
|
А что там о них сохранять то? Что они искали? :)
|
|
|
RE: Простейший скрипт для распознавания поисковых ботов - 2009-02-07 19:47:39.650000
|
|
|
oRb
Сообщений: 4044
Оценки: 597
Присоединился: 2007-03-28 18:45:06.630000
|
Забудьте про функцию eregi.
|
|
|
RE: Простейший скрипт для распознавания поисковых ботов - 2009-02-08 02:53:12.836666
|
|
|
azimzaim
Сообщений: 320
Оценки: 0
Присоединился: 2009-01-04 22:14:32.760000
|
quote:
ORIGINAL: oRb Забудьте про функцию eregi. вы правы, протестил и решил заменить eregi на strstr. Исправил первый пост. Протестил ещё раз. За 9 часов словило: Google, Mediapartners-Google (Adsense), msnbot/1.0,rambler, Hot Bot search. Самое интересное, что все боты, кроме гугла, сначала лезут в профиль юзера. Не понятно почему.
|
|
|
|
|