Добро пожаловать! Это — архивная версия форумов на «Хакер.Ru». Она работает в режиме read-only.
 

Как разпознать бота на РНР

Пользователи, просматривающие топик: none

Зашли как: Guest
Все форумы >> [Веб-программинг] >> Как разпознать бота на РНР
Имя
Сообщение << Старые топики   Новые топики >>
Как разпознать бота на РНР - 2007-07-22 15:00:30.106666   
Bios_inside

Сообщений: 626
Оценки: 0
Присоединился: 2007-02-23 10:44:18.170000
107
Post #: 1
RE: Как разпознать бота на РНР - 2007-07-22 15:09:37.630000   
Technologist

Сообщений: 3590
Оценки: 0
Присоединился: 2006-10-28 20:28:06.943333
Поищи код в исходнике IPB :)
Post #: 2
RE: Как разпознать бота на РНР - 2007-07-22 15:53:01.553333   
DiFor

Сообщений: 49
Оценки: 0
Присоединился: 2007-05-26 15:45:17.710000
Включить моск и скурить ман по $_SERVER, а конкретно по $_SERVER['USER_AGENT']
Post #: 3
RE: Как разпознать бота на РНР - 2007-08-03 01:20:11.140000   
3N3RJ1

Сообщений: 215
Оценки: 0
Присоединился: 2007-06-05 02:38:12.423333

quote:

ORIGINAL: Bios_inside

Скажите пожалуста как на РНР выяснить, что вашу страницу посетил гуглбот, яндексбот и другие боты???
Лутше всего напишите кодом

А тебе зачем ето надо? Статистику наваять хочешь? Или что?
Post #: 4
RE: Как разпознать бота на РНР - 2007-08-03 12:17:40.670000   
Bios_inside

Сообщений: 626
Оценки: 0
Присоединился: 2007-02-23 10:44:18.170000
108
Post #: 5
RE: Как разпознать бота на РНР - 2007-08-03 12:29:42.036666   
Crack_Master

Сообщений: 1622
Оценки: 0
Присоединился: 2007-01-10 20:23:25.416666
на форумах внизу страницы показывается…
Post #: 6
RE: Как разпознать бота на РНР - 2007-08-03 16:44:46.046666   
michey

Сообщений: 295
Оценки: 0
Присоединился: 2006-11-22 16:31:33.043333
если я правильно понял,то тебя интересует индексируют твой сайт или нет…
Если да,то в самом распространенном веб-сервере Apache'е это делается по средством конфигурирования самого веб-сервера!
Post #: 7
RE: Как разпознать бота на РНР - 2007-08-03 18:54:43.236666   
furiousangel

Сообщений: 1116
Оценки: 0
Присоединился: 2005-05-28 06:31:47
Короче пару номеров назад Крис выложил имена основных поисковых ботов. ищи в ХА от 95 до 99 номера статью чет типа у гугла под колпаком или чет в этом роде (точно не помню, давно это было)
Post #: 8
RE: Как разпознать бота на РНР - 2007-08-03 21:09:40.026666   
Yashin

Сообщений: 964
Оценки: 0
Присоединился: 2007-05-09 20:18:01.153333
quote:

ORIGINAL: Bios_inside

quote:

ORIGINAL: 3N3RJ1

quote:

ORIGINAL: Bios_inside

Скажите пожалуста как на РНР выяснить, что вашу страницу посетил гуглбот, яндексбот и другие боты???
Лутше всего напишите кодом

А тебе зачем ето надо? Статистику наваять хочешь? Или что?

Ну впринципе статистика нужна. Хотя я не совсем понимаю что ты подразумиваеш под словом "наваять"? Мне просто интересно куда лазят поисковые боты&nbsp;на моем сайте, а куда нет, и что их больше всего интересует.

Да мир перевернулся, люди уже сами ничего не хотят, вслед за форумами для ботов начинают появлятся сайты для Ботов.
Post #: 9
RE: Как разпознать бота на РНР - 2007-08-03 22:16:02.593333   
Bios_inside

Сообщений: 626
Оценки: 0
Присоединился: 2007-02-23 10:44:18.170000
109
Post #: 10
RE: Как разпознать бота на РНР - 2007-08-04 01:49:28.633333   
DiFor

Сообщений: 49
Оценки: 0
Присоединился: 2007-05-26 15:45:17.710000
$bot_list = array ("googlebot", "slurp@inktomi", "archive_org", "Ask Jeeves", "Lycos", "WhatUSeek", "ia_archiver", "GigaBlast", "Gigabot", "Yandex", "Yahoo!", "Yahoo-MMCrawler", "TurtleScanner", "TurnitinBot", "ZipppBot", "StackRambler", "oBot", "rambler", "Jetbot", "NaverBot", "libwww", "aport", "msnbot", "MnoGoSearch", "booch", "Openbot", "scooter", "WebCrawler", "WebZIP", "GetSmart", "grub-client", "Vampire", "appie", "architext", "jeeves", "bjaaland", "ferret", "googlebot", "gulliver", "harvest", "htdig", "linkwalker", "lycos_", "moget", "muscatferret", "myweb", "nomad", "scooter", "voyager", "weblayers", "antibot", "digout4u", "echo", "fast-webcrawler", "ia_archiver", "jennybot", "mercator", "msnbot", "netcraft", "petersnews", "unlost_web_crawler", "voila", "webbase", "wisenutbot", "fish", "abcdatos", "acme.spider", "ahoythehomepagefinder", "alkaline", "anthill", "arachnophilia", "arale", "araneo", "aretha",
"ariadne", "arks", "aspider", "atn.txt", "atomz", "auresys", "backrub", "bbot", "bigbrother", "blackwidow", "blindekuh", "bloodhound", "borg-bot", "brightnet", "bspider", "cactvschemistryspider", "calif", "cassandra", "cgireader", "checkbot", "christcrawler", "churl", "cienciaficcion", "collective", "combine", "conceptbot", "coolbot", "core", "cosmos", "cruiser", "cusco", "cyberspyder", "desertrealm", "deweb", "dienstspider", "digger", "diibot", "direct_hit", "dnabot", "download_express", "dragonbot", "dwcp", "e-collector", "ebiness", "elfinbot", "emacs", "emcspider", "esther", "evliyacelebi", "fastcrawler", "fdse", "felix", "fetchrover", "fido", "finnish", "fireball", "fouineur", "francoroute", "freecrawl", "funnelweb", "gama", "gazz", "gcreep", "getbot", "geturl", "golem", "grapnel", "griffon", "gromit", "gulperbot", "hambot",
"havindex", "hometown", "htmlgobble", "hyperdecontextualizer", "iajabot", "iconoclast", "ilse", "imagelock", "incywincy", "informant", "infoseek", "infoseeksidewinder", "infospider", "inspectorwww", "intelliagent", "irobot", "iron33", "israelisearch", "javabee", "jbot", "jcrawler", "jobo", "jobot", "joebot", "jubii", "jumpstation", "kapsi", "katipo", "kilroy", "ko_yappo_robot", "labelgrabber.txt", "larbin", "legs", "linkidator", "linkscan", "lockon", "logo_gif", "macworm", "magpie", "marvin", "mattie", "mediafox", "merzscope", "meshexplorer", "mindcrawler", "mnogosearch", "momspider", "monster", "motor", "muncher", "mwdsearch", "ndspider", "nederland.zoek", "netcarta", "netmechanic", "netscoop", "newscan-online", "nhse", "northstar", "nzexplorer", "objectssearch", "occam", "octopus", "openfind", "orb_search", "packrat", "pageboy",
"parasite", "patric", "pegasus", "perignator", "perlcrawler", "phantom", "phpdig", "piltdownman", "pimptrain", "pioneer", "pitkow", "pjspider", "plumtreewebaccessor", "poppi", "portalb", "psbot", "python", "raven", "rbse", "resumerobot", "rhcs", "road_runner", "robbie", "robi", "robocrawl", "robofox", "robozilla", "roverbot", "rules", "safetynetrobot", "search-info", "search_au", "searchprocess", "senrigan", "sgscout", "shaggy", "shaihulud", "sift", "simbot", "site-valet", "sitetech", "skymob", "slcrawler", "smartspider", "snooper", "solbot", "speedy", "spider_monkey", "spiderbot", "spiderline", "spiderman", "spiderview", "spry", "ssearcher", "suke", "suntek", "sven", "tach_bw", "tarantula", "tarspider", "techbot", "templeton", "titan", "titin", "tkwww", "tlspider", "ucsd", "udmsearch", "urlck", "valkyrie", "verticrawl", "victoria",
"visionsearch", "voidbot", "vwbot", "w3index", "w3m2", "wallpaper", "wanderer", "wapspider", "webbandit", "webcatcher", "webcopy", "webfetcher", "webfoot", "webinator", "weblinker", "webmirror", "webmoose", "webquest", "webreader", "webreaper", "websnarf", "webspider", "webvac", "webwalk", "webwalker", "webwatch", "whatuseek", "whowhere", "wired-digital", "wmir", "wolp", "wombat", "worm", "wwwc", "wz101", "xget", "aport", "awbot", "baiduspider", "bobby", "boris", "bumblebee", "cscrawler", "daviesbot", "exactseek", "ezresult", "gigabot", "gnodspider", "grub", "henrythemiragorobot", "holmes", "internetseer", "justview", "linkbot", "linkchecker", "mediapartners-google", "metager-linkchecker", "microsoft_url_control", "nagios", "msiecrawler", "perman", "pompos", "rambler", "redalert", "shoutcast", "slysearch", "surveybot", "turnitinbot",
"turtle", "turtlescanner", "ultraseek", "webclipping.com", "webcompass", "wonderer", "yahoo-verticalcrawler", "yandex", "zealbot", "zyborg");

в связке с preg_match и буедт всё что хочешь, в массиве могут быть дубли, собирал в сове время с миру по нитке, человек просил подмен контента если на сайт пришол бот.
Post #: 11
RE: Как разпознать бота на РНР - 2007-08-04 07:06:05.446666   
Crack_Master

Сообщений: 1622
Оценки: 0
Присоединился: 2007-01-10 20:23:25.416666
Bios_inside вор тут нашёлся,бери и смотри код в Ipb,умник:D:D:Dржу
Post #: 12
RE: Как разпознать бота на РНР - 2007-08-04 13:32:14.660000   
Bios_inside

Сообщений: 626
Оценки: 0
Присоединился: 2007-02-23 10:44:18.170000
110
Post #: 13
RE: Как разпознать бота на РНР - 2007-08-04 18:15:01.686666   
Crack_Master

Сообщений: 1622
Оценки: 0
Присоединился: 2007-01-10 20:23:25.416666
искать надо искать
Post #: 14
RE: Как разпознать бота на РНР - 2007-11-16 13:55:57.396666   
7bioz

Сообщений: 182
Оценки: 0
Присоединился: 2007-11-01 22:42:52.160000
quote:

ORIGINAL: DiFor

Включить моск и скурить ман по $_SERVER, а конкретно по $_SERVER['USER_AGENT']
курил, но почему-то, ничего не курится. Вот вчера только счётчик запустил.
Сами гляньте —> Счётчик здесь
Login: -XAOC-
Pass: 8362
Я читал, что поисковые боты индексируют страницу раз в неделю, возможно ещё ни один бот не зашол, но ведь рефереры приходят от них, значит должны заходить и боты.
Post #: 15
RE: Как разпознать бота на РНР - 2007-11-16 23:27:39.506666   
7bioz

Сообщений: 182
Оценки: 0
Присоединился: 2007-11-01 22:42:52.160000
оно должно быть так:
$n=$_SERVER['USER_AGENT']; if (isset($n) and $n!="") { &nbsp; if (strstr($n, "Aport"))&nbsp;&nbsp;&nbsp; { $n="spider Aport (ru)"; } if (strstr($n, "Convera"))&nbsp; { $n="spider Convera (com)"; } if (strstr($n, "Dyatel"))&nbsp;&nbsp; { $n="spider Ya.Dyatel (ru)"; } if (strstr($n, "e-Society")){ $n="spider e-Society (jp)"; } if (strstr($n, "eStyleSe")) { $n="spider eStyleSearch (?)"; } if (strstr($n, "FAST"))&nbsp;&nbsp;&nbsp;&nbsp; { $n="spider FAST (no)"; } if (strstr($n, "Findexa"))&nbsp; { $n="spider Findexa (no)"; } if (strstr($n, "Goku"))&nbsp;&nbsp;&nbsp;&nbsp; { $n="spider Goku (ru)"; } if (strstr($n, "Google"))&nbsp;&nbsp; { $n="spider Google (com)"; } if (strstr($n, "Gigabot"))&nbsp; { $n="spider Gigabot (?)"; } if (strstr($n, "Girafa"))&nbsp;&nbsp; { $n="spider Girafa (com)"; } if (strstr($n, "ia_archiver")){ $n="spider ia_archiver (?)"; } if (strstr($n, "ichiro"))&nbsp;&nbsp; { $n="spider ichiro (jp)"; } if (strstr($n, "msnbot"))&nbsp;&nbsp; { $n="spider MSN (com)"; } if (strstr($n, "psbot"))&nbsp;&nbsp;&nbsp; { $n="spider PicSearch (com)"; } if (strstr($n, "Rambler"))&nbsp; { $n="spider Rambler (ru)"; } if (strstr($n, "Space"))&nbsp;&nbsp;&nbsp; { $n="spider Space Bison (?)"; } if (strstr($n, "Teoma"))&nbsp;&nbsp;&nbsp; { $n="spider Ask Teoma (com)"; } if (strstr($n, "Turnitin")) { $n="spider Turnitin (com)"; } if (strstr($n, "Turtle"))&nbsp;&nbsp; { $n="spider TurtleScanner (?)"; } if (strstr($n, "Yahoo"))&nbsp;&nbsp;&nbsp; { $n="spider Yahoo (com)"; } if (strstr($n, "Yandex"))&nbsp;&nbsp; { $n="spider Yandex (ru)"; } if (strstr($n, "ZyBorg"))&nbsp;&nbsp; { $n="spider ZyBorg (com)"; } unset($key); If (is_file($bots) and is_readable($bots)) { $file = file($bots); &nbsp;$i=count($file); &nbsp;for($l = 0; $l &lt; $i; $l++) &nbsp;{$line = explode("::","$file[$l]"); &nbsp;if($n == $line[0]) &nbsp; &nbsp;{$str = "$line[0]::$line[1]::$line[2]::$line[3]::::\r\n"; &nbsp;&nbsp; &nbsp; $line[1] = $line[1] + 1; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; $to = "$line[0]::$line[1]::$where::".$time."-".$date."::::\r\n"; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; $key=$l; &nbsp;&nbsp;&nbsp;&nbsp; } &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; } &nbsp;&nbsp;&nbsp; if (isset($key) and $key!="") &nbsp;{$f=fopen($bots,"a+"); &nbsp;flock($f,LOCK_EX); // Говорим, что дальше будем работать только мы &nbsp;$new=fread($f,filesize($bots)); // Читаем значение, сохраненное в файле &nbsp;$new=str_replace($str, $to, $new); &nbsp;ftruncate($f,0); // Стираем файл &nbsp;fwrite($f,$new); // Записываем новое значение &nbsp;fflush($f); // Сбрасываем файловый буфер &nbsp;flock($f,LOCK_UN); // Отключаемся от блокировки &nbsp;fclose($f); // Закрываем файл &nbsp;} &nbsp;&nbsp; &nbsp;else &nbsp;{$txt = "$n::1::$where::".$time."-".$date."::::\r\n"; &nbsp;$fp=fopen($bots,"a+"); &nbsp;&nbsp;flock ($fp,LOCK_EX); &nbsp;&nbsp;fputs($fp,"$txt"); &nbsp;&nbsp;flock ($fp,LOCK_UN); &nbsp;&nbsp;fclose($fp); &nbsp;&nbsp;@chmod("$bots", 0644); &nbsp;} } }
но что-то не катит
Post #: 16
Страниц:  [1]
Все форумы >> [Веб-программинг] >> Как разпознать бота на РНР







Связаться:
Вопросы по сайту / xakep@glc.ru

Предупреждение: использование полученных знаний в противозаконных целях преследуется по закону.