Добро пожаловать! Это — архивная версия форумов на «Хакер.Ru». Она работает в режиме read-only.
 

Могут ли забанить робота?

Пользователи, просматривающие топик: none

Зашли как: Guest
Все форумы >> [Веб-программинг] >> Могут ли забанить робота?
Имя
Сообщение << Старые топики   Новые топики >>
Могут ли забанить робота? - 2007-10-18 18:47:11.480000   
evshi

Сообщений: 4
Оценки: 0
Присоединился: 2006-11-10 23:02:22.270000
Предложили сделать робота, который будет по расписанию ходить на сайт и смотреть, обновились ли новости.

Проблем в реализации подобного скрипта не вижу. Не понятно только одно - могут ли его забанить владельцы сайта, где робот будет проверять новости? Точнее даже не то, что могут или не могут (понятно, что могут), а как они его могут вычислить? Посещаемость сайта несколько тысяч уников в сутки. Роботу необходимо делать порядка 30 заходов в сутки. Т.к. запускаться планирую по крону, то обращения будут, примерно раз в час.

1) Какого вероятность, что его отловят, если я буду отдавать корректный user-agent, делать заходы в определенно время, раз в час?

2) Существуют ли какие-нибудь средства, отлавливающие посещаемость одних и тех же запросов в одно и тоже время? Если да, то что это за средства?
Post #: 1
RE: Могут ли забанить робота? - 2007-10-18 18:55:36.630000   
dx

Сообщений: 337
Оценки: 0
Присоединился: 2006-12-15 13:35:49.700000
1) сделай, чтоб он заходил не строго по расписанию, а с некоторым рандомом, например, +-20 мин
2) юзер-агента выбирай из некоторого списка опять-таки рандомом.
 
Тогда я думаю не отловят точно.
Post #: 2
RE: Могут ли забанить робота? - 2007-10-19 13:57:51.183333   
evshi

Сообщений: 4
Оценки: 0
Присоединился: 2006-11-10 23:02:22.270000
quote:

ORIGINAL: dx

1) сделай, чтоб он заходил не строго по расписанию, а с некоторым рандомом, например, +-20 мин
2) юзер-агента выбирай из некоторого списка опять-таки рандомом.

Тогда я думаю не отловят точно.


1) Не уверен, что так можно, т.к. хостер в crone, кажется, не предоставляет запуск по рандому, а только в четко назначенное время. В самом скрипте (PHP) тоже особо не разойдешься, т.к. execute time limit = 30 секунд.
Post #: 3
RE: Могут ли забанить робота? - 2007-10-19 15:42:39.790000   
dx

Сообщений: 337
Оценки: 0
Присоединился: 2006-12-15 13:35:49.700000
time limit можно сделать неограниченным: set_time_limit(0);
(Если эта функция разрешена)
А вообще, я думаю, если user-agent менять рандомно, то уже вычислить, что это бот, будет очень сложно
Post #: 4
RE: Могут ли забанить робота? - 2007-10-19 15:52:59.440000   
0v3r10rd

Сообщений: 211
Оценки: 0
Присоединился: 2007-06-28 18:47:52.503333
товарищ dx сказал верно рандом, ещё crone умеют рандомизироваться сами…
ещё такой нюанс робот сра3у в страницу новостей а большинство юзеров заходят с главной…
если правильно настроить то по идее не должен спалиться
Post #: 5
RE: Могут ли забанить робота? - 2007-10-19 19:37:55.773333   
evshi

Сообщений: 4
Оценки: 0
Присоединился: 2006-11-10 23:02:22.270000
quote:

ORIGINAL: dx

time limit можно сделать неограниченным: set_time_limit(0);
(Если эта функция разрешена)
А вообще, я думаю, если user-agent менять рандомно, то уже вычислить, что это бот, будет очень сложно

я все волнуюсь, что вычислят по IP. Ведь если рандомно запускать не получится (они этого не предоставляют), то запуск будет примерно в одно и тоже время (могу чуть-чуть рандомизировать за счет set_time_limit=30). Наверняка есть какие-нубудь средства, отслеживающие подобные штуки. Тем более если у меня будет 3-5 запросов за запуск одного скрипта, то влогах это будет очень хорошо видно по IP и случайный UA здесь не поможет, т.к. они могут зайти по полученному IP и увидеть, что это сервер, а не человек…

Кстати, кажется cron вообще не умеет рандомно запускаться. Пробовал в гугле искать на эту тему, не нашел. Может дать ссылку или пример?

Потом если еще имитировать путь пользователя (главная-новости-подробный просмотр), то 30 сек. точно не хватит:((((
Post #: 6
RE: Могут ли забанить робота? - 2007-10-19 20:11:12.640000   
dx

Сообщений: 337
Оценки: 0
Присоединился: 2006-12-15 13:35:49.700000
quote:

я все волнуюсь, что вычислят по IP

Юзай curl и прокси
 
quote:

cron вообще не умеет рандомно запускаться

Cron запускает команды или скрипты строго по расписанию заданному
 
А вообще - неужели админам так надо выслеживать этого робота? Если они так трясутся за свои новости, то зачем же тогда они вообще выкладывают их в инет?
Post #: 7
RE: Могут ли забанить робота? - 2007-10-19 23:06:11.780000   
mxxm

Сообщений: 253
Оценки: 0
Присоединился: 2004-03-13 08:39:42
А вот я не согласен с тем, что надо изменять user-agent. Ведь IP-то не меняется.
Это выходит "Человек интересующийся новостями заходит раз в час со своего компьютера, но меняет браузеры…"
Подозрительно.
Вот если бы каждому IP, с которого делается запрос, соответствовал свой User-Agent, тогда другое дело.
Post #: 8
RE: Могут ли забанить робота? - 2007-10-20 13:27:37.110000   
dx

Сообщений: 337
Оценки: 0
Присоединился: 2006-12-15 13:35:49.700000
Вообще-то на одном ip могут сидеть 100 человек. Число ip адресов ограничено, поэтому ничего подозрительного в этом нет.
Post #: 9
RE: Могут ли забанить робота? - 2007-10-21 03:34:00.466666   
furiousangel

Сообщений: 1116
Оценки: 0
Присоединился: 2005-05-28 06:31:47
ага… у нас так вся общага под одним ипом сидит… неудобно…. рядом сидит друг с компом… когда в ганджу рубились (еще с гпрс) то могли заходить в один бой, и организованно валить врага… а щас даже в боях друг друга не видим:D:D:D:D
Post #: 10
RE: Могут ли забанить робота? - 2007-10-24 01:13:32.860000   
mxxm

Сообщений: 253
Оценки: 0
Присоединился: 2004-03-13 08:39:42
quote:


Вообще-то на одном ip могут сидеть 100 человек. Число ip адресов ограничено, поэтому ничего подозрительного в этом нет.&nbsp;&nbsp;

Такое бывает, когда все сидят через прокси или vpn провайдера. (У меня нет ни того, ни другого. Слава Богу!) Вот я и не подумал. Но прокси - это повод для дополнительных размышлений по поводу http-запроса, может роботу следует изображать прокси-сервер, через который заходят все пользователи…
Post #: 11
Страниц:  [1]
Все форумы >> [Веб-программинг] >> Могут ли забанить робота?







Связаться:
Вопросы по сайту / xakep@glc.ru

Предупреждение: использование полученных знаний в противозаконных целях преследуется по закону.