Поисковики видят скрытые файлы?
156 сообщений
#17 лет назад
Тут услышал инетересную мысль от знакомого, о том что мол роботы поисковиков которые индексирую страницу, видят даже те файлы, на которые нет нигде ссылок. То есть если я например положил файл picture.jpg в корень сайта, то есть большая вероятность что поисковик его увидит. Это правда? Честно скажу, с технической точки зрения, я могу только предположить перебор названий файлов, но это бред, зачем это поисковику. Так вот ответте мне, это правда, или мне наврали? =)
339 сообщений
#17 лет назад
Наврали. Скажу другую, более правдивую информацию, гораздо больше половины всех сайтов практически не проиндексированы
Если просто создать сайт и не поставить на него ни одной ссылки и никуда не засабмитить - поисковики его тоже не найдут никогда.
711 сообщений
#17 лет назад
Цитата ("librarian"):Наврали.
Скажу другую, более правдивую информацию, гораздо больше половины всех сайтов практически не проиндексированы
Если просто создать сайт и не поставить на него ни одной ссылки и никуда не засабмитить - поисковики его тоже не найдут никогда.
+1
156 сообщений
#17 лет назад
Та я вот тоже подумал что наврали, так как не могу себе представить как можно получить содержимое, ну разве что если на серваке включен режим показа содержимого каталогов =)
1090 сообщений
#16 лет назад
Цитата ("AlekseySribnyj"):Так вот ответте мне, это правда, или мне наврали? =)
Конечно наврали.
Но есть еще такой вариант, что поисковик имеет отношение к хостингу (Яндекс и Народ.Ру, например), тогда это технически возможно, но практически наврядли это будут делать.
339 сообщений
#16 лет назад
Гугля может найти и проиндексить сайт на который нет ни одной ссылки. Проверено.
200 сообщений
#16 лет назад
Создайте файл с названием "robots.txt" и там пропишите ссылки на те файлы, которые поисковики не должны видеть..
1090 сообщений
#16 лет назад
Цитата ("librarian"):Гугля может найти и проиндексить сайт на который нет ни одной ссылки. Проверено.
Сайт может быть.
Но не страницу.
43 сообщения
#16 лет назад
Цитата ("AlekseySribnyj"):Тут услышал инетересную мысль от знакомого, о том что мол роботы поисковиков которые индексирую страницу, видят даже те файлы, на которые нет нигде ссылок. То есть если я например положил файл picture.jpg в корень сайта, то есть большая вероятность что поисковик его увидит. Это правда? Честно скажу, с технической точки зрения, я могу только предположить перебор названий файлов, но это бред, зачем это поисковику. Так вот ответте мне, это правда, или мне наврали? =)
Не наврали. Может увидеть. Мало того, есть факты что некоторые роботы плевать хотели и на директивы в robots.txt . Так что куда хочу туда хожу...
Хотите чтоб четко какой то робот не увидел ваш файлик? Закрывайте его htaccess -ом. Против апачей не попрешь.
10 сообщений
#16 лет назад
Млин, ну не бывает такого... гляньте в логи запросов с поисковиков...
43 сообщения
#16 лет назад
Чего не бывает? Что роботы ходят как хотят? Вот кусок robots.txt например от джумлы - зачем, скажите, закрывать следующие директории, если ссылок на них в здравом уме никто не наделает?Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /help/
Или ничтожная кучка людей, называемая сообществом, просто погорячилась и написала чушь в роботсе, лишь бы было?
10 сообщений
#16 лет назад
ireland, не бывает чтобы поисковики обращались к файлам на которые нет ссылок.Цитата:
... если ссылок на них в здравом уме никто не наделает?я бы не стал на этот самый здравый ум надеяться; ИМХО редко встречается.
43 сообщения
#16 лет назад
Цитата ("Humaneil"):ireland, не бывает чтобы поисковики обращались к файлам на которые нет ссылок.
Цитата:... если ссылок на них в здравом уме никто не наделает?я бы не стал на этот самый здравый ум надеяться; ИМХО редко встречается.
Давайте мыслить дальше - запрет стоит на директорию, то что было бы, если бы этого запрета не было и я поставил бы ссылку на эту директорию? Какой тогда смысл в запрете? Это запрет на индексацию файлов в директории. Значит все-таки может?
10 сообщений
#16 лет назад
Цитата:Это запрет на индексацию файлов в директории.
вот кусочек из моего httpd.conf
<Directory ... >
Options Indexes Includes FollowSymLinks
...
</Directory>
угадай что значит Indexes
43 сообщения
#16 лет назад
Цитата ("Humaneil"):Цитата:Это запрет на индексацию файлов в директории.
вот кусочек из моего httpd.conf
<Directory ... >
Options Indexes Includes FollowSymLinks
...
</Directory>
угадай что значит Indexes
Попробую. Indexes - показывать посетителю список файлов, если в выбранном каталоге нет файла index.html или его аналога, FollowSymLinks -обрабатывать симлинки. Так что ничего не мешает ему обрабатывать и все остальное, что не запрещено.
10 сообщений
#16 лет назад
Цитата:Какой тогда смысл в запрете? Это запрет на индексацию файлов в директории. Значит все-таки может?
Цитата:
Indexes - показывать посетителю список файлов, если в выбранном каталоге нет файла index.html или его аналога
Ну вот вы на свой вопрос и ответили... или нет?
43 сообщения
#16 лет назад
Вобщем так. Не хотим чтобы лазило куда попало, пишем так:<Directory ... >
Options -Indexes FollowSymLinks
AllowOverride None
</Directory>
66 сообщений
#16 лет назад
Не труЪ. лучше так:<Directory ... >
Order Allow,Deny
Deny from all
</Directory>
Так враг точно не пройдет ^^
А если серьезно, то это глупости, ИМХО: до прохождения тестов Тьюринга компьютерам еще далеко, а уж в экстрасенсы их записывать... Как вариант - поисковики могут читать файл robots.txt и переходить по указанным в нем ссылкам, якобы запрещенным для индексирования.
Оффтопик
http://www.whitehouse.gov/robots.txt
159 сообщений
#16 лет назад
Цитата:Как вариант - поисковики могут читать файл robots.txt и переходить по указанным в нем ссылкам, якобы запрещенным для индексирования.
Тогда поисковики нарушают правила, потому что нельзя индексировать страницы, явно закрытые для индексирования. Не думаю, что они стали бы их нарушать...