Алекс К.
1623 сообщения
#15 лет назад
Цитата:
Из официального блога Яндекса "Определение первоисточника текста, размещённого в сети, это сложная задача, которая ещё не решена в общем виде. Однако нам удалось построить алгоритм, который во многих случаях по косвенным признакам определяет, какая из группы страниц с одинаковым текстом является оригиналом. Этот алгоритм уже работает в российской формуле ранжирования, а через некоторое время он будет включён и для всех остальных стран.."


Интересно, синонимайзер, рерайт как он будет определять?
Максим Б.
2206 сообщений
#15 лет назад
Цитата ("Alex_Koval"):
Интересно, синонимайзер, рерайт как он будет определять?


Никак. В том и смысл рерайта.
Артем Л.
11416 сообщений
#15 лет назад
Что за бред придумал яндекс Полюбому в их алгоритме будет куча ошибок!
Артём К.
1157 сообщений
#15 лет назад
Цитата ("Hungry_Hunter"):
Что за бред придумал яндекс Полюбому в их алгоритме будет куча ошибок!


Без ошибок не обойтись, но примерно вычислить можно.
Если, к примеру, есть сайт, известный Яндексу с 2005 года, и сайт созданный в 2009, а текст на них одинаковый, то скорее всего на более раннем сайте первоисточник.
Артем Л.
11416 сообщений
#15 лет назад
Цитата ("superkoder"):
но примерно вычислить можно.

Вот именно что примерно! А значит с ошибками!

Цитата ("superkoder"):
Если, к примеру, есть сайт, известный Яндексу с 2005 года, и сайт созданный в 2009, а текст на них одинаковый, то скорее всего на более раннем сайте первоисточник.

А вот и неправильный подход! Сайт 2005 года вполне мог взять статью с сайта который 2009 года...
Алекс К.
1623 сообщения
#15 лет назад
Они там же пишут по этому поводу "Иногда издательство выкладывает свои тексты в сеть позже, чем это делают пользователи."
То есть принципы определения первоисточника вообще неясны. По возрасту? По "пузу"? То есть, купив старый пузатый домен можно будет обижать маленьких?

Зашла в блог перечитать вчерашнюю запись, у них еще одна новость - АГС-30. Похоже это - одна медалька.
Евгений Б.
5330 сообщений
#15 лет назад
Оффтопик
слила злая матчеха водку с пивом и сказала золушке, что бы к утру все было раздельно


Цитата ("Alex_Koval"):
Они там же пишут по этому поводу "Иногда издательство выкладывает свои тексты в сеть позже, чем это делают пользователи."
То есть принципы определения первоисточника вообще неясны. По возрасту? По "пузу"? То есть, купив старый пузатый домен можно будет обижать маленьких?

это просто супер, собрав на сайте новости с 3-4-10 источников и регулярным обновлением 20 разделов мы заставляем бота смотреть нас чаще... и становимся "первоисточником"
Артём К.
1157 сообщений
#15 лет назад
Цитата ("Hungry_Hunter"):
Вот именно что примерно! А значит с ошибками!


С ошибками, конечно.

Цитата ("Hungry_Hunter"):
А вот и неправильный подход! Сайт 2005 года вполне мог взять статью с сайта который 2009 года...

Тоже верно.

Но то же могучий Яндекс, оно смотрит по многим параметрам. В каких-то случаях найти первоисточник вполне можно.
А в каких-то вполне можно установить, что текст стырен.
Андрей К.
1172 сообщения
#15 лет назад
Цитата ("superkoder"):
Но то же могучий Яндекс

С каких пор это творение индусов стало могучей?
Евгений Б.
5330 сообщений
#15 лет назад
Цитата ("Lisio"):
С каких пор это творение индусов стало могучей?

я бы сказал с каких пор генератор случайных чисел стал поисковиком... выдача по некоторым запросам просто наводит тоску и истерический смех
Владимир М.
327 сообщений
#15 лет назад
Молодцы, обругали. А теперь напишите что-нибудь более качественное, чем дружно оплёванный вами "генератор случайных чисел".

PS я пользуюсь Google
Алекс К.
1623 сообщения
#15 лет назад
P.P.S. О яндексе можно вообще не писать.
Пока отправляешь сообщение новость перестает быть новостью по причине выхода еще двух алгоритмов.
Вячеслав Г.
105 сообщений
#15 лет назад
Цитата ("ArtPro"):
я бы сказал с каких пор генератор случайных чисел стал поисковиком...

Такая участь ждет все поисковики благодаря стараниям братьев оптимизаторов. В результате они все станут генераторами случайной выдачи
Евгений Б.
5330 сообщений
#15 лет назад
Оптимизаторов не трогайте.
когда в выдаче по запросу "пенобетон" вылезают сайты где нет упоминания ни пены, ни бетона - это не оптимизаторы сделали.
ненадо вообще оптимизаторам давать свойства магов.
на деле есть не такое и большое число методов поднять выдачу (не путать с ТиЦ) и все они легальные и белые.
Вячеслав Г.
105 сообщений
#15 лет назад
А что будут делать оптимизаторы, если, к примеру, поисковики первые 100 записей будут выдавать в случайном порядке?
Евгений Б.
5330 сообщений
#15 лет назад
А ничего. люди перестанут пользоваться поиском если выдача будет неадекватной.. рамблер так и слил. и усть ща у них все получше, но былого не вернуть, а рамблерICQ в конец забила гвоздь в крышку гроба и наполнила лучами поноса из политика в отбирании красивых номеров (6 и 7 знаки)
Анна П.
11 сообщений
#15 лет назад
Нет, ну по-моему однозначно нужно определять первоисточником сайт, на котором впервые в истории появился данный контент. вот эти вот все рассуждения,что кто-то выкладывает свой контент "позже" - это уже их проблемы. все прекрасно знат, что нужно для того, чтобы контент привязали к твоему сайту - выложить его сначала на нем. а иначе получится гадание на кофейной гуще..
Артем Л.
11416 сообщений
#15 лет назад
Цитата ("kattykatty"):
Нет, ну по-моему однозначно нужно определять первоисточником сайт, на котором впервые в истории появился данный контент. вот эти вот все рассуждения,что кто-то выкладывает свой контент "позже" - это уже их проблемы. все прекрасно знат, что нужно для того, чтобы контент привязали к твоему сайту - выложить его сначала на нем. а иначе получится гадание на кофейной гуще..

О как, да Вы гений Только вот на одни сайты робот заходит 1 раз в полчаса, а на другой раз в месяц...
Евгений Б.
5330 сообщений
#15 лет назад
Цитата ("kattykatty"):
ну по-моему однозначно нужно определять первоисточником сайт, на котором впервые в истории появился данный контент

у меня 2 сайта ботом яши просматриваются каждый 12 часов. да, я тырю статьи на лиексе, на блогах, на новостных сайтах. и хочу Вас заверить, что такая работа на более чем 50% получается.. блогеры в попе - я первоисточник (только если блогер по соц закладкам не прогнал статью). в лиексе вообще прелесть, особенно статьи по нулевым ценам. новостные сайты в большинстве случаев быстро просматриваются яшей, но есть много таких у которых статья индексируется через пару дней-неделю. ну и я их наказываю