Яндекс выбрасывает дубли из базы
Весьма популярным оказалась новость о том, что идет сокращение базы Яндекса путем удаления дубликатов и копий проиндексированных документов. Удаление дублей очередное новшество со стороны разработчиков для оптимизации алгоритмов выдачи Яндекса. То что в выдаче по запросам находится большое количество мусора и копипаста не вызывает сомнений и в целях очиститься Яндекс вводит новую политику.
Подразумевается удаление дублирующего контента и сохранение в базе лишь первоисточника, по видимому согласно дате первой индексации. Конечно, такая чистка возможно наведет некоторый порядок в поисковой выдаче, но где гарантии того, что контент был проиндексирован на источнике раньше, чем он был сворован и проиндексирован на говно сайте?
Последний апдейт показал начало глобальных изменений, база Яндекса похудела примерно на 3%, выкинув сайты дубликаты. Возможно с одной стороны такие введения упростят жизнь оптимизаторам. Раз идет борьба с дублирующим контентом, значит по идее возникающие копии на блогах (архивы, категории) не должны в последствии быть проиндексированы и появиться в базе Яндекса.
Воздействие данного алгоритма покажет себя со временем, но боюсь, не вышло бы это все боком господам созидателям и разработчикам поисковика. Есть вероятность выпадения из базы сайтов первоисточников и соответственно возможный рост нареканий в сторону Яндекса со стороны большого количества вебмастеров.
Насколько эффективным будет нововведение Яндексом, выясниться в ближайшее время. Будем надеяться на то, что Яндекс выбрасывая дубли из базы будет более благоразумен и учтет большинство факторов, которые приведут к истоку контента, хотя практика уже показала несовершенство своих предшественников кропящих над выдачей в поиске.
Добавить комментарий