Home > Blog > Яндекс > Эволюция поисковых алгоритмов Яндекса

Эволюция поисковых алгоритмов Яндекса

Опубликовано 12.07.2011 От

Алгоритмы Яндекса

Яндекс постоянно меняет алгоритм ранжирования сайтов: происходит добавление новых функционалов, убираются баги, добавляются фильтры и ограничения. Кроме этого, подгонка выдачи осуществляется таким образом, чтобы быть максимально качественной и соответствовать запросу. На протяжении длительного времени статистика алгоритмов ранжирования велась только внутри компании (точнее будет сказать, внутри единственного отдела). Вполне естественно, что при резком обновлении большинство вебмастеров и пользователей были, мягко говоря. недовольны.

В июле 2007 сотрудниками Яндекса впервые было произведено анонсирование ввода новых алгоритмов. Первое время все они не имели названия, возможности просмотреть список изменений также не предоставлялось. Для определения того, что именно было изменено в алгоритме Яндекса, люди, занимающиеся поисковой оптимизацией сайтов, были вынуждены заниматься экспериментами и тестировать выдачу. Но в любом аспекте такой работы можно найти и положительные моменты. Многие из экспериментирующих оптимизаторов выступали с докладами на конференциях и писали статьи на тему наблюдений за работой обновленных алгоритмов Яндекса, зарабатывая себе тем самым уважение и популярность. За счет таких тружеников seo-компании также смогли получить конкурентное преимущество.

Все это продолжалось вплоть до 2008 года. В этот период Яндекс впервые ввел алгоритм 8 SP1, пообещав при этом в дальнейшем называть алгоритмы согласно названиям городов. Чтобы освежить в памяти алгоритмы ранжирование, давайте поговорим о нескольких городах…

 

Магадан

В мае 2008 года вышел в свет алгоритм, который назвали “Магадан”. В данном алгоритме были следующие преимущества:

– увеличение числа факторов ранжирования в два раза;
– присутствие классификаторов ссылок и контента;
– усовершенствование геоклассификатора;
– улучшение скорости поиска согласно запросам, по которым поиск выдает наибольшее количество документов;
– смягчение фильтрации сортировки документов для ранжирования путем увеличения максимально допустимого расстояния между словами запроса в документе;
– добавление функции обработки, транслитерации и перевода аббревиатур;

В процессе поиске, помимо слов, указанных в тексте страницы, присутствует перевод и транслитерация URL частей. Благодаря данной опции поисковая система понимает, что слово “mail” означает  “почта”, а аббревиатура “bmw” по-русски звучит как “бмв”

– усовершенствование системы обработка запросов, включающих большое количество слов;
– выполнение поиска текстов, содержащих дореволюционную орфографию;

К примеру, по запросу «кафедра Ветхого завета», поисковая система выдаст вариант “каѳедра Ветхаго Завѣта”. Может произойти и наоборот. При необходимости поиска исключительно слов, пишущихся согласно правилам старой орфографии, поиск можно ограничить точной формой слова, взяв его/их в кавычки: “Бѣлый, блѣдный, бѣдный, бѣсъ”. Более того, в данном случае поиск пытается отличить подобные слова от слов украинского происхождения. Если Вы вобьете в поисковик украинское слово «мiнiстр», то система выдаст Вам только слово “мiнiстр”. Русского варианта данного слова выдано не будет. Но при необходимости поиска старорусских слов, содержащих символ “i”, (запрос «мiр») современный русскоязычный вариант данного слова (“мир”) будет присутствовать.

– усовершенствование колдунщика;

Яндекс прилагает все усилия, чтобы ответить на вопрос, максимально сокращая усилия и время «юзера». При вводе запроса “создать сайт” система ответит: “создание сайтов в Киеве”. Если Вас интересует другой город, то и информацию Вам покажут для того города, в котором Вы находитесь. Если Вы спрашиваете “Елена Колмановская”, ответ будет примерно таким: “Елена Колмановская — главный редактор, Яндекс ”. Вам также будет предоставлена ссылка на пресс-портрет, написанный согласно материалам СМИ. Подобные подсказки носят название “колдунщики”, так как благодаря им начинает казаться, что поисковик иногда понимает даже больше того, что Вы хотели на самом деле.

Июль 2008 года – рождение второй версии Магадана. Эта версия включает в себя дополнительные факторы ранжирования, которые могут учесть уникальность содержания, принадлежность контента к порнографическому и так далее.

Находка

Сентябрем 2008 года датируется запуск “Находки”. Данный алгоритм был  отличается следующим:

– Увеличением качества ранжирования при вводе запросов, содержащих стоп-слова;
– Внедрением обновленного подхода к машинному обучению;
– Расширением словарей «Яндекс»;

С вводом «Находки» в словарях можно обнаружить словосочетания, раздельное написание которых имеет тот же смысл, что и слитное (при вводе запроса «авто ваз» система выдаст также страницы, содержащие слово “автоваз”).

Все оптимизаторы утверждают, что работа старых доменов – на порядок выше работы новых. Следовательно, спрос на старые домены растет. Отношение «Яндекса» к сайтам, постоянно меняющим контент родительского окна путем «перенаправления» на другие ресурсы – не очень хорошее.

Арзамас (Анадырь)

В апреле 2009 года «Яндекс» запустил еще один алгоритм, который назвали “Арзамас”. В данном алгоритме есть следующие отличительные свойства:

– улучшенное понимание русского языка, что позволяет разобраться с друзначностью слов в запросах;

При запросе «реконструкция Маяковской», Вы увидите в том числе страницу со словами «открытие станции Маяковской после реконструкции». Но все мы знаем, что русский язык очень неоднозначный. При вводе запроса «фото львов», пользователь может искать как фото животных, так и фото Львова – одного из крупнейших городов Украины. Уточнив формулировку запроса путем добавления некоторых слов («фото африканских львов», «фото города Львов», Вы можете быть уверены, что система поймет Вас так, как этого хотите Вы.

– учет региона, в котором находится пользователь. Итоговый результат поиска по одинаковому запросу, но в разных областях, был разным, но система отдельно выделила 19 крупных регионов;
– каждый сайт имеет отныне привязку к региону, зависящую от ip-адреса хостинга, настроек каталога, контактной информации на странице;
– разделение запросов на геозависимые и геонезависимые, ввод региональных формул ранжирования;
– в разделе «подсказка об опечатках» при определении языка запроса отныне учитывается язык браузера;
– введение жесткой фильтрации в отношении страниц, содержащих попандер-баннеры, кликандеры и бодиклики;
– усовершенствование формулы для запросов, содержащих большое количество слов;

Снежинск

В ноябре 2009 года вышел в свет алгоритм “Снежинск”. Он имеет следующие преимущества:

– введение добавочных параметров ранжирования (на один документ работает до нескольких тысяч параметров поиска);
– введение добавочных региональных факторов;
– введение системы MatrixNet, рассчитанной для самообучения;
– устранено отрицательное воздействие простыней,
– улучшение поиска первоисточников информации;
– появление фильтров АГС;

 

Конаково

Данный алгоритм вышел в свет в декабре 2009 года. По сути, он представляет собой  улучшенную версию “Снежинска”. Единственное, что их отличает – улучшение показателей локального ранжирования. Сейчас ранжирование сайтов включает не только 19 крупнейших регионов, но также 1250 городов России. В это же время «Яндекс» запустил также новый язык запросов.

 

 

 

 

Обнинск

Появился  “Обнинск”  в сентябре 2010 года. Он отличается следующими преимуществами:

– усовершенствование ранжирования согласно гео-независимым запросам (коих может быть в потоке до 70 процентов) для пользователей России;
– формула ранжирования теперь имеет объем равный 280 Мбайт;
– искусственные ссылки не имеют теперь большого влияния на ранжирование;

За последнее время произошел ряд изменений в алгоритме поиска с целью ограничения воздействия SEO-ссылок на процесс ранжирование. Это, в основном, касалось SEO-ссылок с сайтов, имеющих контент плохого качества, а также недавно возникших SEO-ссылок.

– усовершенствование процесса транслитерации, улучшение процесса поиска при составлении запроса латиницей;
– усовершенствован процесс определения  авторов текстов;

Примерно в это же время произошло обновление  интерфейса для просмотра сохраненных копий страниц, что позволяет увидеть дату кэша документа.

 

Краснодар

Ну и, наконец, последний из ныне существующих алгоритмов, смена которого произошла в декабре 2010 года. Для алгоритма «Краснодар»была даже разработана особая технология, которую назвали Спектр.

– «Яндекс» выполняет классификацию запросов путем выделения объектов и присвоения категории каждому запросу (музыканты, строительные материалы, спортсмены);
– дополнительные слова, присутствующие в спектре запроса, также способствуют усовершенствованию процесса ранжирования;
– происходит усваиваемость определенных поведенческих факторов с целью усовершенствования качества выдаваемого материала;
– обновлен процесс ранжирование по геозависимым вопросам;

В течение этого периода произошла также индексация социальной сети «Вконтакте», а также ввод расширенных сниппетов для различных типов организаций.

«Яндекс» не собирается останавливаться на достигнутом, он продолжает работать и совершенствовать свои алгоритмы, стараясь максимально улучшить качество выдаваемого материала.