- Главная
- Ранжирование в деталях
- История развития Яндекса
Справка: история развития поисковой системы Яндекс
С 2008 года команда Яндекса стала информировать читателей своего блога о нововведениях в процессах поисковых систем, а каждому алгоритму присваивала название одного из городов России. Отобразить эволюцию алгоритма ранжирования поисковой системы Яндекс можно с помощью рассказа о путешествии из Магадана в Краснодар:
Магадан
14 апреля 2008 Яндекс открыл сервис buki.yandex.ru, где веб-мастера могли протестировать новый алгоритм «Магадан», указать ошибки и задать свои вопросы. Около месяца понадобилось Яндексу, чтобы учесть все отзывы и доработать алгоритм. 16 мая 2008 алгоритм «Магадан» вступил в силу. Новое в алгоритме:
- введен поиск по иностранным сайтам;
- увеличено в 2 раза число факторов ранжирования;
- доработан классификатор, определяющий тип страницы и ссылок;
- введен классификатор коммерциализированности;
- стала учитываться уникальность контента;
- появился классификатор порнографии;
- появился геоклассификатор запроса;
- стала возможной обработка транслита и аббревиатур.
Магадан 2.0
2 августа 2008 года введен усовершенствованный алгоритм «Магадан 2.0»:
- добавлены факторы, учитывающие уникальность контента;
- улучшен классификатор порнографии;
- улучшен геоклассификатор запроса;
- улучшен классификатор коммерциализированности.
В этот же день Яндекс проинформировал читателей своего блога о скором появлении нового алгоритма «Находка».
Находка
11 сентября 2008 года — дата начала использования алгоритма «Находка».
Основные изменения:
- новый подход к машинному обучению;
- новый способ учета факторов ранжирования по формуле;
- изменения в методе учета стоп-слов;
- улучшение поиска слов через дефис и в слитном написании.
Арзамас
Изначально данный алгоритм назывался «Анадырь», затем был переименован в «Арзамас» и выложен 10 апреля 2009 года на yandex.ru. Главное изменение — улучшение интерпретации слов, имеющих несколько значений. Это было реализовано благодаря анализу запросов пользователей, частоты слов в интернете и их сочетаемости, слов из статистики Национального корпуса русского языка.
Арзамас 1.1
17 июня 2009 года на buki.yandex.ru выложили корректировки алгоритма поисковой системы Яндекс. В «Арзамас 1.1» изменилась формула ранжирования, которая определяла результаты поиска для пользователей из России (Москвы, Санкт-Петербурга и Екатеринбурга). Версия «Арзамас 1.1» была выложена на yandex.ru 24 июня 2009.
Арзамас 1.2
17 июля 2009 года на buki.yandex.ru появилась другая версия «Арзамас 1.2». После завершения ее тестирования 20 августа версия была выложена на yandex.ru. Главное изменение заключалось в улучшении классификатора геозависимости запросов.
Арзамас +16
31 августа 2009 года очередная версия «Арзамас +16» была выложена на buki.yandex.ru для тестирования, 3 сентября — в общую выдачу. Нововведение — расширение действия поисковой системы Яндекс по регионам еще на 16 городов России: Новосибирск, Красноярск, Омск, Ростов-на-Дону, Краснодар, Нижний Новгород, Уфу, Пермь, Казань, Самару, Челябинск, Владивосток, Кемерово, Иркутск, Барнаул и Воронеж.
Арзамас 1.5
Версия «Арзамас 1.5» была выложена на buki.yandex.ru 23 сентября 2009 года. В ней была реализована общая формула ранжирования, определяющая порядок результатов поиска по геонезависимым запросам и запросам из городов, где нет локализованного ранжирования. Анонсирования выкладки данного алгоритма не было.
Арзамас 1.5 SP1
28 сентября на buki.yandex.ru была выложена последняя версия алгоритма — «Арзамас 1.5 SP1», а уже 9 октября — на yandex.ru. Изменения коснулись формулы ранжирования по геозависимым запросам в Санкт-Петербурге, Екатеринбурге, Новосибирске, Красноярске, Омске, Ростове-на-Дону, Краснодаре, Нижнем Новгороде, Уфе, Перми, Казани, Самаре, Челябинске, Владивостоке, Кемерово, Иркутске, Барнауле и Воронеже.
Таким образом, серия версий алгоритма «Арзамас» позволила:
- снять омонимию;
- изменить формулу ранжирования для пользователей из России, исключая Москву, Санкт-Петербург и Екатеринбург;
- улучшить классификатор геозависимости запросов;
- ввести региональное ранжирование еще в 16 регионах России.
АГС-17 и АГС-30
В течение осени и зимы 2009 года Яндекс исключил из индекса ресурсы, не удовлетворяющие требованиям, и сократил объем сайтов низкого качества до 1-15 страниц. С помощью алгоритмов АГС Яндекс начал борьбу с сателлитами и другими веб-страницами, не представляющими интереса для пользователей. По словам представителей Яндекса, фильтр существовал с 2006 года, но активно использовать его стали с осени 2009 года.
Снежинск
10 ноября 2009 алгоритм «Снежинск» был выложен на buki.yandex.ru для тестирования, 17 ноября — в общий поиск. Нововведения:
- новый метод машинного обучения Матрикснет;
- создание более точной и сложной математической модели, учитывающей несколько тысяч поисковых параметров для документа;
- внедрение дополнительных региональных факторов, основанных на интересе пользователей к документам;
- внедрение программы в российскую выдачу (не затронуло Украину, Казахстан и Беларусь);
- учет поведенческих факторов ранжирования.
Конаково
«Конаково» — один из алгоритмов серии «Снежинск», выложенный на www.yandex.ru 22 декабря 2009 года. С его введением локальное ранжирование стало доступно для 1250 городов, а не для 19.
Снежинск 1.1
17 марта 2010 на www.yandex.ru выложен алгоритм «Снежинск 1.1» с улучшенной общей формулой ранжирования для пользователей из России по геонезависимым запросам.
Результатом всех обновлений серии «Снежинск» стали:
- новая расширенная версия поисковой программы «Снежинск»;
- более широкое использование возможностей алгоритма Матрикснет;
- использование локального ранжирования для 1250 городов по всей России;
- учитывание нескольких десятков параметров, описывающих принадлежность сайта к тому или иному региону.
Мировой интернет
7 июля 2010 года был осуществлен запуск поиска по мировому интернету. При вводе запроса латиницей на www.yandex.ru или www.yandex.com стало возможным включить фильтр и видеть в результатах поиска только зарубежные ресурсы.
Полтава
4 августа 2010 была введена новая версия поиска для украинских пользователей «Полтава». В данном алгоритме при ответе на геозависимые запросы отдается предпочтение сайтам из региона пользователя, при этом учитывается перевод запроса с украинского на русский и наоборот.
Обнинск
6 августа 2010 на buki.yandex.ru для тестирования был выложен алгоритм «Обнинск», 13 сентября — в основной поиск на yandex.ru. Отличительные характеристики данного алгоритма:
- новое ранжирование для геонезависимых запросов по России;
- усложнение формулы ранжирования.
SEO-ссылки
23 сентября 2010 в рабочий алгоритм была внедрена корректировка, ограничивающая влияние некачественных, по мнению Яндекса, SEO-ссылок на ранжирование. Соответственно, качество выдачи для конечного пользователя значительно улучшилось.
Авторский контент
2 ноября 2010 года была усовершенствована часть алгоритма, отвечающая за определение авторства,страницы с уникальным контентом стали получать более высокие позиции.
Запросы на латинице
6 декабря 2010 была обновлена формула ранжирования: улучшена выдача по запросам, заданным латиницей.
Краснодар
15 декабря 2010 был запущен «Спектр», учитывающий множество неявных целей пользователей. Данная технология легла в основу алгоритма «Краснодар», который был запущен в поиск 17 декабря 2010 года и увеличил нахождение местных сайтов по региональным запросам.
Поведенческая накрутка
23 мая 2011 года был введен фильтр за накрутку поведенческих факторов, из-за которого ресурсы некоторых компаний потеряли свои позиции в ТОП10. Санкции коснулись тех сайтов, на которые искусственным путем значительно увеличивалось количество переходов из результатов поиска по конкретным запросам.
Рейкьявик
В августе 2011 года Яндекс запустил поисковую платформу под названием «Рейкьявик». Результатами этого стали учет языковых предпочтений пользователя, обновление поисковых формул для России и Беларуси, обновление математического колдунщика и колдунщика онлайн-игр, улучшение выдачи для запросов с опечатками, усовершенствование показа поисковых подсказок.
Переоптимизированные тексты
13 сентября 2011 было анонсировано введение текстового фильтра за чрезмерно оптимизированные тексты. Робот поисковой системы анализирует проиндексированные страницы и оценивает, являются ли они полезными, а сайт — удобным для пользователя. Если контент создан исключительно для влияния на поисковую систему, позиции этого документа в выдаче ухудшаются.
Юзабилити сайта
5 октября 2011 года Яндекс предпринял первый шаг по учету юзабилити сайта. Поисковая система стала определять, мешает ли пользователям реклама на сайте или, наоборот, дополняет его содержание. В первом случае такие сайты при ранжировании имеют более низкие позиции.
Коммерческая выдача
Для московского региона 23 ноября 2011 года была введена новая формула ранжирования по коммерческим запросам, учитывающая доверие к сайту и компании, дизайн и пользовательский интерфейс, широкий ассортимент, цены, варианты оплаты и доставки. По словам представителей Яндекса, количество параметров будет увеличиваться.
Описанное выше путешествие еще не закончено: с каждым месяцем алгоритмы все совершенствуются для повышения качества поисковой выдачи. Об анонсировании всех событий можно прочитать в блоге Яндекса.
Читать далее: Справка: история развития поисковой системы Яндекс