Интернет — Part 4

Автор: | 05.01.2012

Поисковая программа «Обнинск» вышла из стадии бета-тестирования, новый алгоритм обрабатывает гео-независимые запросы на yandex.ru.

Ранжирование (англ. ranking) — применительно к работе поисковой системы — это процесс выстраивания найденных по запросу пользователя страниц в порядке наибольшего соответствия искомому запросу.

Новая программа будет применяться для ранжирования поисковых запросов, сделанных без географической привязки. Доля подобных «геонезависимых» запросов составляет до 70 процентов от общего числа обращений пользователей к поисковику.

Сложность формулы ранжирования выросла почти в два с половиной раза, и теперь объем формулы составляет 280 Мбайт (совсем недавно, в июле 2010 года, Илья Сегалович на конференции SIGIR рассказывал, что формула ранжирования, занимавшая в 2006 году 0,02 килобайта, разрослась до ~120 Мбайт, а теперь ему снова придется перерисовывать слайд).

Уточняется, что разработчики были вынуждены провести дополнительную оптимизацию «Обнинска» для России, поскольку в нашей стране «Яндекс» обрабатывает большее количество запросов. Ежедневно их количество составляет порядка 100 миллионов.

Отметим, что название «Обнинск» было выбрано не просто так. Предыдущая поисковая программа ведущего поисковика России называлась «Конаково», таким образом название следущего алгоритма должно было начинаться на букву «О».

Оригинальная статья