Главная » 2010»Июль»10 » Яндекс научился искать "в реальном времени"
Яндекс научился искать "в реальном времени"
15:19
Яндекс разработал и внедрил новую поисковую технологию, которая позволяет находить свежие документы через считанные минуты после их появления в сети Интернет. Как пишет компания у себя на сайте в разделе "Новости", достаточно много поисковых запросов (от 2% в спокойные дни до 8% в дни важных событий) посвящено событиям, которые случились совсем недавно. Задавая эти запросы, пользователи ожидают найти в том числе и документы, которые были созданы только что. Чтобы хорошо отвечать на такие запросы, Яндекс научился выявлять их среди общего потока и внедрил нового поискового робота Orange. Orange работает в режиме реального времени, и может находить свежие документы, как только они появились в интернете, индексировать их и выкладывать на поисковые сервера в течении несколько секунд. Некоторые сайты интернета обновляются не очень часто, а на других, например, на новостных ресурсах новые документы создаются постоянно. Orange обходит такие сайты и добавляет новые документы в поиск по мере их появления, без задержек. Чтобы определять, нужна ли свежая информация в ответ на те или иные запросы, Яндекс разработал несколько детекторов. Они анализируют самую разную информацию — например, тематику сообщений в СМИ или рост количества поисковых запросов по той или иной теме. «В интернете сейчас все больше real-time информации, которая нужна людям прямо сейчас. И мы хотим дать им возможность находить её прямо сейчас, — говорит Федор Романенко, менеджер качества поиска компании "Яндекс" — Это только первый шаг, конечно, мы будем улучшать качество поиска по новостным запросам и дальше. Новая технология дает возможность делать это сравнительно легко». Робот Orange и технология поиска в реальном времени были разработаны специалистами из Yandex.Labs, калифорнийского офиса компании в сотрудничестве с разработчиками из московского офиса.