5 1 1 1 1 1 1 1 1 1 1 Рейтинг 5.00 [1 Голос]

Релевантность выдачи поисковых машин

Сам термин "релевантность" обозначает максимальное совпадение выдачи поисковых запросов с содержанием страницы. Степень релевантности наглядно показывает качество действия любой системы поиска. В цифровом виде релевантность страницы вычисляется соотношением употребленных ключевиков на заданной странице сайта, выданной поисковиком на запрос пользователя, с общим объёмом текста. Отдельная поисковая система отличается своим процентным вхождением поисковой фразы в текст, которая обозначает высокую релевантность страницы, обычно это значение составляет примерно 5%.

С развитием Всемирной паутины поисковые системы стали играть главную роль в разработке и продвижении сайтов, благодаря росту качества их алгоритмов пользователи получили быстрый доступ к информации по запросам. Стремительно стало расти количество сайтов и это породило проблему. Ведь на каждый запрос в ответ выдавали до тысячи сайтов. Для решения этой проблемы поисковики разработали понятие релевантности, по которой отбирались пользователям подходящие по запросу документы. Релевантность определяли по внутренним параметрам, то есть по плотности ключевых фраз в самом тексте, в заголовке, в оформлении текста, мета - тегах и так далее. Но после появления дорвеев, которые оптимизировались под такими критериями, стали определять по внешним параметрам, определяющим соответствие сайта запросу.

Внутренние параметры релевантности

Самым важным внутренним критерием, определяющим релевантность, считаются ключевые слова, с их частотой в текстах. Поисковые системы высчитывают этот параметр, когда какое - либо словосочетание часто повторяется, считают его за ключевую фразу. Если пользовательский запрос находит эти фразы на странице, и они являются ключевыми, - сайт будет релевантным данному запросу.

От месторасположения ключевых слов тоже зависит многое, надо, чтобы они находились в заголовках. Существуют дополнительные факторы, влияющие на вес ключевиков:

  • расположенность ключевых слов близко от начала страницы. Чем ближе расстояние ключевых слов от начала страницы, тем они считается значимее;
  • оформленность ключевых слов в тегах, заголовках, мета - тегах текста;
  • ключевые слова расположены близко друг к другу;
  • употребление устойчивого словосочетания в роли поискового запроса;
  • употребление синонимов ключевых слов.

Поисковые системы распознают в текстах другие формы ключевых слов, которые показывают, что в документе речь идёт по теме запроса.

Внешние параметры релевантности

Релевантность по внешним критериям определяется цитируемостью или ссылочной популярностью. По данному фактору подразумевается то, что релевантность сайта зависит от популярности его в сети интернет, то есть ссылаемости других ресурсов на рассматриваемую страницу. Чем больше их число, тем больше будет вес сайта, информация, изложенная на нём, будет более качественной. Каждая поисковая система пользуется своим алгоритмом определения степени цитируемости, но у всех механизм действия имеет сходство с первым в мире алгоритмом, учитывающим число ссылок на страницу, - PageRank, который разработали студенты из Америки Ларри Пейдж и Сергей Брин, основатели поисковой системы Гугл.

В Яндексе таким алгоритмом является ВИЦ – взвешенный индекс цитирования, введённый в 2001 году. С 2002 года коэффициент популярности стали использовать и в системе Рамблер, в которой учитывают и количество ссылок, и посещаемость сайта, получаемые от счетчика Toп - 100. Самой первой системой, которая применила такой алгоритм, считается «Апорт». В отличие от PageRank, индексом цитирования учитывается всего одна, наиболее весомая ссылка со всех ссылающихся сайтов.

Наша Рассылка

Еженедельные новости, материалы о информационных технологиях и веб