Главной задачей поисковой системы является предоставление наиболее релевантной поисковому запросу информации. Поскольку сайт может содержать исчерпывающий ответ на заданный пользователем вопрос, но в то же время код страницы может содержать ошибки, которые не позволят открыть страничку в браузере, на плечи поисковой системы ложится и оценка каждого представленного в поиске web-документа. В идеале, если страница № 1 и страница № 2 содержат одинаковые тексты, но страница № 1 содержит, например, незакрытые теги, более высокую оценку конечно же получит страница с номером 2.
Современные поисковые системы оценивают не только валидность HTML-кода, но и много другой информации. С каждым годом эти алгоритмы становятся более сложными и всё более совершенными. Если в 2005 году робот поисковой системы обращал внимание на число повторений конкретного слова или фразы и на основе этой статистики давал странице оценку, сейчас подобными манипуляциями высокую позицию в результатах поиска сайты получить не могут. Кроме того, алгоритмы проводят сложный анализ как текста, так и самой страницы.
Но к несчастью, поисковая система - это всего лишь программа, которая не может понять, что именно ищет человек, задавший поисковый запрос «квартиры москва». Это может быть как поиск объявлений о продаже/аренде, так и поиск агентства недвижимости. Кроме того, поисковой системе не всегда легко определить, какую информацию разместил администратор сайта на конкретной странице, ведь структура данных на разных сайтах может отличаться. В этой связи была разработана и применяется семантическая разметка данных, почитать о которой можно на странице Яндекс.Помощи.
Но как же непонятная многим разметка может сделать сайт понятнее для поисковой системы, если сами данные при этом не меняются? А если семантическая разметка сделана с ошибками, пользователь увидит в результатах поиска «мусор»? Конечно же нет. Семантическая разметка - это лишь подсказки, с помощью которых поисковые системы получают большее понимание размещённой на страницах информации. И как раз это понимание используется для улучшения поисковой выдачи.
Возьмём в пример самый простой запрос, который Яндекс часто приводит в подсказке под строкой поиска - «дешёвые авиабилеты новосибирск». Если взглянуть на результаты поиска по этому или аналогичному ему запросу, не составит труда догадаться, что для участия в результатах поиска на страницу нужно добавить текст вида «Предлагаем дешёвые авиабилеты в Новосибирске» или «Только у нас дешёвые авиабилеты из Новосибирска!». Без подобных фраз на странице алгоритмы поисковой системы просто не поймут, что предлагаемые вами авиабилеты имеют низкую стоимость.
С другой стороны, наличие на странице подобных фраз вовсе не гарантирует дешевизну билетов, всё может быть с точностью наоборот, ведь большую часть информации, которую вы встречаете на сайтах, создаёт человек, а ему свойственно ошибаться. Где-то поставил лишний нолик, где-то вместо единицы нажал на цифру 2, где-то нарошно допустил ошибку, чтобы привлечь к материалу большее внимание. Именно поэтому поисковой системе требуется сначала просканировать всю информацию, выделить важные моменты, сравнить эту информацию с информацией на других сайтах, а только потом приступить к ранжированию.
А что же поделать, если простым анализом страницы обойтись нельзя по причине того, что на сайтах может располагаться ложная или неверная информация? Здесь на помощь приходят другие, более современные и более сложные алгоритмы, в разработке которых, порой того не подозревая, участвуют сами владельцы сайтов. Чтобы понять, как владельцы сайтов помогают улучшить поиск, рассмотрим этот момент более детально на примере упомянутых выше авиабилетов.
Во-первых, как поисковой системе обозначить минимальную и максимальную стоимость авиабилета, учитывая, что она может меняться изо дня в день и что на некоторых сайтах может встречаться неверная информация? Ответ прост - попросить администраторов сайтов сделать микроразметку на странице.
Смысл специальной разметки - обратить внимание робота поисковой системы на конкретные данные, а значит, отсечь много ненужной информации. Например, часть цифр при простом анализе текста могла быть воспринята как стоимость авиабилета. Также это помогает определить, в каких пределах может меняться стоимость, а значит проигнорировать цифры в несколько раз больше или меньше (ложные/неверные данные).
Во-вторых, как поисковая система определит, на какой странице даётся информация о дешёвых билетах, а на какой под дешёвыми подразумевают билеты, допустим, на полторы тысячи рублей дороже? Ответ очевиден - сравнить стоимость билетов с разных сайтов.
Информация о том, каков минимум и максимум стоимости авиабилета, у поисковой системы уже есть благодаря микроразметке на нескольких сайтах. Остаётся найти все сайты и отсортировать их по возрастанию этой стоимости. Кстати, чаще всего первыми на нововведения наподобие специальных тегов разметки реагируют крупнейшие порталы, которым люди доверяют, поэтому вопрос на недостоверной информации не заостряется.
В-третьих, как определить, даёт ли сайт исчерпывающую информацию на запрос? Здесь и приступают к работе сложные алгоритмы, которые анализируют, анализируют, анализируют.
Например, показывать в результатах поиска страницы, на которых из дешёвых только одно предложение, а все остальные авиабилеты в полтора раза дороже, чем у конкрентов, - плохо. Значит, учесть нужно и количество предложений. Также нужно проанализировать стоимость билетов по разным направлениям, ведь подобный запрос - общий, мы пока не знаем, куда хочет полететь человек. Учитываем их и перед нами предстаёт уже более ясная картина.
В-четвёртых, как определить, какой сайт достоин более высоких позиций, а какой явно не стоит показывать на первой страничке результатов поиска? На этом этапе нужно определить качественные сайты.
Вероятно, если бы алгоритмы поиска Яндекса не были бы скрыты за коммерческой тайной, ответ поисковой системы на этот вопрос был бы расписан в нескольких томах. Помимо валидного кода, хорошей вёрстки и наличия на странице формы поиска наверняка есть ещё много критериев отбора качественных сайтов. Присваиваем каждому базовый рейтинг, оцениваем качество страниц и меняем рейтинг в большую или меньшую сторону. В результате получаем то, что нужно отдавать на запрос пользователям.
Не будет удивлением, если сайты, которые помогают улучшить результаты поиска, предоставляя информацию в «понятных» для Яндекса форматах, рано или поздно займут более высокие позиции в результатах поиска. Например, если на странице без специальной разметки Яндекс не сможет найти информацию о дате вылета, а на другом сайте эта информация будет отмечена специальным тегом или атрибутом к тегу, мнение поисковой системы будет заключаться в том, что именно второй сайт даёт более исчерпывающую информацию на запрос пользователя. Отсюда и более высокая позиция в результатах поиска.
Рассмотренный пример лишь показывает, как в несколько этапов поисковые системы могут определить, на каких сайтах содержится полезная информация, а на каких предлагается информация, с помощью которой владелец сайта пытается заполучить более высокие позиции. В реальности всё может быть в десятки раз сложнее или не реализовано вовсе.
Для тех веб-мастеров, что посетили эту страницу в поисках ответа на вопрос, стоит ли использовать микроразметку, ответ один: стоит. Если семантическая разметка данных не даст вашему сайту конкурентные преимущества сегодня, то уже завтра всё может измениться. И даже в случае, если ваш сайт уже ранжируется лучше многих других, не стоит игнорировать эти рекомендации, ведь какой-то из конкурирующих с вашим сайтов может начать использовать разметку данных и за счёт этого получить более высокую оценку поисковой системы.
Современные поисковые системы оценивают не только валидность HTML-кода, но и много другой информации. С каждым годом эти алгоритмы становятся более сложными и всё более совершенными. Если в 2005 году робот поисковой системы обращал внимание на число повторений конкретного слова или фразы и на основе этой статистики давал странице оценку, сейчас подобными манипуляциями высокую позицию в результатах поиска сайты получить не могут. Кроме того, алгоритмы проводят сложный анализ как текста, так и самой страницы.
Но к несчастью, поисковая система - это всего лишь программа, которая не может понять, что именно ищет человек, задавший поисковый запрос «квартиры москва». Это может быть как поиск объявлений о продаже/аренде, так и поиск агентства недвижимости. Кроме того, поисковой системе не всегда легко определить, какую информацию разместил администратор сайта на конкретной странице, ведь структура данных на разных сайтах может отличаться. В этой связи была разработана и применяется семантическая разметка данных, почитать о которой можно на странице Яндекс.Помощи.
Но как же непонятная многим разметка может сделать сайт понятнее для поисковой системы, если сами данные при этом не меняются? А если семантическая разметка сделана с ошибками, пользователь увидит в результатах поиска «мусор»? Конечно же нет. Семантическая разметка - это лишь подсказки, с помощью которых поисковые системы получают большее понимание размещённой на страницах информации. И как раз это понимание используется для улучшения поисковой выдачи.
Возьмём в пример самый простой запрос, который Яндекс часто приводит в подсказке под строкой поиска - «дешёвые авиабилеты новосибирск». Если взглянуть на результаты поиска по этому или аналогичному ему запросу, не составит труда догадаться, что для участия в результатах поиска на страницу нужно добавить текст вида «Предлагаем дешёвые авиабилеты в Новосибирске» или «Только у нас дешёвые авиабилеты из Новосибирска!». Без подобных фраз на странице алгоритмы поисковой системы просто не поймут, что предлагаемые вами авиабилеты имеют низкую стоимость.
С другой стороны, наличие на странице подобных фраз вовсе не гарантирует дешевизну билетов, всё может быть с точностью наоборот, ведь большую часть информации, которую вы встречаете на сайтах, создаёт человек, а ему свойственно ошибаться. Где-то поставил лишний нолик, где-то вместо единицы нажал на цифру 2, где-то нарошно допустил ошибку, чтобы привлечь к материалу большее внимание. Именно поэтому поисковой системе требуется сначала просканировать всю информацию, выделить важные моменты, сравнить эту информацию с информацией на других сайтах, а только потом приступить к ранжированию.
А что же поделать, если простым анализом страницы обойтись нельзя по причине того, что на сайтах может располагаться ложная или неверная информация? Здесь на помощь приходят другие, более современные и более сложные алгоритмы, в разработке которых, порой того не подозревая, участвуют сами владельцы сайтов. Чтобы понять, как владельцы сайтов помогают улучшить поиск, рассмотрим этот момент более детально на примере упомянутых выше авиабилетов.
Во-первых, как поисковой системе обозначить минимальную и максимальную стоимость авиабилета, учитывая, что она может меняться изо дня в день и что на некоторых сайтах может встречаться неверная информация? Ответ прост - попросить администраторов сайтов сделать микроразметку на странице.
Смысл специальной разметки - обратить внимание робота поисковой системы на конкретные данные, а значит, отсечь много ненужной информации. Например, часть цифр при простом анализе текста могла быть воспринята как стоимость авиабилета. Также это помогает определить, в каких пределах может меняться стоимость, а значит проигнорировать цифры в несколько раз больше или меньше (ложные/неверные данные).
Во-вторых, как поисковая система определит, на какой странице даётся информация о дешёвых билетах, а на какой под дешёвыми подразумевают билеты, допустим, на полторы тысячи рублей дороже? Ответ очевиден - сравнить стоимость билетов с разных сайтов.
Информация о том, каков минимум и максимум стоимости авиабилета, у поисковой системы уже есть благодаря микроразметке на нескольких сайтах. Остаётся найти все сайты и отсортировать их по возрастанию этой стоимости. Кстати, чаще всего первыми на нововведения наподобие специальных тегов разметки реагируют крупнейшие порталы, которым люди доверяют, поэтому вопрос на недостоверной информации не заостряется.
В-третьих, как определить, даёт ли сайт исчерпывающую информацию на запрос? Здесь и приступают к работе сложные алгоритмы, которые анализируют, анализируют, анализируют.
Например, показывать в результатах поиска страницы, на которых из дешёвых только одно предложение, а все остальные авиабилеты в полтора раза дороже, чем у конкрентов, - плохо. Значит, учесть нужно и количество предложений. Также нужно проанализировать стоимость билетов по разным направлениям, ведь подобный запрос - общий, мы пока не знаем, куда хочет полететь человек. Учитываем их и перед нами предстаёт уже более ясная картина.
В-четвёртых, как определить, какой сайт достоин более высоких позиций, а какой явно не стоит показывать на первой страничке результатов поиска? На этом этапе нужно определить качественные сайты.
Вероятно, если бы алгоритмы поиска Яндекса не были бы скрыты за коммерческой тайной, ответ поисковой системы на этот вопрос был бы расписан в нескольких томах. Помимо валидного кода, хорошей вёрстки и наличия на странице формы поиска наверняка есть ещё много критериев отбора качественных сайтов. Присваиваем каждому базовый рейтинг, оцениваем качество страниц и меняем рейтинг в большую или меньшую сторону. В результате получаем то, что нужно отдавать на запрос пользователям.
Не будет удивлением, если сайты, которые помогают улучшить результаты поиска, предоставляя информацию в «понятных» для Яндекса форматах, рано или поздно займут более высокие позиции в результатах поиска. Например, если на странице без специальной разметки Яндекс не сможет найти информацию о дате вылета, а на другом сайте эта информация будет отмечена специальным тегом или атрибутом к тегу, мнение поисковой системы будет заключаться в том, что именно второй сайт даёт более исчерпывающую информацию на запрос пользователя. Отсюда и более высокая позиция в результатах поиска.
Рассмотренный пример лишь показывает, как в несколько этапов поисковые системы могут определить, на каких сайтах содержится полезная информация, а на каких предлагается информация, с помощью которой владелец сайта пытается заполучить более высокие позиции. В реальности всё может быть в десятки раз сложнее или не реализовано вовсе.
Для тех веб-мастеров, что посетили эту страницу в поисках ответа на вопрос, стоит ли использовать микроразметку, ответ один: стоит. Если семантическая разметка данных не даст вашему сайту конкурентные преимущества сегодня, то уже завтра всё может измениться. И даже в случае, если ваш сайт уже ранжируется лучше многих других, не стоит игнорировать эти рекомендации, ведь какой-то из конкурирующих с вашим сайтов может начать использовать разметку данных и за счёт этого получить более высокую оценку поисковой системы.
Комментариев нет:
Отправить комментарий