Перейти к содержимому

93. Факторы текста документа

Факторы текста документа, могущие повлиять на ранжирование в поисковых машиных. В скобочках дан уровень важности от 1 до 5.

  • Тэг Title [5]. Содержимое этого тэга всегда отображается вверху окна броузера и очень часто показывается в серпах как заголовок найденого документа;
  • Использование ключевых слов[5]. В документе должны встречаться ключевые слова, которые может ввести пользователь для нахождения этого документа в поисковой системе;
  • Использование связаных терминов [4]. Помимо ключевых слов из запроса, поисковые машины могут определять, используются ли в тексте документа другие ключевые слова, относящиеся к той же специфичной области, что и слова из запроса;
  • Внешние ссылки из документа [4]. Внешние ссылки из документа могут как положительно, так и отрицательно сказываться на ранжировании, в зависимости от тематики страниц и сайтов, на которые указывают эти ссылки;
  • Ссылки с внутренних страниц сайта [4]. По числу ссылок внутри сайта, указывающих на каждый документ, поисковые машины могут определять, какие страницы на сайте являются наиболее важными исходя из структуры этого сайта;
  • Уникальность контента [4]. Уникальный контент -- вот что ищут все поисковики, т.е. ваш документ должен предствлять что-то новое и не быть похожим на многие другие документы в Сети, дубликаты страниц зачастую просто удаляются из поисковой базы;
  • Возраст документа [3]. Для каждого документа в поисковых машинах хранися время его появления в базе, т.е. время когда он был впервые обнаружен ботами поисковика, более старые докумеенты могут рассматриваться как более важные, ценные илди авторитетные, новые документы могут рассматривать как более релевантные при поиске с упорядочиванием по времени или новизне;
  • Авторские пометки [3]. Разбирая заведомо ценные авторские документы, поисковые машины могут определять структурные особенности таких страниц и использовать эти шаблоны при индексировании новых документов для определения возможно того же авторства или подобных документов;
  • Язык документа [3]. Естественно по запросу, например, на японском языке, более релеватными считать документы на японском же языке. Поэтому для поисковых машин желательно явно указывать язык(и) документа;
  • Морфология [3]. Документы, содержащие и другие морфологические формы слов запроса могут рассматриваться поисковыми машинами более релевантными данному запросу. Другие же поисковые машины могут рассматривать все морфологические формы как одно и тоже;
  • Структура заголовков [3]. Структура заголовков Hx на странице может дать поисковику информацию, какие части документа более или менее важные. Если заголовки одного уровня различны, но близки по теме -- это может быть дополнительно полезно;
  • Цитирование [3]. Цитирование, в смысле сносок и ссылок в книгах и журналах на источники процитированого, может положительно сказываться при поиске научной, учебной или подобной информации;
  • Глубина документа на сайте [3]. Глубиной документа на сайте считается минимальное число мышиных кликов (следую по ссылкам), необходимое для получения данного документа;
  • Мера обновлений документа [3]. Переодически просматривая документ, посиковые машины могут не только отслеживать частоту изменения документа, но и вести журнал всех изменений контента и ссылок;
  • Разнообразие и % измнеений [2]. Ведя журнал изменений документов, поисковые машины могут отслеживать какая часть контента изменялась, связано ли это с изменением шаблона страниц сайта (косметические изменения), или только одного документа, какой процент содержимого подвергался изменению, было это добавлением нового контента, или правкой старого и т.п.;
  • Структура документа [2]. Для некоторых документов, например, с длинным контентом или, особенно, для хорошо структурированых документов, порядок следования предложений, фраз и слов в теле документа может приниматься поисковиками во внимание;
  • Внутренние ссылки [2]. Релевантные внутренние ссылки на документ (навигационные ссылки не учитываются), могут подсказать поисковой машине тему данного документа;
  • Тэг Meta Keywords [2]. Несмотря на то, что этот тэг считается пережитком ранниъх дней Паутины, некоторые поисковые машины могут его использовать, можно также использовать этот тэг и для указания наиболее частых опечаток ваших ключевых слов;
  • Ключевые слова в URL [2]. Использование ключевых фраз и слов в ссылках с данного документа может дать дополнительный вес в некоторых поисковиках, независимо как эти слова указываются в URL, через дифис или слитно;
  • Тэг Meta Description [2]. Считается устаревшим, но может использоваться некоторыми поисковиками для описания вашего документа в результатах поиска, однако спорно, что использование ключевых слов в этом тэга как либо влияет на позиционирование;
  • Использование H1, bold, strong и др. [1]. Хотя тэги H1, bold, strong и др. продолжают широко использоваться для визуального выделения темы и ключевых фраз и слов, маловероятно, что они как-то влияеют на ранжирование поисковых машин, в основном из-за широкого распространения так называемой "переоптимизации";
  • Использование грамматики [1]. Использование грамматиками поисковыми машинами для ранжирования документов под вопросом, возможно только специализированые научные поисковики;
  • Правописание [1]. Так же как и граматика, правописание всех слов документа может служить мерой качества этого документа для поисковых машин. Возможно этот фактор учитывается в зависимости от запроса, а также не учитывается для специализированых сайтов из таких областей, как юмор, культура и искусство, где неправильное правописание может использоваться специально;
  • Частота стоп-слов [1]. Частота исаользования стоп-слов (наиболее часто используемых слов) может служить мерой стиля документа, если частота стоп-слов высока, вероятно это небольшая попсовая заметка, если же чатота этих слов мала -- это серьёзный неоднопараграфный текст. Вероятно этот фактор также зависит от поискового запроса;
  • Читабельность текста [1]. Читабельность текста -- это мера основаная, на частоте использования общеупотребительных, слов из словарного запаса школьников того или иного года обучения, а также редких, специализированых слов в тексте документа. Эта мера может учитываться исходя из запроса, а также если есть информаци о том, кто ищет, -- если ищет школник, то ему не осилить статьи из академических журналов;
  • Качество текста документа [1]. Хотя эта мера очень субъективна, существуют методы автоматического его определения, вероятно у каждого поисковика они свои, и пока под вопросом насколько сильно и как скоро эта мера будеит влиять на ранжирование;
  • Текст в alt/img title [1]. Хотя содержимое этих тэгов оносится к тексту документа как целому, мало вероятно, что они сильно влияют на оценку содержимого всего документа. Весьма вероятно они больше влияют на поиск изображений (вместе с именем файла картинки);
  • Длина документа [1]. Длина документа, в байта, словах, предложениях и т.п. может использоваться поисковиками при ранжированияя, подразумевая для некоторых запросов более кратнкие документы более релевантными, в других же случаях отдавая предпочтения более длиннным документам. Нет оптимального размера документа для поисковых машин;
  • Внутридокументные ссылки [1]. Поисковые машины могут использовать именованые внутридокументные ссылки (anchors) при разборе длиннных структурированых документов, напрмиер статей Wikipedia;
  • Тип документа [1]. Тип дакумента, например .pdf, .doc, .txt т.п. может учитываться при ранжировании, по-разному в зависимости от того или иного зароса;
  • Соответствие стандартам W3C [1]. Учёт поисковыми машинами этого фактора под вопросом, но забывать о нём не стоит.

//SEOMOZ.org

8 thoughts on “93. Факторы текста документа

  1. Уведомление: БЛОГика

  2. TAndrew

    > В скобочках дан уровень важности от 1 до 5.

    Весьма спорный момент. Не совсем понятно, по каким критериям это определялось.

    Использование H1, bold, strong и др. [1]
    - странно, вроде это должно сильно влиять (при условии не-злоупотребления тегами)

    Длина документа [1]
    - кто-то недавно проводил эксперименты, в результате которых выяснилось, что нижняя граница существует (около 1 Кб). Верхняя - теоретически нет, но некоторые поисковики индексируют первые 100-200 Кб и уж, во всяком случае, предпочитают текст в начале страницы.

  3. Maxime

    Уровень важности определялся по результатам опроса сеошников (их список теперь вывешен на оригинале). И отражает степень важности не каждого критерия в отдельности, а относительно всех других. Например, выделение h1 или bold практически ничто, по сравнению со ссылкой с основной страницы cnn.com (к примеру).

  4. consy

    А чем вызвано резкое нарастание, по мере приближения к концу статьи, количества грамматических ошибок и очепяток (дАкумент, исАользования, есть информаци, отсутствие запятых в нужных местах)?

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *