Факторы текста документа, могущие повлиять на ранжирование в поисковых машиных. В скобочках дан уровень важности от 1 до 5.
- Тэг Title [5]. Содержимое этого тэга всегда отображается вверху окна броузера и очень часто показывается в серпах как заголовок найденого документа;
- Использование ключевых слов[5]. В документе должны встречаться ключевые слова, которые может ввести пользователь для нахождения этого документа в поисковой системе;
- Использование связаных терминов [4]. Помимо ключевых слов из запроса, поисковые машины могут определять, используются ли в тексте документа другие ключевые слова, относящиеся к той же специфичной области, что и слова из запроса;
- Внешние ссылки из документа [4]. Внешние ссылки из документа могут как положительно, так и отрицательно сказываться на ранжировании, в зависимости от тематики страниц и сайтов, на которые указывают эти ссылки;
- Ссылки с внутренних страниц сайта [4]. По числу ссылок внутри сайта, указывающих на каждый документ, поисковые машины могут определять, какие страницы на сайте являются наиболее важными исходя из структуры этого сайта;
- Уникальность контента [4]. Уникальный контент -- вот что ищут все поисковики, т.е. ваш документ должен предствлять что-то новое и не быть похожим на многие другие документы в Сети, дубликаты страниц зачастую просто удаляются из поисковой базы;
- Возраст документа [3]. Для каждого документа в поисковых машинах хранися время его появления в базе, т.е. время когда он был впервые обнаружен ботами поисковика, более старые докумеенты могут рассматриваться как более важные, ценные илди авторитетные, новые документы могут рассматривать как более релевантные при поиске с упорядочиванием по времени или новизне;
- Авторские пометки [3]. Разбирая заведомо ценные авторские документы, поисковые машины могут определять структурные особенности таких страниц и использовать эти шаблоны при индексировании новых документов для определения возможно того же авторства или подобных документов;
- Язык документа [3]. Естественно по запросу, например, на японском языке, более релеватными считать документы на японском же языке. Поэтому для поисковых машин желательно явно указывать язык(и) документа;
- Морфология [3]. Документы, содержащие и другие морфологические формы слов запроса могут рассматриваться поисковыми машинами более релевантными данному запросу. Другие же поисковые машины могут рассматривать все морфологические формы как одно и тоже;
- Структура заголовков [3]. Структура заголовков Hx на странице может дать поисковику информацию, какие части документа более или менее важные. Если заголовки одного уровня различны, но близки по теме -- это может быть дополнительно полезно;
- Цитирование [3]. Цитирование, в смысле сносок и ссылок в книгах и журналах на источники процитированого, может положительно сказываться при поиске научной, учебной или подобной информации;
- Глубина документа на сайте [3]. Глубиной документа на сайте считается минимальное число мышиных кликов (следую по ссылкам), необходимое для получения данного документа;
- Мера обновлений документа [3]. Переодически просматривая документ, посиковые машины могут не только отслеживать частоту изменения документа, но и вести журнал всех изменений контента и ссылок;
- Разнообразие и % измнеений [2]. Ведя журнал изменений документов, поисковые машины могут отслеживать какая часть контента изменялась, связано ли это с изменением шаблона страниц сайта (косметические изменения), или только одного документа, какой процент содержимого подвергался изменению, было это добавлением нового контента, или правкой старого и т.п.;
- Структура документа [2]. Для некоторых документов, например, с длинным контентом или, особенно, для хорошо структурированых документов, порядок следования предложений, фраз и слов в теле документа может приниматься поисковиками во внимание;
- Внутренние ссылки [2]. Релевантные внутренние ссылки на документ (навигационные ссылки не учитываются), могут подсказать поисковой машине тему данного документа;
- Тэг Meta Keywords [2]. Несмотря на то, что этот тэг считается пережитком ранниъх дней Паутины, некоторые поисковые машины могут его использовать, можно также использовать этот тэг и для указания наиболее частых опечаток ваших ключевых слов;
- Ключевые слова в URL [2]. Использование ключевых фраз и слов в ссылках с данного документа может дать дополнительный вес в некоторых поисковиках, независимо как эти слова указываются в URL, через дифис или слитно;
- Тэг Meta Description [2]. Считается устаревшим, но может использоваться некоторыми поисковиками для описания вашего документа в результатах поиска, однако спорно, что использование ключевых слов в этом тэга как либо влияет на позиционирование;
- Использование H1, bold, strong и др. [1]. Хотя тэги H1, bold, strong и др. продолжают широко использоваться для визуального выделения темы и ключевых фраз и слов, маловероятно, что они как-то влияеют на ранжирование поисковых машин, в основном из-за широкого распространения так называемой "переоптимизации";
- Использование грамматики [1]. Использование грамматиками поисковыми машинами для ранжирования документов под вопросом, возможно только специализированые научные поисковики;
- Правописание [1]. Так же как и граматика, правописание всех слов документа может служить мерой качества этого документа для поисковых машин. Возможно этот фактор учитывается в зависимости от запроса, а также не учитывается для специализированых сайтов из таких областей, как юмор, культура и искусство, где неправильное правописание может использоваться специально;
- Частота стоп-слов [1]. Частота исаользования стоп-слов (наиболее часто используемых слов) может служить мерой стиля документа, если частота стоп-слов высока, вероятно это небольшая попсовая заметка, если же чатота этих слов мала -- это серьёзный неоднопараграфный текст. Вероятно этот фактор также зависит от поискового запроса;
- Читабельность текста [1]. Читабельность текста -- это мера основаная, на частоте использования общеупотребительных, слов из словарного запаса школьников того или иного года обучения, а также редких, специализированых слов в тексте документа. Эта мера может учитываться исходя из запроса, а также если есть информаци о том, кто ищет, -- если ищет школник, то ему не осилить статьи из академических журналов;
- Качество текста документа [1]. Хотя эта мера очень субъективна, существуют методы автоматического его определения, вероятно у каждого поисковика они свои, и пока под вопросом насколько сильно и как скоро эта мера будеит влиять на ранжирование;
- Текст в alt/img title [1]. Хотя содержимое этих тэгов оносится к тексту документа как целому, мало вероятно, что они сильно влияют на оценку содержимого всего документа. Весьма вероятно они больше влияют на поиск изображений (вместе с именем файла картинки);
- Длина документа [1]. Длина документа, в байта, словах, предложениях и т.п. может использоваться поисковиками при ранжированияя, подразумевая для некоторых запросов более кратнкие документы более релевантными, в других же случаях отдавая предпочтения более длиннным документам. Нет оптимального размера документа для поисковых машин;
- Внутридокументные ссылки [1]. Поисковые машины могут использовать именованые внутридокументные ссылки (anchors) при разборе длиннных структурированых документов, напрмиер статей Wikipedia;
- Тип документа [1]. Тип дакумента, например .pdf, .doc, .txt т.п. может учитываться при ранжировании, по-разному в зависимости от того или иного зароса;
- Соответствие стандартам W3C [1]. Учёт поисковыми машинами этого фактора под вопросом, но забывать о нём не стоит.
Требую продолжения ........ банкета. Где остальные факторы
Продолжение банкета здесь: http://notes.sochi.org.ru/303/
Уведомление: БЛОГика
> В скобочках дан уровень важности от 1 до 5.
Весьма спорный момент. Не совсем понятно, по каким критериям это определялось.
Использование H1, bold, strong и др. [1]
- странно, вроде это должно сильно влиять (при условии не-злоупотребления тегами)
Длина документа [1]
- кто-то недавно проводил эксперименты, в результате которых выяснилось, что нижняя граница существует (около 1 Кб). Верхняя - теоретически нет, но некоторые поисковики индексируют первые 100-200 Кб и уж, во всяком случае, предпочитают текст в начале страницы.
Уровень важности определялся по результатам опроса сеошников (их список теперь вывешен на оригинале). И отражает степень важности не каждого критерия в отдельности, а относительно всех других. Например, выделение h1 или bold практически ничто, по сравнению со ссылкой с основной страницы cnn.com (к примеру).
А чем вызвано резкое нарастание, по мере приближения к концу статьи, количества грамматических ошибок и очепяток (дАкумент, исАользования, есть информаци, отсутствие запятых в нужных местах)?
Так получилось 🙂
наверное поздно писалось 😉
псб. за перевод!