Технические факторы, могущие повлиять на ранжирование в поисковых машиных. В скобочках дан уровень важности от 1 до 5.
- Доступность документа [5]. Недоступность документа может быть вызвана ошибкой 404, ошибкаим в работе веб-сервера, необходимостью установки плугина для просмотра и прочими техническими вопросами. Также к недоступности могут приводить методы переадресации, которые поисковые роботы не могут отследить, или необходимость заполнить форму для доступа к информации.
- Использование фреймов [4]. Фреймы могут повлиять на различные факторы оптимизации, разделение на различные URL может обесценивать входящие на страницу(ы) ссылки, а также размазывая рейтинговую ценность одного документа на несколько страниц. Различные технологически примёмы, такие как CSS повышают юзабельность фреймов, однако классические HTML-фреймы обычно трудны для хорошего рейтинга в поисковых системах.
- Динамические параметры в URL [4]. Большое число динамических параметров в URL зачастует гарантирует, что этот URL будет пропущен роботом поисковика. Представители различных поисковиков давно советуют ограничиться двумя, а лучше одним динамическим параметром в URL.
- Идентификаторы сессий [4]. Идентификаторы сессий в URL могут непредсказуемо повлиять на рейтинг, т.к. дубликаты одного и того же документа могут индексироваться десятки и сотни раз под различными URL. Также входящие ссылки будут размазываться по различным URL одного и того же документа.
- Аптайм хостера [3]. Ненадёжный хостинг с часто неработающим сайтом может приводить к девальвации рейтинга сайта в поискых системах, и даже хуже, далеко не все страницы сайта могут быть проиндексированы. И наоборот, высокий аптайм может увеличить рейтинг как надёжно доступного ресурса.
- Использование NOARCHIVE/NOINDEX [3]. Директивы noindex и noarchive в META ROBOTS указывают поисковому роботу не индексировать и не сохранять копию страниц сайта. Соответственно контент этих страниц не может повлиять на рейтинг в поисковых машинах, -- они просто о нём не знают.
- Информация о регистрации домена [2]. Информация о регистрации домена может быть использована поисковыми машинами как источник информации о владельце ресурса, уменьшая рейтинг для спамеров и других нарушителей этикета и закона.
- Время регистрации домена [2]. Время на которое домен был зарегистрирован может говорить о серьёзности намерений, чем оно больше, тем серьёзнее намерения владельца относительно этого сайта.
- География хостинга [1]. География хостинга может играть незначительную роль в определении языка и страны контента при вариация рейтинга результатов поиска по этому таргетингу.
- Длина URL [1]. Длина URL можут быть компонентной меры доверия и/или значимости, более длинные URL могут рассматриваться как неюзабельные или возможный спам.
- Клоакинг по IP [1]. Хотя такой клоакинг сложно определить, поисковые машины изыскивают способы его определения, и тут же штрафуют сайт.
- Дата регистрации домена [1]. Как мера возраста сайта, может использоваться поисковыми машинами как источник информации как давно существует этот сайт.
- Наличие robots.txt [1]. Наличие файла robots.txt может говорить о том, что содержимое сайт можно индексировать и кэшироватьи это влияет на большиство крупных поисковых машин.
Продолжение здесь: http://notes.sochi.org.ru/310/
Динамические параметры в URL [4]
- избыток их, несомненно, вреден; но сейчас большинство поисковиков индексируют такие урлы.
Идентификаторы сессий [4]
- несомненно, это то, от чего следует избавляться в любом случае. Кроме «размазывания», есть ещё вероятность недоступности страницы для посетителя, зашедшего с поисковика по подобной ссылке (сколько раз уже натыкался на подобное).
Использование NOARCHIVE/NOINDEX [3]
- в большинстве случаев это делается осознанно, никакой беды тут нет.
Наличие robots.txt [1]
- небольшое замечание: при его наличии поисковики будут (должны) следовать его инструкциям, а при отсутствии - вольны поступать как им заблагорассудится. Т.е. могут (теоретически) и не индексировать его.
Допустим есть домен.ru и поддомен.домен.ru. Сайты разные, повторяется лишь текстовое содержимое. Как они влияют друг на друга в выдаче в поиске?
Что-либо конкретное могут сказать только создатели конкрентных поисковых машин. Возможно будет зависеть от ссылок на эти сайты извне (с каких сайтов и каким текстом в ссылках). Но общая тенденция развития поисковых технологий - вычленение текстового содержимого из шаблона страницы сайта (видимого юзеру содержимого, так точнее). Т.е. в идеале, без учёта внешних ссылок, эти сайты должны считаться копиями друг друга. Перспектива развития поиска -- выявление смыслового наполнения каждой старницы, но это уже для будущего, возможно не столь отдалённого для тектов на английском.