Эксперимент с убиранием директивы Host: из robots.txt в секции для бота Яндекс окончился неудачно, для сайта.
То, что Яндекс "расклеит" зеркала, не было так уж неожиданным. Но вот почему в индексе из двух копий одних и тех же страниц остаются копии сайтов с меньшим ТИЦ (и соответственно на более низких позициях) и с большим временем отклика, - непонятно. Похоже из двух копий страницы на зеркалах Яндекс выбирает то зеркало, которое имеет IP, географическая привязка которого совпадает с георграфической привязкой сайта, а не тот, который отдает контент быстрее и чье доменное имя имеет и больший ТИЦ и больший PR.
Google же прекрасно справляется с "зеркалами" даже без директивы Host:.