Выпущена новая версия ПО поиска по сайту или группе сайтов DataparkSearch 4.33. Основные новшества этой версии: возможность автоматического исправления правописания слов поискового запроса и слов индексируемых документов; добавлены новые операторы логического поиска: NEAR и ANYWORD, позволяющие ограничивать расстояние между искомыми словами в документах. Также исправлены некоторые ошибки и неточности, обнаруженные в предыдущих версиях. Полный список изменений см. здесь: www.dataparksearch.org/ChangeLog.
Да, вещь явно интересная, но меня лично коробит MySQL ... не знаю, тут нужен явно свой сервер. Я ставил как то простенький рейтинг сайтов, на одном хостинге так было превышение кол-ва единовременных запросов, т.е. приблизительно в одно время превысило кажись порог в 5000 SQL запросов. Что тут говорить о серьёзных поисковиках.
При использовании dbmode cache, при поиске SQL-сервер практически не используется, а при индексировании можно задавать паузу между документами и тем самым снижать нагрузку на SQL-сервер. Но верно, что для более-менее крупного поисковика нужен отдельный сервер, а лучше два, на одном поисковик, на другом -- SQL-сервер :).
Для кеширования нужен немереный сервак. Я делал кеш типа запрошенных страниц в tab формате, ну т.е. с минимум данных, при посещаемости в 200-300 посетителей в сутки, за месяц, поисковых запросов накопилось на 400 метров ... жуть 🙂
Уведомление: WMas HomePage