Компания Microsoft осчастливила обладателей ОС Vista печатью документов, в случае отсутствия установленных принтеров, в файл свого формата XPS (типа улучшенного PostScript). Естественно, этот формат не читается на Ubuntu. Зато его можно преобразовать в PDF следующим образом:
...читать далее "Преобразование XPS в PDF на Ubuntu"
Метка: pdf
DataparkSearch vs Google Mini
Google Mini | DataparkSearch | |
---|---|---|
Лицензия | Коммерческая, исходники закрыты | GPL, открытый исходный текст |
Число индексируемых документов и цена |
|
до нескольких десятков миллионов, в зависимости от используемого железа. Бесплатное ПО. |
Индексируемые форматы файлов | 220 различных форматов файлов, включая HTML, PDF и документы Microsoft Office. | Простой текст, HTML, XML, MP3, GIF, и любой другой через внешние парсеры. |
Языки | 28 языков | 25 языковых групп, может разбивать на слова фразы традиционного письма на китайском, японском, корейском и тайском языках. |
Доступ к файлам через | HTTP, HTTPS, сетевые фаловые системы. | HTTP, HTTPS, FTP, NNTP, HTTP Proxy, локальную файловую систему, htdb:// схема для индексирования SQL баз. |
Доступ к защищенному контенту через | HTTP Basic, NTLM v1 и v2, LDAP | HTTP Basic |
Коллекции документов | Да | Да, каждая коллекция может быть поделена на секции (тэги и категории). |
Интеграция результатов поиска в дизайн сайта | пользовательская таблица стилей XSLT, экспорт результатов в XML | собственный язык шаблона страницы выдачи в любом тестовом формате (включая HTML,RSS,XML). |
Синонимы | Да | Да |
Вывод аттрибутов результатов поиска | мета тэги | мета тэги, заданные аттрибуты HTML, заданные XML тэги, regex-вырезки из текста (все перечисленные называются секциями) |
Фильтрация результатов по мэта тэгам | Да | Да, + по любой секции или комбинации секций. |
Задание различных весов мета тэгам/секциям | Нет | Да |
Интеграция с Google Desktop и Google Toolbar for Enterprise | Да | Нет |
Исключение страниц из поискового индекса | Да | Да |
Спелчекер | самообучаемый | использует aspell |
Кэшированные версии документов | Да | Да |
Поиск в заданном числовом интервале | Да | Нет |
Поиск в заданном интервале дат | Да | Да |
Сортировка результатов по | Релевантности, Дате | Релевантности, Дате, Популярности, Важности и по всем этим в обратном порядке и любой комбинации. |
Отчёты |
|
Нет отчётов. Для каждого запроса могут быть записаны все параметры поиска для последующей обработки. |
Автоматическое создание Google sitemap | Да | Нет |
OneBox for Enterprise | Да | Нет |
Поддержка пользователей | Сайт поддержки; поддержка по email; гарантированная замена отказавшего оборудования | Форум на сайте проекта. |
Автоматическое реферирование документов | Нет | Да, Summary Extraction Algorithm |
Согласование содержимого по HTTP для заданные языков | Нет | Да |
Ссылочное ранжирование | Нет | Да, алгоритмы Neo PopRank и Goo PopRank. |
//Google Mini features, Google Mini Administrator features, DataparkSearch.
ТВ-программа в PDF
Восстановлена выдача в PDF формате программы телепередач в Сочи.