OrinkSoft.ru

Описание программы 2007-09-28

Изображение программы: MBD Search Engine (МБД Софт)

Автор: МБД Софт

MBD Search Engine — программа, предназначенная для решения задачи доступа к электронным библиотекам, содержащим сканированные архивы печатной литературы. Абсолютное большинство существующих полнотекстовых поисковых систем работают по схеме: поиск фрагментов текста – загрузка полного документа. Для электронных библиотек, содержащих объемные иллюстрированные документы, например книги и журналы, такая схема малопригодна. Для эффективного поиска в таких архивах, особенно в Интернете, необходима другая схема: поиск текстовых страниц, синхронизированных с оригиналом – вывод точных изображений найденных страниц. Решение этой задачи требует специальной организации поискового индекса и базы данных.
Основные отличия:
• Поисковый индекс организован по постранично-подокументному принципу. При поиске учитывается вхождение найденного фрагмента в определенную страницу документа.
• Многоуровневая организация индекса обеспечивает скорость и эффективность поиска на уровне лучших поисковых машин
• Текстовое содержание всех страниц документов с иллюстрациями хранится во внутренней базе и выводится постранично, с возможностью сплошного перелистывания.
• Поисковый индекс синхронизирован с постранично организованными файлами форматов djvu и pdf, содержащими изображения страниц исходных документов.

Создание баз данных:
• Максимальный размер одной базы данных — 2 Тб исходного текста.
• Скорость индексирования документов 3-4 Гб/ час.
• Создание отдельной сжатой и кодированной базы данных с текстом и графикой.
Создание внутренней базы данных, содержащей изображения страниц в форматах djvu и pdf
• Общее количество баз данных не ограничено.
• Количество документов в одной БД не ограничено.
• Постраничная организация БД.
• Форматы исходных документов: txt, rtf, doc, htm, pdf, zip, базы Outlook, djvu
• Сохранение в базе растровых графических изображений.
• Индексирование документов на сетевых дисках.

Поиск:
• Среднее время поиска в БД размером в 100ГБ текста — 1-2 сек.
• Параллельный поиск по нескольким базам данных
• Русский и английский морфологические словари, объемом свыше 1.5 млн. слов
• Подсветка слов запроса в найденных текстах
• Установка расстояния с помощью движка
• Формирование дерева найденных страниц и содержащих их документов.
• Переключатель вычисления расстояния с учетом порядка слов
• Сохранение запросов с результатами поиска в файле.
• Построение сложных вложенных запросов, включающих сохраненные поиски
Вывод данных:
• Вывод найденных текстовых страниц из базы данных за время < 0.1 сек.
• Вывод изображений в найденном тексте. Режимы вставки изображений или ссылок.
• Подсветка слов запроса в найденных текстах
• Формирование дерева найденных страниц и содержащих их документов.
• Загрузка и просмотр изображений найденных страниц для документов djvu и pdf форматов.
• Просмотр исходных документов в родительских программах
• Переключение режимов редактирования для копирования найденного текста.
• Функция объединения баз данных в одну. Создание общего поля поиска.
• Импорт и экспорт баз данных формата MBDSE.

Программа поставляется в нескольких версиях. Все версии для ПК имеют единый дистрибутив. Конфигурация, соответствующая версии определяется электронным ключом, определяющего тип лицензии. Без ключа программа устанавливается в версии Free, и имеет ограничения на размер текстовой базы в 1Гб.
Лицензия Standard. Для персонального некоммерческого использования. Ограничение на размер баз: 10 Гб.
Лицензия Professional. Профессиональная, полнофункциональная версия. Не имеет ограничений по характеристикам.
Существует также версия Publisher, со специальной системой защиты данных и серверные версии программы для архивов в Интернете и локальной сети.