Закон, сформулированный почти тридцать лет назад авторитетным американским специалистом по информационным системам Джеймсом Мартином, гласит: "Если система полезна, то нагрузка на нее будет возрастать до полного исчерпания ее пропускной способности. Вывод: чем полезнее система, тем скорее она придет в негодность".
Если электронный архив и обеспечивающий его поисковый механизм полезны (например, позволяют получить дополнительную прибыль), то объем архива и поток запросов будет расти...
Масштабируемость по объему. Объем архива может быстро увеличиваться, причем гораздо более высокими темпами, чем предполагалось изначально. Поддержка больших информационных массивов в целом не составляет проблемы. Вопрос в том, как зависит от объема скорость поиска. К сожалению, реальные показатели быстродействия очень сложно определить теоретически, для их получения нужны тестовые испытания, еще лучше в рамках действующих проектов.
Аппаратно-программная платформа. Повышение производительности конкретной прикладной системы может быть увеличено за счет смены аппаратно-программной платформы, а также использования многопроцессорных и многосерверных конфигураций.
Информационный поток обновлений. Некоторые поисковые механизмы приостанавливают доступ к архиву на время переиндексации при подключении новой информации.
Динамическая классификация. Динамическая классификация предлагает пользователю системы комбинировать классификаторы в разных вариантах, обеспечивая оперативное построение динамически формируемых папок, изменяющихся в ходе процесса осмысления изучаемого материала. В этом случае информация отображается в виде таблицы, позволяющей выполнять многомерный анализ.
Поддержка разнообразных форматов. Исходные документы могут быть представлены в самых разных форматах. Помимо поддержки широкого числа форматов желательно, чтобы пользователь мог подключать к системе собственные конверторы.
Поддержка широкого круга источников информации. Это могут быть файловые системы, сайты Интернета, базы данных, почтовые системы, специализированные системы управления документами и т. п.
Защита информации. Система должна обеспечивать контроль доступа на уровне отдельных документов, возможность передачи данных в зашифрованном виде, обеспечивать гибкое управление правами пользователя.
Расширенные возможности логического поиска. Кроме использования обычных логических операторов, желательно иметь возможность задавать ограничения расстояния между словами, порядок следования слов, использовать операторы нечеткого и семантического расширения слов, операторы поиска по диапазонам чисел и дат и т. п.
Смысловой поиск (расширение поискового запроса близкими по смыслу словами). Этот параметр характеризует качество поисковых систем, так как именно он обеспечивает высокую релевантность найденной информации. Здесь в первую очередь имеется в виду возможность использования семантической сети.
Механизм нечеткого поиска. Наличие опечаток и ошибок в текстовой информации - явление достаточно распространенное. Использование этого механизма позволяет исключить трудоемкие операции проверки орфографии и исправления ошибок после работы автоматических систем распознавания текста.
Функциональная расширяемость системы. Например, открытая архитектура поисковых механизмов может предоставлять разработчикам широкие возможности, вплоть до модификации ядра поисковой системы.