На главную страницу ЗАО Софткей
 Главная   Новости   Статьи   Пресс-релизы   Обучение new   Форум   Рассылки 
 

Секреты локального поиска

21.02.2005 / Программы / Наталья Сергеева

Помощник по поиску Windows

Иногда найти что-то на собственном диске - все равно что найти иголку в небезызвестном стоге сена. Особенно это относится к текстам - днем с огнем не найти какой-то нужный документ, и все это при полной уверенности в его существовании. Утонул документ в огромной куче себе подобных! Перерыть эту кучу вручную - задача для терпеливых пользователей, имеющих вагон свободного времени. Тем же, кто это время ценит, лучше воспользоваться программными средствами для локального поиска. О разновидностях этих средств и, главное, их эффективности как раз и пойдет речь в данной статье.

Поисковые инструменты присутствуют в любой операционной системе, во многих приложениях и файловых менеджерах. Ими мы и пользуемся чуть ли не каждый день: стандартным "Помощником по поиску" Windows, встроенным поиском в Total Commander или Far, функцией поиска по архивам WinRAR и другими. Эти средства всегда под рукой, и это главное их достоинство, если не единственное. А вот недостатков гораздо больше, и среди основных - не всегда находится то, что нужно, и слишком долго ищется. К этому можно добавить ограниченный перечень форматов и кодировок файлов, по которым возможен поиск, неудобство представления результатов, невозможность сохранения поисковых запросов и так далее, но это уже мелочи.

Избавиться практически от всех таких досадных мелочей может помочь программа, аналогичная бесплатной AVSearch Анатолия Вознюка. Программа ищет файлы по фрагментам текста в любой русской кодировке и, главное, находит их в любых местах: в архивах (около 20 форматов), в кешах браузеров, на сетевых дисках, в "Корзине" и так далее. Работать с программой легко и приятно. Среди ее достоинств: просмотр найденных документов в текстовом виде с помощью встроенных средств, автоматическое выделение (подсветка) искомых слов и навигация между ними, сохранение списка файлов для дальнейшей обработки, доступность всех файловых операций (удаление, переименование, копирование), выбор для поиска различных папок (в том числе находящихся на разных дисках), "фильтрация" файлов (по размеру, типу, дате изменения). Однако ищет AVSearch так же медленно, как и перечисленные выше средства. А все потому, что программа перебирает (просматривает по очереди) каждый файл из зоны поиска.

AVSearch

Поиск с индексацией

Вдоволь наискавшись по дискам подручными средствами и не получив или не дождавшись результата, мы "лезем" в Интернет и обращаемся к услугам поисковых машин - Google, "Яндекс", AltaVista. Пара минут - и по нашему запросу выводится список ссылок на веб-страницы, содержащие искомые слова. Список обычно отсортирован по релевантности (соответствию запросу), содержит фрагменты текстов с подсвеченными словами запроса, а на случай недоступности каких-то ссылок иногда предлагаются кешированные версии найденных текстов. Можно только удивляться такой оперативности сетевых поисковых сервисов - вот бы их заставить работать на локальных дисках!

Поиск в "Яндексе"

Секрет успеха прост - поисковые машины не "бегают" по миллионам интернет-адресов, дабы доставить информацию по вашему запросу. Если бы это было так, то результата поиска никто и никогда бы не дождался. Поиск ведется по собственной базе машины, содержащей информацию заранее опрошенных страниц - индексы. Значит, для быстрого поиска по собственным дискам необходимо использовать программу, которая умеет создавать аналогичные локальные индексы.

Служба индексации Microsoft

Самое простое решение поставленной задачи достигается включением службы индексирования того самого "Помощника по поиску". Служба ведет индексирование определенных документов на компьютере, когда компьютер простаивает, и в результате процесс поиска по этим документам значительно ускоряется. Служба работает непрерывно и почти не нуждается в обслуживании. После ее настройки все операции, включая создание и обновление индекса, аварийное восстановление в случае сбоя питания, выполняются автоматически. После завершения индексации отбор нужных документов по запросу к службе индексации выполняется за доли секунды.

Служба индексации Microsoft

С первого взгляда задача может показаться полностью решенной. Однако при внимательном рассмотрении работы поисковой службы Microsoft и, главное, результатов этой работы можно отметить ряд недостатков и неудобств. И можно было бы смириться с ними, если бы служба Microsoft находила все документы по запросу к ней. К сожалению, находится далеко не все, и причиной тому является изначальная "заточенность" службы на поиск англоязычных документов. При работе службы в русскоязычной среде с ее довольно развитым словоизменением теряются все производные слов, входящих в запрос.

Пятерка известнейших локальных поисковиков

Перечисленные выше причины заставляют отказаться от использования встроенной в Windows поисковой системы в пользу программ от других разработчиков, свободных от указанных недостатков. Перечисленные ниже программы объединяют следующие преимущества: быстрый полнотекстовый поиск информации на английском и русском языке (иногда с учетом морфологии языка), привычный и удобный интерфейс в стиле поисковых интернет-систем и относительно небольшой объем индекса. Представленные версии программ обеспечивают примерно одинаковый уровень сервиса.

  • Google Desktop Search (GDS) - разработка компании Google. Интегрирована в упомянутую поисковую систему Google, распространяется бесплатно и позволяет осуществлять полнотекстовый поиск информации как в Интернете, так и на жестких дисках компьютера.

    Google Desktop Search

  • "Следопыт 3.0 Профессиональный" - персональная система интеллектуального поиска от компании "МедиаЛингва". Предназначена для быстрого поиска документов на персональном компьютере, съемных носителях, а также в локальной сети по их содержанию и атрибутам. Цена - 1200 рублей.

    Следопыт 3.0 Профессиональный

  • "Ищейка Проф Deluxe 4.5" - полноценная поисковая система для быстрого поиска документов и файлов на жестких дисках от iSleuthHound Technologies. Данная версия программы представляет собой полный пакет, лишенный каких бы то ни было ограничений и включающий все доступные на сегодня дополнительные модули, разработанные компанией. Цена пакета - 29 долларов. Имеется бесплатный вариант, ограниченный по количеству индексируемых файлов (до 500) и поддерживаемым форматам (.doc, .html, .txt).

    Ищейка Проф Deluxe 4.5

  • "Архивариус 3000 (2.91)" - персональная поисковая система компании Wizetech Software для быстрого поиска документов и почтовых сообщений на компьютере, в локальной сети и съемных дисках. Демоверсия ограничена 10 000 файлов в области поиска. Цена для частных лиц - 300 рублей.

    Архивариус 3000

  • Cros - система компании "Кронос-Информ", предназначенная для накопления и обработки текстовых документов различных форматов и быстрого поиска по накопленному массиву данных. Цена - 4248 рублей. Демонстрационная версия системы Cros имеет ряд ограничений, одним из которых является число обрабатываемых документов - до 5000.

    Cros

Запросы программ

Прежде всего для работы всех программ требуется наличие свободного места на жестком диске для хранения индексов - как минимум 30% от общего объема файлов, которые подлежат индексации. На 100 тысяч индексируемых документов небольшого размера (до 100 Кб) необходимо выделить примерно 500 Мб. На хранение индекса библиотеки, содержащей увесистые электронные книги (300-2000 Кб), потребуется значительно больше дискового пространства - например, тех же 500 Мб хватит только на 1000 файлов.

Для комфортной работы с программами компьютер должен иметь более 128 Мб оперативной памяти и процессор с тактовой частотой выше 400 МГц. На более слабых машинах существенно замедляется процесс создания и обновления индекса и поисковые запросы выполняются программами далеко не мгновенно. Особенно это заметно при значительном количестве индексируемых документов - более 100 тысяч. Исключение составляет программа Cros, которая оптимизирована для обработки больших объемов информации. Вот почему скорость индексации и поиска Cros практически не зависит от размера оперативной памяти - при наличии 64 Мб система работает так же быстро, как и на 128 Мб.

Все программы (кроме GDS) работают на всех популярных версиях операционной системы Microsoft: Windows 98/Me/NT4/2000/XP/2003. GDS работает только под Windows XP/2000, причем для последней требуется установленный SP3 (пакет обновлений Microsoft Service Pack 3). Cros для этой же ОС требует установки SP2, а для Windows NT - SP6. "Ищейка" для каждого пользователя предоставляет возможность иметь свой собственный набор зон поиска и персональные настройки программы (для Windows NT4/2000/XP). Для установки программы требуются права администратора, а работать с ней может любой пользователь, имеющий собственную лицензию на использование программы.

Для индексации, поиска и отображения определенных типов документов некоторые программы требуют наличия установленных "родных" приложений для различных типов файлов. Например, "Следопыт" для работы с PDF и RTF нуждается в установке Acrobat Reader и MS Office.

Кому что выбрать

Какой бы из перечисленных программ для локального поиска вы ни воспользовались, результат будет гораздо полнее того, что выдают подручные "медленные" средства. При выборе подходящей программы ориентироваться стоит в основном на цену - по Сеньке и шапка. Анализ всех упомянутых нами программ с выдачей рекомендаций занял бы не одну страницу текста. Но если коротко, то подытожить можно так:

  • "домашним" пользователям, для которых содержимое жесткого диска такие же потемки, как и Интернет, за глаза достаточно возможностей GDS, а иногда и бесплатной "Ищейки";
  • пользователям же, желающим получить более удобное и функциональное средство (поиск в архивах, в сообщениях нестандартных почтовиков типа The Bat!, интернет-пейджеров типа Miranda и так далее), стоит обратить свой взор на "Архивариуса";
  • для профессионалов подойдут "Следопыт" и "Ищейка", умеющие работать со стандартным набором типов документов и предоставляющие для этого удобные инструменты;
  • Cros "заточен" на работу с огромными массивами документов (миллионами файлов!) - оптимально использовать эту программу в такой же огромной компании.

Ссылки по теме:

Автор статьи: Наталья Сергеева

Отзывы:


Новый отзыв
Ваше имя: *
Ваш E-Mail:
Тема: *
Текст: *
Введите цифры: *

* - поля, обязательные для заполнения.

Ваш отзыв будет опубликован в течение двух-трех дней. Мы оставляем за собой право не публиковать отзывы, которые будут содержать нелитературные выражения и оскорбительные высказывания.

Рубрики статей
Все статьи
Аналитика
Программы
Игры
Интернет
Авторские права
Интервью
События в мире ПО
Сервисы
 Сеть IT-экспертов
 Мероприятия
Рассылки
Новости мира ПО
Статьи: Интервью
Статьи: Мир ПО
Статьи: Программы
Статьи: Интернет
Статьи: Авторские права
Статьи: Игры
Пресс-релизы
Архив выпусков
  «   Сентябрь 2010   »  
Пн Вт Ср Чт Пт Сб Вс
  12345
6789101112
13141516171819
20212223242526
27282930   
Поиск в архиве

Логин / пароль:
запомнить

Снова за парту



Наши партнеры:

 САПР и графика




Написать редактору  | RSSЭкспорт новостей и обзоров


Rambler's
Top100 Rambler's Top100

Разработка компании «Битрикс»
Разработано
«Битрикс»


программы    Copyright © 2001-2010 ЗАО «Софткей»