31 авг. 2007 г.

Google Desktop: исключить лишнее из индекса

С недавних пор я активно использую удивительный инструмент, предназначенный для поиска файлов на локальном компьютере, Google Desktop (далее GDS). Ищет файлы мгновенно, индексирует ненавязчиво (если лишних плагинов не ставить, а также не разрешать ему сканировать ресурсы локальной сети). Но вот размер индекса, конечно, не детский. Дело осложняется тем, что в нашей компании используется система контроля версий Subversion, которая хранит большое количество служебных файлов на диске (в каталогах с именем «.svn»). Индексирование и поиск этих файлов — занятие бестолковое.

С первого взгляда кажется, что стандартные настройки GDS не позволяют исключить из индекса каталоги по маске, т.к. выбор каталогов требует указать полный путь до существующей директории…

Оказывается, можно просто ввести паттерн, чтобы исключить из индексирования файлы или каталоги. Делается это на странице настроек GDS, вкладка «Локальное индексирование», параметр «Не искать в этих элементах».

Цитата:

Note: If you enter keywords instead of a full path or URL, Google Desktop won’t index any item that contains those keywords.
Таким образом, для исключения всех служебных файлов Subversion из индекса GDS я добавил строчку «.svn» в список значений указанного параметра:

Кстати, я индексы перенес в корень диска C:, чтобы точно знать, куда уходит свободное место:-). Делается это при помощи программки TweakGDS, но польза этой софтины достаточно сомнительная, т.к. под Windows перенести индекс Google Desktop можно путем правки ключа реестра HKEY_CURRENT_USER\Software\Google\Google Desktop\data_dir

В этом же ключе реестра находится параметр «file_extensions_to_skip», позволяющий исключить файлы с определенными расширениями из индекса, а также параметр «file_extensions_to_skip_initial_crawl», исключающий файлы из процесса построения первоначального индекса. Я эти параметры не трогал. К сожалению, проверить эффективность трюка с исключением файлов достаточно проблематично, поскольку индекс GDS растет экспоненциально и не уменьшается при удалении файлов с диска. Помогает только полное удаление индекса и полная переиндексация. Но я все же решил проверить.

Изначальный размер индексов GDS составил 2.53 Gb. Сейчас я удалил индекс и запустил переиндексирование. Как только проиндексирует — опубликую здесь:-)

Справка: размер моего винчестера составляет 80 Gb.

P.S. Справедливости ради хочу заметить, что существуют достойные (по слухам) альтернативы Google Desktop. Например, система «Архивариус». Может быть, там указанных проблем не существует. Но мы не ищем легких путей и очень любим Google:-)