Programy pro vyhledávání textových dokumentů. WinGrep pro vyhledávání textu v souborech. Výsledek testu: nejlepší program pro vyhledávání textu v souborech

Hledání textu v dokumentech ve formátech doc, xls, pdf je něco, co jsem chtěl zmínit už dlouho. Ale ne hledání v rámci jednoho dokumentu, to je celkem jednoduché - Ctrl + F zná každý, ale hledání ruského slova např. v 10 nebo > dokumentech. Otevření každého z nich a ruční vyhledávání je možné, ale časově náročné. A pokud existuje sto dokumentů/souborů, ale stačí najít například Vasila Petroviče... Právě o tomto druhu hledání jsem chtěl mluvit podrobněji.

Vyhledávání textu v souborech (v angličtině)

Hledání textu (v angličtině) v souborech jako *.txt, *.html lze provést například pomocí Total Commanderu 6.53. Vůbec Total Commander- nepostradatelný správce souborů, pokud jej ještě nepoužíváte - stojí za to stáhnout a začít používat! Poskytuje velmi dobrou navigaci na pevném disku a struktura dvou oken umožňuje provádět více operací s libovolnými soubory současně. A tak můžete vyhledat slovo/několik slov stisknutím Alt+F7, zaškrtněte políčko „hledat s textem“ a ok! Neumí však vyhledávat v několika souborech, jako jsou *.doc, *.xls. Musíte použít jiný program.

Hledejte ruská slova

Testování, které jsem provedl různé programy pro vyhledávání ruských slov v souborech ukázali, že program FindFiles3 si zaslouží pozornost. Je speciálně navržen pro vyhledávání souborů podle názvu a/nebo obsahu. Tam, kde standardní vyhledávání neukáže nalezený text, FindFiles snadno najde vše.

Program hledá požadovaný fragment v několika kódováních najednou. Nalezený text je zobrazen v samostatném poli a zvýrazněn barevně atd. Volání programu je zabudováno do kontextová nabídka Průzkumník "Najít soubory, obsah...".

Rozhraní programu je poměrně jednoduché. Můžete na to přijít bez potíží. V levém horním rohu nastavíte parametry vyhledávání. V poli „Ve složce“ zadejte cestu nebo cesty k hledání, tzn. Ve kterých složkách mám hledat? Chcete-li zadat vyhledávací masku, použijte symbol „*“. Například *.doc, všechny soubory doc budou nalezeny pomocí této masky. Můžete zadat více vyhledávacích masek oddělených čárkami nebo středníky.

Pokud hledáte soubory, ve kterém se zadaný textový fragment vyskytuje, pak musíte tento fragment zadat do pole „Text“. Soubory otevřené jinými aplikacemi mohou být blokovány. V takovém případě zaškrtněte políčko „Zobrazit blokované“. Tyto soubory budou označeny červenou plochou ikonou obecný seznam nalezené soubory. Je možné pokračovat v hledání mezi již nalezenými. Chcete-li to provést, musíte zaškrtnout příslušné políčko. Pokud hledáte v tom, co bylo nalezeno, budou dříve nalezené soubory zabarveny.

Můžete nastavit podmínku vyhledávání podle data souboru atd. Po vyhledání můžete nalezené soubory seřadit v kterémkoli ze sloupců. Chcete-li to provést, stačí kliknout na název sloupce. Můžete také pokračovat ve vyhledávání změnou kritérií vyhledávání.

Hledání textu v souborech - cvičení

Stáhněte a nainstalujte program.

Nyní musíme určit složku se soubory, ve kterých budeme hledat. A podle toho formát souboru.

Pro názornost jsem uvedl složku se 134 soubory. A pouze jeden obsahuje požadované slovo. Klikněte na „Najít“

A během několika sekund program našel soubor, ve kterém se toto slovo vyskytuje. A také fragment textu, což je velmi výhodné!

To je vše! Nyní můžete hledat ruský text v mnoha souborech současně!

Pokud jste již s programem pracovali a víte, jak nejlépe hledat ruský text, podělte se o své zkušenosti napsáním recenze. Může někomu pomoci!

Přihodit se různé situace když potřebujete najít soubor mezi tisíci dalších, ale je známá pouze část textu (nebo kódu). Například při programování webu musíte po prohlédnutí zdrojového kódu najít, ve kterém souboru probíhá zpracování a výstup. Jakým způsobem hledat soubor podle textu obsažené uvnitř? Pro vyhledávat soubory s konkrétním textem Doporučuji používat Total Commander, protože prohledává textové soubory rychle, přesně a má jich několik užitečné možnosti při hledání. Pojďme se blíže podívat na to, jak to udělat.

Nejprve si stáhněte Total Commander z oficiálních stránek kliknutím na odkaz ke stažení Total Commander a jeho instalaci. ( oficiální verze zcela rusifikované a zdarma).

Pak spustíme Total Commander. Po spuštění vás vyzve ke stisknutí jednoho ze tří čísel, protože program je shareware, ale nemá žádná omezení funkčnosti (nenašel jsem to).

Objevila se před námi dvě okna, ve kterých můžete procházet složkami. V kterémkoli z oken vybereme složku, ve které budeme hledat soubor s určitým textem. V mém případě musím najít soubor s textem „pagination_previous“. Klikněte na tlačítko dalekohledu umístěné v horním panelu programu. Dále zaškrtněte vedle nápisu „S textem“, zadejte test hledat v souborech, zaškrtněte kódování ANSI a UTF-8 a klikněte na „Zahájit vyhledávání“.

Poté, co Total Commander provede vyhledávání, zobrazí se níže seznam souborů, ve kterých našel hledaný text.

Nyní musíte najít text přímo v souboru. Jak najít text v souboru? Nejpohodlnější je použít poznámkový blok Poznámkový blok++ pro vyhledávání textu v souborech. Stáhněte si nejnovější verzi programu Notepad++ z oficiálních stránek.

Nainstalujeme tento nádherný poznámkový blok a otevřeme přes něj nalezený soubor. Stiskněte CTRL+F (dvě tlačítka současně). Otevře okno textového vyhledávání v souboru. Do pole „Najít“ zadejte hledaný text a stiskněte „Enter“ na klávesnici. Notepad++ rychle najde text v souboru a zvýrazní ho zelená. Pokud znovu stisknete „Enter“, bude Poznámkový blok pokračovat v dalším hledání textu v souboru. Pokud se stejný text objeví znovu, přesune se na něj a také jej zvýrazní zeleně.

Program pro vyhledávání textu v souborech v počítači.

Pomocí tohoto programu můžete rychle najít texty v dokumentech, textové soubory, uložené webové stránky, mp3 tagy, dokonce i obrázky, všechny typy archivů a souborů. Existuje podpora pro všechna ruská kódování. Program má pohodlné, intuitivní rozhraní a neméně luxusní funkce. Ale hlavní rys Program je vysokorychlostní vyhledávání textů v souborech. Během několika sekund program prohledá gigabajty informací. Pro ještě vyšší produktivitu jsou k dispozici speciální filtry, například: vyhledávání obrázků o velikosti alespoň 120 x 120 pixelů, vyhledávání v mp3 tagech s délkou hudby alespoň 20 sekund. Program rozumí všem typům dokumentů a souborů a umí pracovat s archivy. Prohledává jak soubory samotné, tak program hledá i text v souborech.

Univerzální program pro vyhledávání textu v souborech pro začátečníky i profesionály.

Copernic Desktop Search
Od prvního seznámení s programem Copernic Desktop Search jsem si nemohl pomoct
všimnete si příjemného rozhraní, které evokuje pouze pozitiva
emoce, což je u tohoto typu programu vzácné. Všechno
nástroje, které program má pro vyhledávání textu v souborech a
Ovládací prvky funkcí jsou ergonomicky umístěny na panelech.
Hlavním rysem tohoto vývoje je to
program pro vyhledávání textu v souborech má pěkné
design
a nic nadbytečného, ​​vše pro pohodlnou práci
program. Od prvního spuštění vás průvodce vyzve k vytvoření speciálních indexů
bleskově rychlé textové vyhledávání v souborech. Po odstávce
počítač, program automaticky zahájí indexování vybraných složek.
To lze ale na přání uživatele změnit v nastavení.
Nastavení v programu je poměrně široké. Samotné indexování je možné
nakonfigurovat v automatický režim, v režimu vestavěného plánovače,
v ručním režimu, když je počítač nečinný, na pozadí s nízkou
prioritou spotřeby zdrojů. Struktura indexu zahrnuje nastavení:
výběr podle typu souboru, ve zobecněné a podrobné podobě. Vy
filtrujte, co chcete indexovat, dokumenty, prostě
textové soubory, html stránky, obrázky, videa, hudba, další typy
soubory. Existují nastavení pro výběr souborů podle přípony. Široký
nastavení indexování umožňuje filtrovat indexy podle konkrétních
požadavky uživatele. Například indexování obrázků velikosti není
méně než 100 x 100 pixelů nebo hudbu o délce alespoň 15
sekundy Najdete zde také nastavení indexování pro e-mailové klienty,
hledat text v poště a dalších programech, jako např Microsoft Outlook.
Při vyhledávání textu v souborech se program také liší od svých konkurentů.
Můžete například vyhledávat text výhradně v souborech mp3
pouze podle značek v určitých kategoriích, interpret, album,
název skladby, datum. Můžete hledat pouze obrázek v
konkrétní velikosti, rozšíření a rozlišení. Prakticky
Každý typ souboru má svá vlastní nastavení. To vám umožní vyhledávat
text v souborech bleskově rychlý. Po vyhledání se program zobrazí
informativní výsledky vyhledávacího dotazu s oknem
náhled textu souboru a okno náhledu umístění, kde
Text požadavku se objeví v souborech. Výborné a hlavně rychlé
program pro vyhledávání textu v souborech. Je vhodný pro domácí použití
použití a při profesionální práci s velkým množstvím
dokumenty a soubory. Program vykazuje vynikající výsledky
v rychlosti textového vyhledávání v desítkách gigabajtů souborů dokumentů a
jiné typy informací.

Profesionální program pro vyhledávání textu v souborech.



Zajímavý program pro vyhledávání textů v souborech s vlastním
výhody. Funkce programu zahrnují podporu pro různé
kódování jako Unicode a UTF pro vyhledávání textu v souborech. Program
provádí vyhledávání jak na lokálním počítači, tak na FTP serverech.
Dokáže nejen najít text, ale také dávkový režim nahradit
našel text do jiného ve stovkách souborů současně. Program
má vestavěný editor, který velmi pomáhá
náhled na automatická výměna nalezený text.
Vestavěný editor má zvýraznění syntaxe zdrojového kódu.
Hlavní vlastnost, kterou má program pro
vyhledávat text v souborech s podporou syntaxe regulárních výrazů

syntaxe pro vyhledávání a nahrazování textu v souborech.
Program má také mnoho nastavení filtrů
Vyhledávání. Program umožňuje uložit výsledky vyhledávání do samostatného
soubor. Program dokáže rozpoznat duplicitní názvy složek. Obvykle
Program je určen pro pokročilé uživatele a nejčastěji to
vybrané webmastery. Specifické funkce, které zvýrazňují program
konkurenti v tomto odvětví jej činí atraktivním pro vývojáře. Ale také
běžnému uživateli můžete použít základní funkce, které
dobře zvládá základní úkoly rychlého vyhledávání textu v
soubory.

SearchInform Desktop


Od prvního seznámení s programem se rozhraní může zdát složité,
ale pak si všimnete, že vše je na svém místě. Nejprve je třeba pracovat
vytvořit vyhledávací index. Jedná se o poměrně jednoduchý proces. Zvláště
Chci poznamenat vysoká rychlost problémy s indexováním
program pro vyhledávání textu v souborech
. Při indexování
program přidá do indexu jako
běžné složky a soubory, stejně jako e-maily a další externí
zdroje (DMS, CRM). Zvláštností vyhledávání programů je vyhledávání podle
přesný dotaz nebo s podporou synonym. Tento typ vyhledávání zdůrazňuje
program mezi soutěžícími. Parametry vyhledávání lze přizpůsobit
různé formy žádostí. Například: hledání frází, morfologické
vyhledávání, vyhledávání citací, logické operace, hledat podle začátku slova, podle
konec, ve střední části slov. K dispozici formulář žádosti o cenovou nabídku
Vyhledávání. Když všechna slova citace musí být přítomna v souborech v
různé pořadí a mezi slovy mohou nebo nemusí být přítomny
(na žádost uživatele) jiná slova. Program obsahuje
vestavěné slovníky významných a nevýznamných smysluplná slova. hlavní rys
tento program je nová technologie v textové analýze. Systém
vyhledává přesně podle sémantického obsahu. Program může pracovat v
firemní síť. Při vyhledávání podle lokální síť program má
dva moduly jsou server a klient. Rozdíly jsou v tom
klientský modul má omezení přístupových práv k vyhledávání
informace. V důsledku toho vidíme, že se jedná o profesionální program,
který je určen pro široký rozsah uživatelů. Pokud jde o
firemní a pro domácí použití.

Program pro vyhledávání textu v souborech pro běžné uživatele.



Kompaktní program pro úzké vyhledávání textů v
soubory a dokumenty. Funguje na všech populárních platformách PC
(Windows, Mac OS X a Linux). Program také podporuje funkci
indexování složek a souborů. První indexování je jako vždy trochu
delší než následující, které se aktualizují pouze v závislosti na
aktualizace obsahu složky. Ale přítomnost indexování to dělá
program pro rychlé vyhledávání. Program, i přes svou skromnost,
má oba základní vzory dotazů "AND", "OR" a "NOT" a
rozšířené: zástupný vzor, ​​ne přesné vyhledávání, hledání frází. V
program má podporu pro Unicode v dokumentech, webových stránkách a
běžné textové soubory. Program umí prohledávat archivy
(zip, rar, 7z a další). Program pro vyhledávání textu v
soubory podporuje vše kancelářské dokumenty
, a
soubory nápovědy, web
stránky, textové soubory a navíc soubory ve formátu AbiWord,
Škálovatelná vektorová grafika, Microsoft Visio a další populární formáty.
Program má úzkou specializaci vyhledávání, a proto se snadno používá.
Tato verze je přenosná a může běžet na Windows, Mac OS X a
Linux. Má ruské rozhraní.

AVSearch


Také kompaktní program pro vyhledávání textů v souborech.
Zvláštností programu je podpora všech 5 ruských kódování,
plus Unicode. Velmi dobře je implementováno vyhledávání v archivech. Domov
zvláštnost je v tom program pro vyhledávání textu
archivní soubory podporují více než 20 formátů
.
Existují základní šablony dotazů,
konstrukce (AND, OR, NOT) a vyhledávání podle „masky“ slov
ve vyhledávacích dotazech. Program má rozsáhlé nastavení
filtrování souborů. Výsledky vyhledávání si můžete prohlédnout v
textová forma nebo jako HEX tabulka. Program nevyžaduje
instalací. Má ruské rozhraní. Velmi efektivní při hledání
archiv.

Výsledek testu je nejlepší program pro vyhledávání textu v souborech.

Každý program má své vlastní vlastnosti pro vyhledávání textů. Vybrat
vhodný program pro konkrétní úkoly a pracovní podmínky. Použitím
některý z těchto programů, budete moci výrazně efektivněji a efektivněji
Vyhledávat, třídit a organizovat soubory je produktivnější a rychlejší. Ale také
Co je velmi důležité, je, že můžete najít texty a soubory rychlostí blesku. Data
nástroje vám budou mnohem užitečnější ve srovnání s těmi vestavěnými
vyhledávací nástroje pro soubory a texty v operační systémy.
Programy správci souborů také se nemohou porovnávat v rychlosti a
výsledky vyhledávání s těmito programy. Je těžké vyzdvihnout jen jednu
nejlepší program ze všech, kteří se testu zúčastnili. Všechny programy
mají své vlastní vlastnosti, které je odlišují od jejich konkurentů.
Doporučuji ale začít se seznamováním s tímto typem programu pomocí Copernic
Desktop Search, za prvé, tento nástroj je krásný, pohodlný a
přehledné rozhraní. Začátečník může začít pracovat hned. Až na
Navíc množství a kvalita funkcí s největší pravděpodobností uspokojí všechny vaše
potřebuje při hledání textů a souborů a nemusíte hledat
něco jiného. Obslužnost je jakýmsi kompromisem mezi jednoduchým
zakázkové a komplexní profesionální programy. Ale pokud vy
opravdu potřebujete nekompromisní velmi rychlé vyhledávání a jste připraveni
věnujte trochu času pochopení funkcí programu
pak je lepší použít víc odborný program SearchInform
Desktop, který nemá rychlost vyhledávání a množství funkcí
rovná se. Vyhledávání je dokončeno během počítání sekund ve složkách větších než
gigabajt. Inteligence programu navíc pomáhá co nejpřesněji
najít, co hledáte. To je opravdu působivé. Všechny programy vás
Stáhnout si ho můžete níže v jednom archivu. Všechny tyto programy již mají klíče a
můžete začít pracovat hned. Hledejte informace o svém
počítač rychle a pohodlně.


Tvrdit, že v naší době informačních technologií a nekonečného růstu objemu dat, která má jednotlivec i společnost k dispozici, je mnoho problémů se zpracováním informací a jejich vyhledáváním, je již rouhání. Kdo toto téma nenastoluje? A abych vás nezatěžoval subjektivními a částečně i objektivními soudy vyvozenými z různých informační zdroje Ohledně problému přejdu přímo k jeho řešení. Dnes si povíme něco o hledání. Tedy o programech a seriózních informačních systémech, které vyhledávají dokumenty a data, která potřebujeme.

Vylepšit " přímé vyhledávání»

Není to tak dávno, kdy byly stromy velké a ani v místní síti podniku nebylo mnoho informací, jakékoli vyhledávání se provádělo pouhým prohledáváním několika dostupné soubory a důslednou kontrolu jejich názvů a obsahu. Takové vyhledávání se nazývá přímé a programy (utility) využívající technologii přímého vyhledávání jsou tradičně přítomny ve všech operačních systémech a balíčcích nástrojů. Ale i ta síla moderní počítače nestačí pro rychlé a adekvátní vyhledávání v gigantických objemech dat při přímém vyhledávání. Prohledat několik stovek dokumentů na disku a prohledat obrovskou knihovnu a několik desítek poštovních schránek jsou dvě různé věci. Proto programy přímého vyhledávání dnes jednoznačně ustupují do pozadí – pokud mluvíme o tom o univerzálních prostředcích.

Tento typ vyhledávání samozřejmě není ve firemním sektoru dlouho žádaný. Objemy nejsou stejné. A proto již mnoho let a dále Nedávno Je zřejmé, že technologie schopné rychle a přesně vyhledávat dokumenty různých formátů az různých zdrojů jsou více než relevantní. Není to tak dávno, co „otec“ Microsoftu Bill Gates zjevně záviděl fenomenální úspěch Internetový vyhledávač Google, na jedné z tiskových konferencí oznámil touhu softwarového průmyslu (nejen) všemožně přispívat, rozvíjet a prohlubovat tvorbu vyhledávačů a technologií. Na vytvoření fenomenálně fungujícího programu od Microsoftu nebo konkurenčního serveru na internetu je ale příliš brzy (MSN se stále nedostává do Googlu). Vraťme se proto ke stávajícímu vývoji. Index, dotaz, relevance

V jádru moderní technologie existují dva základní procesy. Za prvé je to indexace dostupných informací a zpracování požadavku s následným výstupem výsledků. Pokud jde o první, jakýkoli program (ať už je to stolní vyhledávač, podnikový informační systém nebo internetový vyhledávač) vytváří vlastní oblast vyhledávání. To znamená, že zpracovává dokumenty a generuje index těchto dokumentů (organizovaná struktura, která obsahuje informace o zpracovávaných datech). Do budoucna je to právě vytvořený index, který slouží k práci – rychlému získání seznamu potřebných dokumentů dle požadavku. To, co následuje, byť po technologické stránce nijak jednoduché, je běžnému uživateli celkem srozumitelné. Program zpracuje požadavek (pomocí klíčového sousloví) a zobrazí seznam dokumentů, které tuto klíčovou frázi obsahují. Vzhledem k tomu, že informace jsou obsaženy ve strukturovaném rejstříku, je zpracování dotazů výrazně (desítky i stovkykrát!) rychlejší než v případě přímého vyhledávání (výběr dokumentů se neprovádí prohledáváním souborů, ale analýzou textové informace v indexu).

Program zobrazí nalezené dokumenty ve výsledném seznamu podle relevance - souladu dokumentu s textem dotazu. V různé technologie jsou samozřejmě přítomny různé metody vyhledat a určit relevanci dokumentu (počet „výskytů“ slova a jeho četnost zmínky v dokumentu, poměr těchto parametrů k celkovému počtu slov v dokumentu, vzdálenost mezi slovy dotazu fráze ve vyhledaných souborech atd.). Na základě těchto parametrů se určí „váha“ dokumentu a v závislosti na ní se konkrétní soubor objeví v seznamu výsledků na určité pozici. V případě vyhledávání na internetu je situace ještě složitější. V tomto případě je skutečně třeba vzít v úvahu mnoho dalších faktorů ( Page Rank Google to příklad). Ale toto je téma na samostatný článek, takže se nebudeme dotýkat internetu

V tento materiál Zvažují se možnosti několika populárních vyhledávacích programů, které se mohou pochlubit slušnou rychlostí a dobrou funkčností. Ale předvádět se v brožurách je jedna věc, ale stát pod pohledem odborníka je věc druhá. A odborníků nebylo ani více, ani méně plná kancelář ti, kteří si rádi pohrávají se softwarem pro jeho použitelnost. Na experimentálním počítači (Athlon 2,2 MHz, s 1 GB RAM, 160GB pevným diskem Seagate IDE při 7200 ot./min a systém Windows XP) byla nainstalována sada programů: dtSearch Desktop, Ischeyka Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Pro testy byla sestavena textová databáze dokumentů formáty doc, txt a html Celková velikost ani více, ani méně, ale 20 gigabajtů. Skupina soudruhů pod vedením vašeho skromného sluhy testovala, porovnávala a sdílela své subjektivní dojmy z každého softwaru. Přečtěte si shrnutí zjištění níže. dtSearch Desktop

Program, který podle vývojářů tvrdí, že je nejrychlejší, nejpohodlnější a nejlepší vyhledávač. Jako obecně všichni ostatní z tuto recenzi. Rozhraní dtSearch je poměrně jednoduché, ale některá okna nebo karty jsou poněkud přeplněné prvky, což ztěžuje použití. Ale ve skutečnosti neexistují žádné zvláštní potíže. Jediným opravdu nepříjemným bodem je nedostatek podpory softwaru pro ruský jazyk (navzdory skutečnosti, že program může vyhledávat dokumenty v několika jazycích, jeho rozhraní je výhradně anglické).

Ale dtSearch je jedním z mála programů, které mohou indexovat webové stránky do uživatelsky zadané „hloubky“ (i když s přihlédnutím k „dokoupení“ doplňkové sady dtSearch Spider). To je navíc k podpoře souborů na disku různých textových formátů a e-mailů z pošty Poštovní schránka Outlooku. Program zároveň neumí pracovat s databázemi, které jsou pro vyhledávače tak chutným soustem kvůli velkému objemu informací v nich obsažených a jejich širokému rozšíření ve firmách, potažmo v podnikových sítích. Rychlost indexování dokumentů dtSearch se ukázala být na správné úrovni. Výhledově řeknu, že tento program si s indexováním daného množství informací poradil na úrovni s jiným konkurentem - iSYS - a dělil se s ním o druhé místo v žebříčku nej rychlé systémy. dtSearch indexovalo testovacích 20 gigabajtů informací za 6 hodin a 13 minut a vytvořilo index 7,9 GB pro potřeby následného vyhledávání.

Pokud jde o možnosti vyhledávání, zde jsou na správné úrovni. Za prvé, dtSearch má morfologické vyhledávání (hledání slova ve všech jeho morfologických formách). Použitím tato příležitost, osvobodíte se řekněme od takových myšlenek jako „v jakém případě bylo určité slovo použito v dokumentu, který jsem potřeboval?“ Použití morfologického vyhledávání je téměř vždy opodstatněné, proto by mělo být přítomno v každém profesionálním vyhledávači.

Vyhledávání podle zvuku je nestandardní funkce i pro profesionální vyhledávače. Jeho podstatou je, že program bude hledat slova, která znějí stejně jako slovo, které jste zadali. A nejlepší na tom je, že tato funkce funguje i pro ruský jazyk! Když například do vyhledávacího dotazu napíšete slovo „ucho“, uvidíte ve výsledku nejen slova „ucho“, ale také „ucho“.

Vyhledávání s opravou chyb je velmi důležitá funkce. Slouží k vyhledávání slov obsahujících syntaktické chyby – mohou to být buď překlepy, nebo chyby v dokumentech získaných například pomocí systémů rozpoznávání znaků. Jednoduchý příklad – hledáte slovo klávesnice. Některý dokument obsahuje slovo „klávesnice“, je zřejmé, že se ve skutečnosti jedná o slovo „klávesnice“, člověk jen udělal při psaní překlep. Hledání opravy chyb tedy detekuje a zahrne dokument se slovem „klávesnice“ do výsledku. V dtSearch je také nastavení, které umožňuje určit míru možných chybných znaků.

Hledejte pomocí synonym. Tato funkce používá seznam synonym pro různá slova. Například zadáním slova „rychlý“ program najde také slova „vysokorychlostní“ a další, která jsou synonymem pro slovo „rychlý“, pokud jsou samozřejmě přítomna v seznamu synonym . Hotový seznam synonym není součástí programu dtSearch, je však možné použít seznamy na internetu (podle toho je nutné připojení, což není vždy vhodné), nebo si můžete vytvořit vlastní seznam synonym .

Kromě uvedených schopností může dtSearch vyhledávat pomocí frází složených ze slov spojených logickými operacemi. Každému slovu v dotazu lze přiřadit vlastní „váhu“, tedy význam. Užitečnou možností je použití slovníku skládajícího se z nedůležitých slov, abyste je nebrali v úvahu při vyhledávání, ale i tento slovník je prázdný a budete si ho muset vyplnit sami.

Dále se podíváme na možnosti programu při práci v síti. Ve skutečnosti dtSearch nenabízí žádné specifické možnosti pro práci se sítí. Je však docela možné jej použít online. Případně můžete vytvořit nějaký druh indexu a vložit jej do veřejné (sdílené) složky. Samotný program lze nainstalovat na počítač každého uživatele nebo jej lze také umístit do otevřené složky veřejný přístup a pomocí parametrů vytvořte speciální zástupce pro každého uživatele zvlášť příkazový řádek, jehož účel je popsán v souboru nápovědy dodaném s programem. Také existuje možnost automatická instalace programy do sítě pomocí souboru MSI. Tím se zohlední nastavení pro každého připojeného uživatele.

Obecně je to dobrý program z kategorie profesionálních vyhledávačů. Může mít dobré hodnocení, ale získání důvěry a respektu od uživatelů nemusí být pro dtSearch kvůli určitým faktorům snadné (ne vše je s rozhraním hladké, ruští uživatelé jsou ochuzeni, neexistují žádné jasné funkce pro práci se sítí) . Pokud jde o přímé vyhledávání dokumentů, program neměl problémy s ruským textem. Protože nebyly žádné s deklarovanou morfologií nebo s fuzzy vyhledáváním. Systém zcela adekvátně našel potřebné dokumenty jak pro jednoduchý jednoslovný dotaz, tak pro použití jako klíčová fráze pár odstavců, nějaký dokument.

Oficiální stránka:
Velikost distribuce: 23 Mb Bloodhound Prof Deluxe

Podle názvu můžete odhadnout, že v tomto programu je podpora ruského jazyka. To už je pěkné. Pokud jde o rozhraní, obecně je poněkud neobvyklé, ale vzhledově je velmi atraktivní. Další věcí je pohodlí. Velmi kontroverzní kritérium, ale stále pravděpodobně není řešení s více okny nejúspěšnější možností (v jednom okně se zadá požadavek, v jiném se zobrazí výsledek a podobně).

Snoop používá stejné indexy k provedení rychlého vyhledávání, ale indexování je mnohem pomalejší než jiné programy. To je velmi zvláštní, zejména s ohledem na možnosti zpracování vyhledávací dotazy má velmi slabé, což znamená, že struktura indexu není složitá. S největší pravděpodobností je to způsobeno neoptimalizovanými algoritmy. Tento program se ukázal jako jasný outsider v indexování a rychlosti vyhledávání: čas strávený vytvářením indexu byl šestkrát delší než u stejných dtSearch a iSYS. Indexování 20 gigabajtů textů pro bloodhounda znamenalo 38 hodin a 46 minut práce. A vytvořená „vyhledávací oblast“ zabrala na pevném disku stejnou velikost jako původní data s malým mínusem – 19 gigabajtů.

Bloodhound může být prezentován jako alternativa ke standardnímu vyhledávání ve Windows, je nepravděpodobné, že bude schopen více. O tom, že primárním úkolem Snoopera je co nejjednodušší vyhledávání souborů, svědčí nejen malý počet funkcí pro analýzu textu vyhledávacích dotazů a pokročilé vyhledávání podle atributů souboru, ale dokonce i okno s výsledky, které poskytuje přímé odkazy na nalezené soubory a také složky obsahující tyto soubory. Okno výsledků není příliš informativní v tom smyslu, že celý nalezený soubor můžete přečíst pouze jeho spuštěním, to znamená, že nemá vestavěný prohlížeč souborů. Ale zobrazuje se úryvek ze souboru, kde bylo hledané slovo nalezeno obecně, toto schéma zobrazení velmi připomíná internetové vyhledávače;

Když už mluvíme o specifických schopnostech pro zpracování vyhledávacích dotazů, stojí za zmínku, že neexistuje nic takového jako „hledaný text“ – maximum, které lze prohledávat, je fráze, už jen proto, že neexistuje víceřádkové pole pro zadávání textu. Zadanou frázi však můžete také analyzovat a Snoop nám nabízí standardní zde: vyhledávací sada: logické operace, vyhledávání masek a citací... nic moc. Program obsahuje některé základy morfologického vyhledávání, ale pravděpodobně tak hrubé, že to spíše překáží správné fungování(během testování bylo zaznamenáno mnoho překryvů s nesprávným použitím morfologie).

Program ale umožňuje při vyhledávání specifikovat atributy souboru (datum dokumentu, název souboru, název složky) a v těchto dotazech můžete také použít stejnou vyhledávací sadu. Můžete také vyhledávat písmena zadáním parametrů (Od, Předmět... atd.).

Na samotné hledání jsme tedy přišli, co dalšího je na programu, za který získal tolik ocenění, podle informací z oficiálního webu zajímavého? Těžko říct, co je na něm tak zvláštního, s největší pravděpodobností je rozhraní Bloodhound atraktivní (přesně vzhledově, nemluvě o použitelnosti).

Operace s indexy jsou velmi standardní; Kromě toho lze indexy používat také online. Od této chvíle potřebujeme další podrobnosti.

Přes primitivnost vyhledávacích dotazů lze s programem vyhledávat soubory, takže jeho použití lze v sítích ospravedlnit. I když je to zdlouhavé, protože ve velké síti je prioritou rychlé vyhledávání dat pomocí složitých vyhledávacích dotazů kvůli obrovskému množství informací - a zde jsou zjevně problémy s rychlostí vyhledávání a programem. Musím říct, že práce se sítí v Izhishika je promyšlená tak, jak má. Navrženo speciálně pro toto samostatná aplikace- Server Bloodhound. Funguje to stejně jako právě Bloodhound ( vyhledávač mají jeden), pouze pro dokumenty hostované na centrálním serveru nebo na sdílených prostředcích v podnikové síti. Snooper Server vytváří nové indexy na sdílených prostředcích nebo používá dříve vytvořené. Každý uživatel podnikové sítě se může připojit k vyhledávacímu serveru a použít jej k přístupu k libovolnému dokumentu (umístěnému v aktuálním indexu) pomocí internetového prohlížeče. Souhlasím, toto schéma je velmi pohodlné: ukazuje se, že soubory v vlastní síť lze vyhledávat stejně jako informace na internetu např. přes Google.

Po zhodnocení všech výhod a nevýhod tohoto programu závěr sám napovídá, že jeho schopnosti s největší pravděpodobností nestačí pro podnikové sítě (i přes dobrou organizaci práce se sítí), ale pro domácí počítač nebo dokonce pro domácí síť V zásadě by to mohlo být vhodné. I když ani rychlost práce, ani možnosti vyhledávání nevzbuzují optimismus...

Oficiální stránky v ruštině:
Velikost distribuce: 6 MbGoogle Desktop Search + GDS Enterprise

Samozřejmě jsme nemohli ignorovat tak slavného vývojáře. název Google jižříká hodně. Lidé, kteří již léta používají nejvýkonnější internetový vyhledávač, se jistě bez jediné pochybnosti rozhodnou nainstalovat si tento konkrétní vyhledávač do svého počítače. Jen si pomyslete: Google na vašem domácím počítači! Aniž bychom však podlehli provokacím se široce propagovanou značkou, zkusme střízlivě a hlavně objektivně zvážit možnosti „desktopového“ vyhledávače od Googlu.

První věc, která vás upoutá, je nedostatek vlastního shellu pro program. Google Desktop Search je stále umístěn v okně prohlížeče, respektive celé rozhraní desktopové verze bylo zděděno ze softwaru od svého staršího internetového bratříčka. Je to dobré nebo špatné - kontroverzní téma: někteří lidé mají rádi minimalismus v designu tohoto vyhledávače, zatímco jiní chtějí vidět plná aplikace, plné všech druhů knoflíků a tak dále.

Co vám padne do oka hned po návrhu? A skutečnost, že stejný nástroj Google Desktop Search začne indexovat vše v počítači bez jakéhokoli požadavku! A co je nejzajímavější, je nemožné vybrat cesty indexování pomocí Google Desktop Search. Budete si muset stáhnout samostatný program (TweakGDS), který vám umožní mírné rozšíření Nastavení Google Desktop, včetně určení míst potřebných pro indexování. I když v době, kdy to všechno zjistíte, bude již indexovat standardní pevný disk, takže toto nastavení bude pravděpodobně potřeba při práci s velkým množstvím dat, což je velmi důležité při použití v podnikových sítích ( Enterprise verze). Není však pravda, že po stažení TweakGDS budou vaše problémy vyřešeny. Koneckonců potřebuje Microsoft, aby fungovala. NET Framework a Microsoft Scripting Runtime. Jo... instalace, stejně jako přístup do nastavení, mohla být jednodušší, i když vývojáři asi chápou: proč psát něco nového, když existuje hotový vyhledávač, portovaný na místní počítač a nechat uživatele "užít si" slavné jméno udělá z „tohoto“ další mistrovské dílo. Pojďte, ukončíme tuto lyrickou odbočku a přejdeme k hledání.

Pokud jde o analýzu vyhledávacích dotazů a poskytování výsledků, je zde vše naprosto identické s Googlem na internetu: stejný systém pro zobrazování výsledků, stejná standardní sada logických operací pro vyhledávací dotazy. V obecný Google Desktop Search je stejně jako předchozí program určen výhradně pro vyhledávání souborů – nemá samozřejmě interní prohlížeč těchto souborů. Počet formátů souborů, které Google Desktop Search podporuje, je zcela dostatečný a příjemné je i to, že prohledává navštívené internetové stránky, přičemž data bere z mezipaměti. Rychlosti vyhledávání a indexování jsou celkem přijatelné. Pravda, pro domácí použití. S působivými 20 gigabajty Texty Google Desktop Search dokončil úkol za 8 hodin a 17 minut. Strávit několik dní zpracováváním informací z podnikové sítě velkého podniku není něco, co by chtěl dělat žádný systémový administrátor. Pozitivní je, že velikost vytvořeného indexu byla na stejné úrovni (4,5 GB) jako jiný vyhledávač testovaný v této recenzi – SearchInform.

Velkou výhodou (nebo nevýhodou – rozhodnete se vy) Google Desktop Search je, že podporuje pluginy, které mohou mnohé změnit k lepšímu. Další věc je, že připojení pluginů a jejich nastavení komplikuje instalaci vyhledávače natolik, že se začnete ptát, zda je to všechno nutné, když můžete nainstalovat normální. plnohodnotný program, ve kterém již bude vše přítomno. Koneckonců, abyste mohli používat každou funkci, budete muset nainstalovat nový plugin. I k tomu, aby program mohl plně pracovat s archivy, je potřeba samostatná vychytávka. Je fascinující a svůdné, že všechny tyto dodatečné moduly jsou zdarma. Pokud však neberete v úvahu desktopovou verzi vyhledávače, pak kompetentní konfigurace GDS Enterprise nemusí být ve vašich silách - koneckonců ne nadarmo nabízejí své služby specialisté z Google pro nastavení vlastního software pro vaši síť za pouhých 10 000 $.

Pokud projdete procesem nastavení a instalace (nebo zaplatíte 10 000 $ týmu rychlé reakce od společnosti Google), pochopíte, že složitost instalace je více než kompenzována velmi flexibilním nastavením při použití v podnikových sítích. Důležitý bod Google funguje Desktop v podnikové síti je použití skupinových zásad, které umožňují nastavit nastavení pro každého uživatele.

Abychom to shrnuli, nejrozumnějším využitím tohoto programu je domácí nebo pracovní počítač. Koneckonců, pro běžný počítač stačí pouze nainstalovat program - zbytek udělá sám (ani se vás nebude na nic ptát).

Google Desktop Search Enterprise však bude přijatelný v případech naléhavé potřeby flexibilní konfigurace síťová politika používat vyhledávač, přičemž na druhém místě důležitosti bude schopnost zpracovávat vyhledávací dotazy a na prvním místě bude čas (nebo peníze) vynaložené na nastavení programu.

Oficiální stránka:
Velikost distribuce včetně TweakGDS: 1,2 MbCopernic Desktop Search

Pro zvětšení klikněte na obrázek

Rozhraní programu volá výhradně pozitivní emoce- vše se děje v souladu s obecně uznávanými normami, jedním slovem nic extra pěkný design. Pro začátečníky bude pochopení rozhraní Copernic Desktop Search velmi snadné. I když je poněkud matoucí, že návrháři jasně vytvořili rozhraní programu s ohledem na skutečnost, že program bude fungovat standardní téma Design Windows XP. Při použití klasického motivu program nevypadá tak hezky. Ale to je spíše otázka vkusu.

Při prvním spuštění vás program vyzve k vytvoření indexů pro vyhledávání. Poněkud nezvykle se zdálo, že po výběru složek pro indexování program nenabídl ke stisknutí žádného tlačítka, jako například „Zahájit indexování“, a indexování se nespustilo automaticky, teprve pak bylo zaznamenáno, že se Copernic pokouší spustit indexování, zatímco počítač byl nečinný. Abyste vše správně nakonfigurovali, budete se muset trochu hlouběji ponořit do možností programu. Nutno podotknout, že jich je poměrně dost dostatek příležitostí pro nastavení automatického vytváření indexu: vestavěný plánovač, možnost indexovat, když je počítač nečinný, na pozadí, s nízkou prioritou. Indexování nebylo příliš rychlé - 10 hodin 51 minut - to je pomalejší než v jiných vyhledávačích (kromě Issher, ale stále Copernic rychlejší vývoj iSleuthHound Technologies je řádová velikost.

Nyní o struktuře indexu. Obecně na tom není nic zvláštního. Je možné vybrat typy souborů v obecné i podrobné podobě. To znamená, že zpočátku si můžete vybrat, co chcete indexovat – Dokumenty, Obrázky, Videa, Hudba. Na druhé kartě okna možností budete moci vybrat konkrétní typy souborů podle přípony. Kromě toho můžete index nakonfigurovat tak, aby například obrázky menší než 16x16 nebyly indexovány nebo zvukové soubory kratší než 10 sekund nebyly indexovány. Kromě indexování souborů ze složek může Copernic pracovat s e-maily a kontakty z adresář Microsoft Outlook a Microsoft Outlook Express, je možné indexování oblíbených položek a historie z aplikace Internet Explorer.

Pokud jde o možnosti vyhledávání, jsou zde velmi slabé. Během testů se dokonce ukázalo, že program nevyhledává dokumenty txt formáty a html v ruštině, což vám umožňuje najít je pouze podle nadpisů, nikoli podle obsahu. Jediná věc, kterou program poskytuje pro zlepšení efektivity vyhledávání, je použití standardní sady logických operací, a dokonce i tehdy byla tato funkce objevena experimentálně, protože nebyla zdokumentována. Mimochodem, ani s pomocí programu není vše v pořádku - je k dispozici pouze přes internet, což, jak vidíte, je velmi nepohodlné, a dokonce i na internetu referenční informace ne příliš mnoho. Vývojáři se zjevně rozhodli, že jednoduché rozhraní programu neznamená přítomnost normální nápovědy. V konverzaci o možnostech vyhledávání je třeba poznamenat, že navzdory slabé analýze dotazů program poskytuje zajímavý systém hledat - uživatel si může vybrat typ souboru (obrázky, videa, hudba atd.), zadat vyhledávací dotaz a vybrat atributy specifické pro vybraný typ souboru. Například pro zvukové soubory, mohou to být hodnoty z mp3 tagů (interpret, album, datum atd.), u obrázků lze například vybrat jejich velikost (podle rozlišení), obecně má každý typ své vlastní nastavení. Po vyhledání konkrétního typu souboru program zobrazí v okně výsledků velmi informativní seznam a pokud váš požadavek obsahuje soubory jiného typu, můžete je otevřít kliknutím na konkrétní odkaz.

Samostatně stojí za zmínku okno pro zobrazení výsledků. Pod seznamem nalezených souborů je zobrazen obsah těchto souborů (podobné schéma se často používá v poštovní klienti). Je pravda, že zobrazení textu lze provést pouze v nativním formátu a neexistuje režim zobrazení prostého textu, což není vždy vhodné, protože otevření dokumentu v tomto případě trvá déle. Ale vzhledem k tomu, že Copernic umí vyhledávat obrázky a hudbu, je možné tyto multimediální soubory prohlížet.

Jsou popsány základní principy fungování tohoto programu, nyní se pojďme podívat, co nám Copernic Desktop Search může nabídnout pro práci se sítí... V zásadě se můžete dívat velmi dlouho, ale téměř nic neuvidíte . Jinými slovy, tento program nebyl zamýšlen jako síťový. Copernic Desktop Search je výhradně domácí vyhledávač.

Je zřejmé, že jedinou (nejlogičtější) aplikací tohoto programu je domácí počítač. Zde si plně poradí se všemi jednoduchými uživatelskými vyhledávacími dotazy skládajícími se z jednoho či dvou slov, najde potřebné informace a rozdělení vyhledávání podle typu souboru a podpora multimediálních souborů spolu s indexací na pozadí v režimu nízké priority, spojený s příjemným rozhraní, pouze dát programu sílu získat důvěru mezi nezkušenými uživateli.

Oficiální stránka
Velikost distribuce: 2,6 MbISYS Desktop

Pro zvětšení klikněte na obrázek

Velmi výkonný program. Svým stupněm výbavy všemožnými funkcemi se v seznamu blíží dalšímu vyhledávacímu systému SearchInform. Navíc velikost instalačního souboru je více než 40 Mb! Těžko říct, co by se dalo do takových rozměrů vtěsnat, protože stejný SearchInform s podobnou funkčností zabírá 15 Mb.

Proces instalace zde také není příliš příjemný, respektive ani proces instalace. Ještě před stažením programu budete vyzváni k registraci, jinak to nejde. Dále rozhraní. Je to udělané moc pěkně, nic zbytečného nebije do očí, nicméně to jsou dojmy člověka, který je už tak trochu zvyklý. Pro začátečníka nebude snadné zjistit, kde a co se nachází, kam kliknout a kde nakonec hledat. Důrazně se doporučuje přečíst si nápovědu před zahájením práce – ušetříte si spoustu nervů a času. Ke všemu ostatnímu se přidává naprostá absence podpory ruského jazyka v programu. Špatný. Okna zde navíc nejsou přetížená ovládacími prvky, ale museli za to zaplatit multimoduly a použití přídavná okna. Například vyhledávací dotazy se zadávají spuštěním jednoho programu a správa indexů se provádí pomocí jiného programu. Vyhledávací dotazy se zde také zadávají v samostatných vyskakovacích oknech. Těžko říct, co je lepší – přetížené rozhraní nebo všudypřítomná více oken, je to spíše věc vkusu.

Pokud jde o vytváření indexů, program poskytuje funkce pro zjednodušení procesu nastavení možností pro nový index. Tyto funkce zahrnují několik hotové šablony k vytváření rejstříků pro složku „Dokumenty“, „Pošta“, „Pošta a dokumenty“, „Konkrétní složka“, „Složka s výběrem typů souborů“ atd. Tyto šablony v první fázi zjednodušují vytváření rejstříků. Nástroj pro práci s indexy nemá příliš dobré rozhraní, což je poněkud skličující (to je docela subjektivní hodnocení, abych byl upřímný), ale jakmile se na něj podíváte, nabízí mnoho užitečných možností a obecně není jeho použití nijak zvlášť obtížné. ISYS Desktop může indexovat data z různých datových zdrojů a také poskytuje celou řadu flexibilní nastavení pro takové indexování. Mezi další funkce indexování patří: podpora pro SQL, FTP, TRIM Context, WORLDOX 2002, skripty. Pokud jste při vytváření indexu vybrali položku "Složka s výběrem typů souborů", máte možnost vybrat typy souborů pro indexování ručně (podle přípony). Je třeba říci, že podporovaných typů souborů je prostě obrovské množství, ale přidejte si svůj vlastní typ (příponu). existující seznam nebude to fungovat. Můžete si také všimnout přítomnosti plánovače indexování. Vytvoření indexu a zpracování 20 gigabajtů informací trvalo ISYS Desktopu 6 hodin a 13 minut, což nakonec ukázalo dobrý čas a velikost vytvořeného souboru – 7,9 GB.

Možnosti vyhledávání tohoto programu jsou docela dobré. To, co se používá v ISYS, je mnohem výkonnější běžná podpora logické operace. Mezi pokročilé možnosti vyhledávání program nabízí použití synonym a třídicí filtr (podle cesty, názvu a data vytvoření souboru). Sada logických operátorů je poněkud širší než standardní sada. Kromě logických operací program umožňuje pracovat s mnoha dalšími operátory, které v zásadě mohou nahradit některé typy vyhledávání, například vyhledávání pomocí rozebrat lze zcela nahradit použitím speciálních operátorů. Velmi mě překvapilo, že program nemá vyhledávání pomocí morfologie. Toto je vážné opomenutí, protože při použití morfologické analýzy se výrazně zlepší efektivita vyhledávání. Kromě toho neexistuje seznam významných slov, ale existuje rozsáhlý seznam nepodstatných slov. Ohlášeny jsou také vyhledávací funkce jako „přibližné vyhledávání“ a „heuristická analýza“.

ISYS poskytuje výběr z několika typů vyhledávacích dotazů, zejména vizuálních. Děje se tak pomocí různých typů oken pro zadávání vyhledávacích dotazů, nicméně ve skutečnosti ani jedno okno neumožňuje použití jiných technologií než výše uvedených.

Výsledky vyhledávání jsou velmi informativní a zobrazují se jako seznam dokumentů seřazených podle relevance. Níže se zobrazí náhled vybraného dokumentu. Na rozdíl od Copernic Desktop Search je zde náhled k dispozici pouze ve formě prostého textu, nebylo možné zobrazit dokumenty v jejich nativním formátu, ať už jde o Word, Html nebo PDF, i když to v zásadě není příliš kritické. Program umožňuje rozdělit nalezené dokumenty do skupin podle určitých kritérií (standardně jsou rozděleny podle relevance). Výběrem můžete také zobrazit dokumenty, které již byly nalezeny samostatné složky(to je výhodné, když výsledkem je velké množství dokumentů).

Použití programu v podnikové síti je také velmi opodstatněné, protože poskytuje dobré příležitosti pro organizaci vyhledávání v síti. Vyhledávací systém je založen na vytvoření veřejného indexu, který obsahuje indexovaná data z veřejně dostupných online zdrojů.

Ve skutečnosti je program od ISYS hodný pozornosti, alespoň se s ním seznámit. Tento program je vyzrálý projekt s velkým množstvím funkcí (ne vždy a ne každý je samozřejmě potřebuje, ale přesto). Šance, že se program dočká nějakých vylepšení z hlediska zpracování vyhledávacích dotazů, není známa, ale v tuto chvíli jej lze doporučit pro téměř univerzální použití. A vzhledem k tomu, že je pro domácí systémy stále příliš těžký, jsou hlavními místy jeho instalace podnikové sítě.

Oficiální stránka:
Velikost distribuce: 40 MbSearchInform

Pro zvětšení klikněte na obrázek

Pravděpodobně nemá cenu začít hned popisem rozhraní SearchInform. Nejprve bychom měli popsat proces instalace, nebo spíše jeden z jeho detailů: program nelze nainstalovat bez připojení k internetu. Faktem je, že před prvním spuštěním program vyžaduje registraci uživatele (zdarma) a odesílá všechna zadaná data na server. Podle všeho museli vývojáři taková opatření v boji proti pirátství přijmout, ale na jednoduchosti instalace se to nijak pozitivně neprojevilo.

Rozhraní programu je navrženo v souladu se všemi obecně uznávanými pravidly, na první pohled je však poněkud těžkopádné. Při prvním použití programu se zdá, že je příliš komplikovaný, někdy není snadné si zapamatovat, ve kterém menu nebo na které záložce se požadovaná možnost nachází, nicméně s více dlouhodobé užívání, rozhraní se již nezdá tak strašně složité. Hlavní je si nejprve přečíst certifikát.

Jakmile trochu porozumíte rozhraní, můžete začít vytvářet index. Samotný proces je velmi jednoduchý a rychlost indexování i na pohled je výrazně vyšší než u všech ostatních vyhledávačů v recenzi. Jasná testovací čísla ukazují, že SearchInform je dvakrát rychlejší než dtSearch a iSYS, pokud jde o rychlost indexování! Poskytnutá data v objemu 20 gigabajtů program indexoval v rekordním čase 3 hodiny 17 minut. A velikost vytvořeného indexu se ukázala jako nejmenší 4,4 GB - o 100 megabajtů méně než Google Desktop Search.

Program podporuje kromě běžných souborů a složek také indexování e-mailů, připojování a indexování databází (!) a dalších externích zdrojů (DMS, CRM), ihned při indexování lze určit slovník pro provádění morfologického vyhledávání a všechny atributy mohou být indexované soubory. Po vytvoření indexu, když se pokusíte provést první testovací vyhledávání dokumentů, můžete být poněkud zmateni: „Jsou zde dva typy vyhledávání, ale který z nich potřebuji?“ Jak již bylo zmíněno dříve, hlavní věcí je přečíst si certifikát, pak bude vše jasné. Program může ve skutečnosti provádět dva typy vyhledávání – vyhledávání frází a vyhledávání dokumentů obsahově podobných textu dotazu.

Popis všech hlavních funkcí pro analýzu vyhledávacího dotazu byl uveden výše, takže nyní uvedeme pouze možnosti vyhledávání, které tento program poskytuje. Začněme hledáním frází: samozřejmě morfologické hledání, hledání citací, logické operace, hledání s parsováním slova (hledání na začátku slova, na konci, ve střední části nebo úplná shoda), smíšené hledání citací ( kdy v dokumentu musí být přítomna všechna slova z dotazu, ale ne nutně v zadaném pořadí), vyhledávání s opravou chyb, používání synonym, „hledání téměř citací“ (hledání zadané fráze jako citace, ale mohou být i jiná slova být přítomen mezi zadanými slovy) atd. Některé z uvedených možností mají svá vlastní specifická nastavení. Navíc je možné použít slovník nedůležitých slov, a to už program má připravený seznam těchto slov, můžete k vyhledávání použít i slovník prioritních slov (samozřejmě si jej budete muset vyplnit sami).

Zde jsme v zásadě stručně zhodnotili všechny hlavní rysy vyhledávání frází.

Přejděme k úvahám o vlastnostech tohoto programu – vyhledávání podobných dokumentů. Vývojáři tvrdí, že se v žádném případě nejedná o jednoduché textové vyhledávání, jde přesně o „hledání podobných“ – přesně tak se to všude popisuje, ale ouha, můžete si to říkat, jak chcete – hlavním bodem je . Krátké vyhledávání na internetu může rychle odhalit, že takzvané „podobné vyhledávání“ - nový vývoj v textové analýze. Tento systém umožňuje vyhledávat texty, které jsou sémantickým obsahem podobné. Nejpříjemnější bylo, že po provedení testovacích vyhledávacích dotazů se ukázalo, že teorie se docela shoduje s praxí! Program skutečně vyhledá dokumenty s podobným obsahem a zobrazí je v seznamu a seřadí je podle procenta podobnosti.

Dále se podívejme, co SearchInform (zejména jeho firemní verze SearchInform Corporate) nabízí pro práci v podnikové síti. Existují dva typy aplikací: strana serveru a strana uživatele. Serverová část Automaticky zpracovává zadané indexy a uživatelé je mohou používat k vyhledávání v závislosti na přidělených přístupových právech. Uživatele lze konfigurovat automaticky pomocí přihlašovacích údajů Záznamy systému Windows(odborně, SearchInform používá NTFS ověřování systému Windows) a ručně (uživatelé budou muset být přidáni samostatně). Každému uživateli lze povolit nebo zakázat přístup k určitým indexům a uživatele lze také spojovat do skupin. Obecně platí, že nastavení SearchInform pro práci v síti předčí Google z hlediska flexibility a Ishhound Server z hlediska pohodlí a jednoduchosti.

Oficiální stránka:
Velikost distribuce: 14,7 Mb Porovnání rychlostí indexování

Vyhledávací systémČas indexováníVelikost indexu
Bloodhound Prof Deluxe 4.538 hodin 46 minut19 GB
Isys Desktop 7.06 hodin 13 minut7,9 GB
DtSearch 7.06 hodin 3 minuty8,6 GB
Google Desktop Search Enterprise8 hodin 17 minut4,5 GB
Copernic Desktop Search *10 hodin 51 minut7 GB
SearchInform 1.5.023 hodiny 17 minut4,4 GB

* Většinu dokumentů.html a .txt obsahujících ruský text, přestože byly indexovány, nebylo možné najít jinak než podle jejich názvů

Všechny programy stojí za pozornost.

Na základě testů a pečlivého zkoumání každého programu prezentovaného v recenzi lze vyvodit určité závěry. Google Desktop Search Copernic Desktop Search je tedy docela vhodný pro nezkušené uživatele jako domácí informační vyhledávací systém. Dělají s nimi dobrou práci jednoduché dotazy, nezahltí uživatele nastavením a navíc jsou zcela zdarma. Pokus Googlu vstoupit na trh firemních vyhledávačů zatím není příliš oprávněný: pro plnohodnotnou práci do programu je potřeba nahrát další moduly a jeho nastavení není zdaleka snadné. Samovysvětlující názvy Desktop Search, Copernic a Google si proto za sebou rezervují výklenek „desktopových“ vyhledávačů.

Pravda, výkonnější řešení – dtSearch, iSYS a SearchInform také nejsou spolehlivé a nabízejí uživatelům své „desktopové“ verze. Ale za rozumnou cenu, na rozdíl od svobodného softwaru od Google a Copernic. Za výkon, rychlost a funkčnost si samozřejmě musíte zaplatit. Hlavní pozornost vývojářů dtSearch, iSYS a SearchInform je ale samozřejmě zaměřena na firemní sektor. Síť, funkčnost, indexování a rychlost vyhledávání jsou to, co odlišuje tyto produkty od jejich „konkurentů“. Na základě výsledků testu byl identifikován favorit - SearchInform. Program poskytuje možnost vyhledávat podobné dokumenty, má nejvyšší rychlost indexování a vyhledávání, má dobrou sadu funkcí.

Jak rychle najít požadovaný text mezi mnoha soubory? Někdy nastane situace, kdy potřebujete rychle najít konkrétní text, umístěný v nějakém souboru, jehož jméno je neznámé, a samotný soubor se nachází mezi velkým počtem stejných (nebo dokonce jiných typů) souborů.

Například student potřebuje najít odpověď na nějakou otázku mezi několika desítkami poznámek z přednášek v elektronické podobě, žena v domácnosti potřebuje najít recept v katalogu s recepty, správce systému může potřebovat najít informaci o nějaké chybě aplikace mezi několika stovkami logs, potřebuje programátor najít konkrétní kód mezi tisíci zdrojovými kódy.

Co dělat v tomto případě? Samozřejmě můžete postupně otevřít každý soubor a hledat v něm, ale pokud je takových souborů hodně, velmi brzy se taková práce změní v rutinní mučení.

V tomto případě je lepší vyhledat pomoc od speciální prostředky, navržené speciálně pro tyto účely a umožňují rychlé vyhledání textu. Jedním z takových nástrojů je program pro vyhledávání souborů FileSearchy.

Program je zdarma pro osobní použití, můžete si jej stáhnout z webu vývojáře. Existuje placená verze, rozdíly mezi nimi jsou vidět i na webu.

Program pro vyhledávání souborů FileSearchy dokáže vyhledávat text v velké množství formáty souborů, nejběžnější z nich: .doc, .docx, .xls, xlsx, .ppt, pptx, .pdf, .txt. Placená verze Program také umí vyhledávat text v souborech elektronických knih (EPUB, FB2 a MOBI).

Provozní režimy programu pro vyhledávání souborů

Program může pracovat ve dvou režimech: Mezi těmito režimy můžete přepínat zaškrtnutím nebo zrušením zaškrtnutí Zobrazit | Vyhledávací lišta.

Okamžité vyhledávání

V režimu okamžitého vyhledávání program pro vyhledávání souborů funguje, když je vyhledávací panel skrytý. V tomto režimu můžete vyhledávat soubory pouze podle názvu, který je nutné zadat do jednoho pole. Chcete-li vyhledat soubor, stačí zadat název souboru nebo dokonce část názvu nebo příponu. Nalezené výsledky se zobrazí během psaní.

Vlastnosti tohoto režimu:

  • Chcete-li zahrnout nebo vyloučit určité názvy souborů, musíte kliknout na tlačítko s obrázkem tří teček napravo od pole pro zadávání textu a v okně, které se zobrazí, zadejte, co potřebujete, nebo naopak potřeba hledat.
  • Soubory můžete vyhledávat způsobem, který rozlišuje malá a velká písmena. Chcete-li to provést, musíte zaškrtnout políčko Hledat | Citlivý na velká písmena.
  • Chcete-li vybrat typ výrazu, který hledáte, musíte přejít do nabídky Hledat | Typ výrazu a vyberte vhodný režim (podřetězec, plné slovo nebo regulární výraz). To bude podrobněji probráno níže. Ve výchozím nastavení je vybrán Podřetězec a ve většině případů to stačí.

pokročilé vyhledávání

V rozšířeném režimu musíte zadat alespoň název souboru a kliknout na tlačítko Hledat. Stejně jako v režimu okamžitého vyhledávání můžete zadat celý název souboru i jeho část. Ale hlavní krása tohoto režimu je, že můžete nastavit další parametry vyhledávání:
  • V adresáři- označuje, kde hledat soubory. Pokud toto pole ponecháte prázdné, program prohledá všechny indexované disky. Ve výchozím nastavení jsou indexovány všechny logické pevné disky.

    V nabídce můžete zobrazit nebo změnit, které disky je třeba indexovat Nástroje | Možnosti... | Indexování.

  • V obsahu- umožňuje určit, jaký text se má prohledávat uvnitř souborů. Tohle je nejvíc zajímavá příležitost program, který umožňuje vyhledávat konkrétní text v souborech. Níže uvedený snímek obrazovky tedy ukazuje, jak rychle najít všechny textové soubory na jednotce C, které zmiňují jakoukoli chybu (je přítomno slovo chyba).
  • Datum změny- tato sekce umožňuje filtrovat soubory podle data poslední změna. Pokud zaškrtnete toto políčko, budete muset zadat časové období, ve kterém chcete hledat.
  • Velikost- umožňuje filtrovat soubory podle velikosti. Musíte také zadat rozsah velikostí, ve kterém chcete hledat, a vybrat jednotky měření (KB, MB, GB)

Typy výrazů

V režimu okamžitého vyhledávání se typy výrazů konfigurují v nabídce Hledat | Typ výrazu. V rozšířeném režimu v sekci Název souboru po zaškrtnutí políčka se objeví další pole Extra možnosti.

V závislosti na nastavení text zadaný do pole Název souboru lze interpretovat jako slovo, část názvu (podřetězec) nebo regulární výraz.

Podřetězec

Toto je nejjednodušší režim a je nainstalován ve výchozím nastavení. V tomto režimu stačí zadat část názvu souboru. Tento režim je vhodný zejména v případech, kdy není znám celé jméno soubor, nebo pokud jej někdo zapomněl, ale pamatuje si, co to je textový soubor- v tomto případě jej stačí zadat do řádku .txt.

Celé slovo

V tomto režimu se slovo zadané do vyhledávacího pole může objevit v názvu souboru nebo obsahu ve formuláři jediné slovo, ale nemůže být součástí jiného slova.

Například slovo „poznámka“ odpovídá souboru „note.txt“, „moje poznámka.txt“, ale neodpovídá souboru „1note.txt“ nebo „notebook.txt“

Regulární výraz

V tomto režimu je hledaný řetězec interpretován jako regulární výraz kompatibilní s programovacím jazykem Perl. Regulární výrazy toto je velmi oddělené velké téma, pokud je neznáte, prostě tento režim nepoužívejte.

S pomocí tohoto malého volný program Během několika sekund tak můžete ve svém počítači najít nejen jakýkoli text, ale i jakýkoli soubor, byť ten nejmenší, který se ztratí mezi terabajty dalších dat.




Horní