Tisk z diktátu. Hlasové vyhledávání. Problém s rozpoznáváním řeči

Hlasové zadávání textu v editoru Word je velmi pohodlný a pokročilý nástroj. Ale málokdo o tom ví. To není překvapivé, protože technologie byla spuštěna relativně nedávno: 27. června 2017 se na oficiálních stránkách Microsoftu objevily novinky, ve kterých oznámili novou funkci.

Ve výchozím nastavení není tato funkce ve Wordu dostupná a nepomohou žádné aktualizace. Pro tento účel musíte použít službu třetí strany.

Tento doplněk umožňuje zadávat text pomocí hlasu ve více než 20 jazycích. Navíc dokáže překládat slova online do 60 různých jazyků. A co je nejdůležitější, tato služba je zcela zdarma.

Chcete-li povolit diktování ve vaší kanceláři, musíte postupovat podle těchto kroků.

  1. Otevřete oficiální stránku vývojářů. Klikněte na odkaz „Stáhnout pro Office 32-bit“ nebo „Pro Office 64-bit klikněte sem“.

Chcete-li zjistit bitovost vašeho systému a stáhnout správnou verzi programu, stiskněte horké klávesy Win + Pause / Break.

  1. Klikněte na tlačítko "Uložit".

  1. Spusťte stažený soubor.

  1. Klikněte na tlačítko "Další".

  1. Souhlasíme s licenční smlouvou a klikneme na „Další“.

  1. Poté klikněte na tlačítko „Instalovat“.

  1. Po krátkém čekání dokončete instalaci kliknutím na „Dokončit“.

  1. Spusťte editor Word a přejděte na kartu „Diktování“.

  1. Pokud se nechystáte překládat text, vyberte v obou polích ruštinu.

  1. Ujistěte se, že je mikrofon připojen a funguje. Klikněte pravým tlačítkem na ikonu zvuku.

  1. Vyberte „Záznamová zařízení“.

  1. Řekněte něco do mikrofonu. Stupnice by se měla rozsvítit. Pokud se nic nestane, je to špatně. To znamená, že zařízení je vypnuté nebo nefunguje.
  2. Ujistěte se, že se jedná o výchozí mikrofon. Jinak nebude psaní možné.

Výchozí zařízení můžete nastavit pomocí kontextového menu (je třeba kliknout pravým tlačítkem myši na vybranou položku).

  1. Pokud je vše v pořádku, klikněte na tlačítko „OK“.

  1. Vrátíme se do editoru Word. Chcete-li začít psát text pomocí hlasových příkazů, stačí kliknout na ikonu „Start“.

  1. Zkusme něco říct.

  1. Vše funguje perfektně. Souhlasíte, psaní textu je tímto způsobem mnohem pohodlnější a jednodušší. A co je nejdůležitější, je to velmi rychlé. Chcete-li nahrávání zastavit, klikněte na tlačítko „Stop“.

Nahrávání je automaticky zakázáno, pokud jste dlouho nepřistupovali k dokumentu aplikace Word (byli jste v jiné aplikaci) nebo jste byli ticho.

Požadavky na systém

Abyste mohli používat tento doplněk a zapomenout, co znamená „psát ručně“, musíte mít na svém počítači nainstalovaný „Net Framework 4.5“ nebo novější. Pokud tento software nemáte nebo jej nemůžete určit (skutečnost instalace na PC), budete muset provést následující kroky.

  1. Přejděte na oficiální web společnosti Microsoft. Jakmile otevřete tuto stránku, budete muset kliknout na odkaz ke stažení.

  1. Poté budete vyzváni k instalaci dalších aktualizací.
  2. Klikněte na tlačítko „Odmítnout“.

  1. Spusťte stažený soubor.
  2. Dále jsou dvě možnosti: zpráva oznamující, že Net Framework je již nainstalován, nebo úvodní stránka instalace.
  3. V tomto případě vidíme, že tlačítko „Pokračovat“ není aktivní. A zároveň nám říkají, že na tomto počítači je vše v pořádku.

V opačném případě budete muset kliknout na tlačítko „Pokračovat“ a počkat na dokončení procesu instalace.

Závěr

V tomto článku jsme vám řekli, jak aktivovat hlasové zadávání textu v aplikaci Microsoft Word. Pokud to nefunguje, váš operační systém možná nesplňuje požadavky nebo jste mikrofon připojili nesprávně.

Vezměte prosím na vědomí, že kvalita záznamu textu závisí na tom, jak jasně a zřetelně slova vyslovujete.

Video návod

Pokud stále nemůžete psát text pomocí hlasového vstupu, zkuste se podívat na toto video. Možná vám další rady pomohou vyřešit vaše problémy.

V dnešní době je prostě nemožné žít bez počítače v moderním světě. Nemusíte být mistrem Photoshopu nebo profesionálním střihačem videa (samozřejmě pokud to není pracovní). Ale schopnost napsat nějaký text je naprosté minimum.

č. 2 Web Speech API


Online program Web Speech API je co do funkčnosti naprosto identický s předchozími.

Tato služba, stejně jako výše uvedené, byla také vytvořena společností Google.

Hlavní stránka vypadá takto:


Díky jednoduchému rozhraní je okamžitě zřejmé, že pro zahájení nahrávání musíte vybrat jazyk a poté kliknout na mikrofon.

Po kliknutí na ikonu vpravo systém určitě požádá o přístup.


Poté, co dáte souhlas, můžete okamžitě začít pracovat. Zadejte text hlasem a v okně se objeví jeho tištěná verze.

Po dokončení práce můžete text zkopírovat, kam potřebujete (opět ctrl+C, ctrl+V).

č. 3.

Mluvčí

Stejně jednoduchým programem je Talktyper. Chcete-li začít, přejděte na web:


https://talktyper.com/ru/index.html.

Chcete-li začít, stačí kliknout na ikonu mikrofonu vpravo.

Na rozdíl od výše popsaných lze tento psací stroj otevřít pomocí libovolného prohlížeče. Přestože byl web vytvořen v USA, aplikace snadno rozpozná nejoblíbenější jazyky světa, včetně ruštiny.

Talktyper je multifunkční: nejen píše text, ale také sám vkládá interpunkční znaménka a opravuje chyby. Pokud systém nedokáže rozpoznat slovo, které jste přečetli, jako správné, bude určitě zvýrazněno.

Kromě toho má Talktyper funkci překladu a také voiceover.

Poznámka! Po dokončení hlasového zadávání nezapomeňte kliknout na šipku, aby se zadaný dokument přenesl do jiného pole. Poté jej lze odeslat e-mailem nebo zkopírovat do požadovaného souboru.

Možné problémy při práci s programy hlasového vytáčení

Když tyto programy začnete používat, určitě se budete divit, jak počítač rozpozná náš hlas a následně jej převede do živého textu.

Schéma rozpoznávání řeči zařízení vypadá takto:

    Celý proces lze rozdělit do 3 hlavních fází:

    Akustický rozpoznávač.

    Je důležité mluvit jasně, nahlas a mikrofon musí přenášet váš hlas bez přerušení.

    Jazykové zpracování.

    Čím více slov je ve slovníku programu, tím lepší je kvalita psaného textu. To znamená, že vše, co řeknete, bude rozpoznáno a přeneseno v textové podobě bez zkreslení.

    Rozpoznaný pravopis textu.

Program automaticky zobrazí pravopisnou verzi diktovaného projevu na základě pauz, srozumitelnosti slov, lexémů nalezených ve slovníku atd.

  1. Při práci s počítačovými písaři se nejčastěji objevují 2 problémy:
  2. Akustický rozpoznávač „zachytává“ vaši řeč přerušovaně.

Ve slovníku systému není dostatek slov, aby bylo možné rozpoznat vše, co jste řekli.

Chcete-li vyřešit první problém, musíte mluvit jasně a nahlas. Ale pro druhý problém neexistuje prakticky žádné řešení, alespoň ne bezplatné.

Aby vývojáři poskytli programu rozsáhlou slovní zásobu, musí investovat hodně peněz, a proto mnoho rozpoznávačů vykazuje nízkou úroveň překladu řeči do textu.

Google v této věci pokročil nejdále, protože... má dostatek prostředků na investice. Tato společnost mimo jiné vytvořila největší online slovník, který pomáhá rozpoznávat hlasy a převádět je do grafické podoby.

Podívejte se na podrobný návod v tomto videu:

  1. Když pronášíte projev, v místnosti by mělo být ticho. Zvuky přírody, hudba a pláč dítěte jsou systémem vnímány jako hluk. Z tohoto důvodu bude text napsán s velkými chybami.
  2. Nemluv, když něco sníš. To se projeví nejen na kvalitě sestavy, ale je to i životu nebezpečné.
  3. Než začnete, musíte zvolit správnou hlasitost svého hlasu a také pochopit, jakou citlivost má váš mikrofon.

    Chcete-li to provést, zkuste napsat několik vět známým tónem. Pokud dojde k přerušení nahrávání, podívejte se na nastavení mikrofonu.

  4. Mezi slovy dělejte krátké přestávky.
  5. Vyhněte se dlouhým frázím.

Někdo to řekne program pro hlasové vytáčení je skvělý pomocník, který jim uvolní ruce a celkově jim usnadní život. Jiní se rozhodnou, že „ta hra nestojí za svíčku“. Proto se musíte sami rozhodnout, zda je použijete.

A vy už víte, jaké služby si vybrat...

To se provádí pomocí mikrofonu. Mluvené slovo je zdrojem akustických vln, které představují periodicky se střídající řídnutí a zhušťování okolního vzduchu.

Vlna dopadající na mikrofon způsobí na svém výstupu elektrický signál o určité amplitudě a frekvenci. Tento signál je převeden na sekvenci pravoúhlých pulzů, zakódovaných jako „jedničky“ a „nuly“, a může být následně zpracován počítačem.

S příchodem počítačů s dostatečným výpočetním výkonem se psaní textu hlasem do počítače stalo realitou, díky čemuž je možné výrazně snížit zátěž klávesnice.

Počítačová technologie pro zadávání informací z hlasu umožňuje naladění na hlasy různých lidí. Tato metoda se nazývá ladění počítače na konkrétní hlas. Skládá se z následujícího. Všechna slova, která člověk vysloví poprvé, jsou zpracována počítačem a vložena do jeho databáze jako vzorky. Když člověk později pronese řeč, počítač se okamžitě snaží najít každé slovo ve své databázi. Nyní existují moderní počítačové systémy, které dokážou pracovat s jakýmkoli hlasem bez tréninku.

Použití této technologie umožňuje nejen zadávat textové informace, ale také ovládat počítač pomocí mluvených příkazů.

Kdy je to užitečné? hlasové psaní? Je vhodný pro zadávání dopisů, textů zpráv, složitých vědeckých nebo obchodních dokumentů do počítače. Tento způsob komunikace s počítačem bude velmi vhodný pro lékaře, právníky, novináře, sekretářky, administrátory na různých úrovních, překladatele, spisovatele a mnoho dalších.

Hlasové zadávání informací je nepostradatelné v případech, kdy jsou ruce uživatele zaneprázdněny jinou prací, ale nutně potřebuje dát počítači příkaz ke správě určitých úkolů. To může být nutné pro operátory na výrobních linkách, vědce, zdravotníky apod. Tento způsob může být také jediný možný v případě, kdy hlavní práce probíhá v zatemněné místnosti a zadávání dat z klávesnice je obtížné, popř. osoba musí být v dostatečné vzdálenosti od počítače. Mimochodem, v této situaci je možné zadávat data přes rádiem řízený mikrofon. Je také možné zadávat data nebo příkazy do vzdáleného počítače přes počítačovou síť.

Jak začít používat hlasové psaní na domácím počítači?

Chcete-li to provést, musíte k počítači připojit mikrofon a přejít na webovou stránku http://speechpad.ru/ Tato online služba vám umožňuje psát text hlasem do hlasového poznámkového bloku.

Proces hlasového zadávání je poměrně jednoduchý. Nastavili jsme nastavení pro nahrávání a text můžete diktovat hlasem. Pro plynulé zadávání textu použijte tlačítko „Povolit nahrávání“. Pomocí ikony mikrofonu zadávejte jednotlivé fráze nebo věty.

Moderní technologie pro hlasový vstup a výstup informací poskytují uživatelům mnoho možností, jak si usnadnit práci a ušetřit čas. Nikoho nepřekvapí ani program pro přeměnu textu na hlas, ani program, který za vás napíše vše, co řeknete. V tomto směru je stále prostor pro vývoj, ale i dnes se dají najít celkem slušné služby a software pro verbální komunikaci s počítačem. Systémy rozpoznávání řeči digitalizují zvuk přicházející z mikrofonu a identifikují informace přístupem ke stávajícím slovníkům (software může podporovat různé jazyky a mít velkou slovní zásobu), poté zobrazí na obrazovce již napsaný text nebo nastaví různé příkazy.

Technologie se aktivně používá na chytrých telefonech, tabletech a dalších zařízeních, kde ve výchozím nastavení mohou existovat programy, které „rozumí“ jazyku uživatele, což je velmi pohodlné pro správu. Pro pokročilé uživatele již není novinkou používání řeči místo psaní příkazů a dotazů do vyhledávací lišty prohlížeče z klávesnice. Pokrok ale nestojí a převod hlasu na text ve větším množství se také stává samozřejmostí. Použití speciálních programů, rozšíření prohlížeče a online služeb pro zadávání řečových dat vám umožňuje částečně uvolnit ruce a nenamáhat zrak a také rychleji provádět úkoly. To je neocenitelné pro zástupce mnoha profesí, včetně právníků, lékařů, spisovatelů, textařů ​​a dalších specialistů, kteří pracují s psaním.

Navzdory skutečnosti, že lidé, kteří hodně píší, to obvykle dělají poměrně rychle a jejich rychlost psaní dokáže držet krok s jejich myšlenkami, používání programu má často skutečný smysl. Hlasové zadávání vám pomůže, pokud je z nějakého důvodu nepohodlné psát ručně, vaše ruce jsou zaneprázdněny jinými věcmi nebo můžete být unavení z dlouhé práce. Nezapomeňte také na lidi se zdravotním postižením - pro ně jsou takové inovace prostě spásou. Na druhou stranu ne každý zná „metodu dotykového psaní“, nepíše požadovaným tempem nebo je prostě líný. Mnoho spisovatelů, novinářů a dalších osobností používá diktafon po desetiletí k rychlému vyslovení požadovaného textu a zabránění vyklouznutí myšlenek. Ke stejnému účelu se dnes používají programy pro psaní hlasem.

Převod diktovaných informací do tištěné podoby samozřejmě zatím není na nejvyšší úrovni. Poté, co program převede hlas na text, bude určitě nutné jej opravit, protože některá slova nemusí být v softwarových slovnících a také kvůli frázím nesprávně dekódovaným zařízením, což může být způsobeno mikrofonem nebo nejasnou výslovností . Technologie ještě nejsou tak dokonalé, protože vývoj vyžaduje značné kapitálové investice, ale ke změnám rozhodně dochází. Nejdále v této oblasti pokročila společnost Google, která vyrábí četné softwarové produkty včetně aplikací pro záznam a převod hlasu na text.

Uživatel si může vybrat nejvhodnější možnost pro sebe, použít software jeho stažením do PC nebo použít webové zdroje. Programy pro převod řečových a zvukových nahrávek do textu mohou být volně dostupné ke stažení nebo distribuovány na komerční bázi.

Program pro zadávání hlasu využívající Google Voice API rozpoznává řeč ve více než 50 jazycích, k dispozici je výběr rozhraní (ruština, angličtina) a široká škála možností, včetně přenosu rozpoznaného textu do editorů, možnosti přidávat vlastní příkazy a přiřaďte „horké“ příkazy“ pro aktivaci/zastavení procesu nahrávání pro rozpoznání. Aplikace MSpeech je zcela zdarma, přesto je její funkčnost a kvalita práce na slušné úrovni. Bohužel bez připojení k internetu nebude program fungovat.

Voco

Aplikace, která provádí psaní pomocí hlasu, má poměrně velkou slovní zásobu 85 000 slov. Rozšířené verze programu obsahují další tematické slovníky, které umožňují používat terminologii. Software Voco Professional a Voco Enterprise kromě diktování přes mikrofon zařízení rozpoznává také zvukové nahrávky. Interpunkce se provádí na povel a v případě převodu nahrávek zvukového formátu do textu se interpunkční znaménka umísťují automaticky. Program je distribuován na placené bázi a je dostupný pro verze Windows 7 a vyšší. Velkou výhodou softwaru je možnost používat jej bez připojení k internetu, což je velmi výhodné, pokud hodně píšete, ale jste často mimo oblast pokrytí sítě.

Rozšíření pro Microsoft Office bylo vydáno v roce 2017 a nástroj můžete používat tak, že si jej nainstalujete dodatečně k balíčku. V aktualizovaných verzích aplikací Word, PowerPoint a Outlook není služba Dictate ve výchozím nastavení povolena. Bezplatný doplněk vám umožňuje psát text hlasem ve více než 20 jazycích a má funkci překladu do 60 jazyků. Nástroj si můžete stáhnout na oficiálních stránkách Microsoftu a vybrat vhodnou bitovou hloubku systému. Po jednoduché instalaci staženého souboru Dictate pomocí instalačního průvodce se ve Wordu objeví záložka Diktování, kde můžete diktovat text a v případě potřeby jej přeložit do jiného jazyka. Pro ty, kteří pracují s tímto editorem, je to skvělá možnost, jak zrychlit tempo produktivity, místo aby trávili hodiny mačkáním kláves.

Bezplatný hlasový poznámkový blok společnosti Google SpeechPad je vynikající nástroj pro převod řeči na textové informace. Pro používání služby je potřeba nainstalovat prohlížeč Google Chrome, což není pohodlné pro každého, ale funkčnost rozhodně stojí za pozornost. Poznámkový blok mohou používat majitelé operačních systémů Windows, Linux a Mac, je vyžadováno připojení k internetu. Online služba nabízí možnosti pro převod zvuku a videa na text, překlad do jiných jazyků a pro pohodlí můžete přiřadit „horké klávesy“. Kromě toho, když nainstalujete rozšíření pro SpeechPad, máte další možnosti pro přímé zadávání textu. Integrační modul pro operační systém vám umožní používat hlasový vstup v každé z aplikací nainstalovaných v systému.

Další produkt pro psaní pomocí hlasu od Googlu, podobný poznámkovému bloku SpeechPad, se spouští v prohlížeči Chrome. Voysnot lze nainstalovat jako rozšíření nebo aplikaci na váš počítač. Ať už si vyberete kteroukoli možnost, není těžké tento nástroj zvládnout. Postup nahrávání můžete spustit kliknutím na ikonu mikrofonu a poté jednoduše napsat zprávu hlasem. Abyste se vyhnuli velkému počtu chyb, musíte mluvit jasně a zřetelně a dělat si krátké pauzy.

Tento nástroj pro převod řeči na text také dobře tiskne z diktátu, kontroluje výsledky na interpunkční a gramatické chyby a má funkci překladu textových informací do různých jazyků. Výhodou používání aplikace je navíc velmi potřebná možnost, která nabízí možnosti pro slova, která TalkTyper přesně nerozpoznal, budou zvýrazněna.

Jak zlepšit kvalitu hlasového vstupu textu na počítači

Jakákoli služba nebo program pro zpracování řeči a její převod na text bude fungovat lépe, pokud jsou pro to poskytnuty všechny podmínky, protože kvalita psaní přímo závisí na správně nakonfigurovaném mikrofonu, dikci uživatele a nepřítomnosti dalšího šumu. Neměli byste doufat, že rozpoznávání hlasu bude fungovat správně, pokud jsou zjevné vady řeči. Chcete-li snížit počet chyb a věnovat méně času opravám textu, musíte splnit následující podmínky:

  • Pro správnou konverzi řeči je nezbytná jasná výslovnost a absence cizích zvuků. Pokud slova s ​​interpunkčními znaménky vyslovujete co nejjasněji, nebudete muset text příliš dlouho upravovat;
  • Před provedením práce musíte nakonfigurovat mikrofon. Pokud není možné eliminovat cizí hluk, je lepší snížit jeho citlivost a vyslovovat slova hlasitěji a jasněji;
  • Není třeba vyslovovat příliš dlouhé fráze, kořeněné mnoha složitými syntaktickými strukturami.

Pokud se budete řídit těmito doporučeními a zvyknete si na správné diktování, program napíše text s minimem chyb, což bude mít příznivý vliv na vaši produktivitu. Hlasový vstup přitom zatím není možné považovat za 100% alternativu psaní na klávesnici, úpravy budou určitě nutné, ale mnoha uživatelům tato příležitost usnadňuje každodenní úkoly.

Najednou jsem musel napsat až 50 tisíc znaků textu za den! To samozřejmě nemohlo nevyvolat hledání speciálních softwarových enginů pro zadávání textu hlasem.

Ještě před několika lety to bylo prakticky nemožné, protože všechny takové programy fungovaly na Západě a byly tedy přizpůsobeny angličtině.

V tuto chvíli se situace změnila k lepšímu. Nyní může každý copywriter výrazně zjednodušit své každodenní úkoly.

Přirozeně, ne všechno je tak jednoduché. Abych byl upřímný, sám jsem popisovanou službu trochu používal, ale pak jsem se rozhodl ji opustit, protože tento vývoj se mi zdál trochu hrubý. I když, znovu, když to srovnáte s tím, co se stalo například v roce 2012, je to prostě zázrak!

Služba hlasového psaní

Mluvíme tedy o službě speechpad.ru. Když přejdete na tuto stránku, uvidíte ve spodní části okno podobné standardnímu poznámkovému bloku. V tomto případě se jedná o hlasový zápisník. Zde se zobrazí text zadaný hlasem.

Než začnete testovat hlasový modul, musíte se ujistit, že je váš mikrofon správně připojen k počítači. Pokud s tím nejsou žádné problémy, můžete stisknout tlačítko „Povolit nahrávání“:

Pole č. 1 zobrazuje text, který jste řekli v posledních několika sekundách. Když je tam vaše věta, je zpracována hlasovým modulem a rozpoznává slova.

Poté se vše nadiktované přenese do druhého pole, kde to již lze upravovat standardními prostředky – klávesnicí a myší.

Přátelé, jak jsem řekl výše, služba vůbec není tablet pro zadávání klávesnice. V zásadě se není čemu divit! Pokud se totiž objeví engine, který dokonale rozpoznává hlasy, poptávka po copywriterech a sazečích se výrazně sníží a obecně to v internetovém marketingu vyvolá skutečnou senzaci.

Alespoň si to myslím. Ale vraťme se k našemu hlasovému zápisníku a slíbeným radám.

  1. Udělejte si čas a vyslovujte každé slovo jasně (VELMI jasně!).
  2. Pokud vidíte, že věta v prvním poli je mírně zaseknutá, nespěchejte s diktováním dalšího textu shora, protože jsou chvíle, kdy je program jednoduše přerušen. Musíte znovu zapnout nahrávání a znovu přečíst poškozenou větu.
  3. Upravte mikrofon tak, aby nezaznamenával vaše dýchání, protože to negativně ovlivní záznam a rozpoznávání textu.
  4. Text upravte pery přímo ve druhém poli, ihned po úspěšném napsání jedné věty. Nahrávání není potřeba vypínat, ale ujistěte se, že příliš dlouhá pauza automaticky nepřeruší nahrávání. Zkusil jsem si přečíst celý článek (samozřejmě ne vše bylo rozpoznáno a bylo tam docela dost chyb) a pak hned vše upravovat ve Wordu. Praxe ukázala, že tato metoda není účinná. Je lepší to udělat za běhu.

S interpunkčními znaménky by neměly být žádné problémy. Chcete-li přidat čárku, pomalu a odměřeně vyslovte na správném místě „ČÁRKA“ nebo „TEČKA“ nebo „Vykřičník“. V tomto ohledu vše funguje v pořádku a nemusel jsem téměř nic měnit ručně.

Další možnosti hlasového vstupu

Kromě standardních funkcí online služby si můžete do Chromu nainstalovat další rozšíření, abyste mohli používat hlasové příkazy v jakékoli oblasti.

Vývojáři se navíc podařilo vytvořit integrační modul pro operační systém Windows. S jeho pomocí můžete ovládat různé programy a funkce Windows pouhým hlasem.

První i druhou aplikaci si můžete stáhnout na stejném webu v tomto odstavci:

Podrobný návod v tomto směru neuvádím, jelikož mě to osobně nezajímá a vše je podrobně popsáno na webu. Kdo to potřebuje, zvládne si vše nainstalovat sám.

Pokud se vám služba líbí, můžete se zaregistrovat a upravit si spoustu věcí na stránce pro sebe.




Horní