Impresión desde dictado. Búsqueda por voz. Problema de reconocimiento de voz

La entrada de texto por voz en el editor de Word es una herramienta muy conveniente y avanzada. Pero no mucha gente lo sabe. Esto no es sorprendente, ya que la tecnología se lanzó hace relativamente poco tiempo: el 27 de junio de 2017 apareció en el sitio web oficial de Microsoft una noticia en la que anunciaban una nueva característica.

De forma predeterminada, esta función no está disponible en Word y ninguna actualización ayudará. Para ello es necesario utilizar un servicio de terceros.

Este complemento le permite ingresar texto usando su voz en más de 20 idiomas. Además, puede traducir palabras en línea a 60 idiomas diferentes. Y lo más importante es que este servicio es completamente gratuito.

Para habilitar el dictado en su oficina, debe seguir estos pasos.

  1. Abra la página oficial de desarrolladores. Haga clic en el enlace "Descargar para Office de 32 bits" o en "Para Office de 64 bits, haga clic aquí".

Para determinar la profundidad de bits de su sistema y descargar la versión correcta del programa, presione las teclas de acceso rápido Win + Pause/Break.

  1. Haga clic en el botón "Guardar".

  1. Ejecute el archivo descargado.

  1. Haga clic en el botón "Siguiente".

  1. Aceptamos el acuerdo de licencia y hacemos clic en "Siguiente".

  1. Luego haga clic en el botón "Instalar".

  1. Después de una breve espera, complete la instalación haciendo clic en "Finalizar".

  1. Inicie el editor de Word y vaya a la pestaña "Dictado".

  1. Si no va a traducir el texto, seleccione ruso en ambos campos.

  1. Asegúrese de que su micrófono esté conectado y funcionando. Haga clic derecho en el icono de sonido.

  1. Seleccione "Dispositivos de grabación".

  1. Di algo por el micrófono. La báscula debería iluminarse. Si no pasa nada, eso es malo. Esto significa que el dispositivo está apagado o no funciona.
  2. Asegúrese de que este sea el micrófono predeterminado. De lo contrario, no será posible escribir.

Puede configurar el dispositivo predeterminado usando el menú contextual (debe hacer clic derecho en el elemento seleccionado).

  1. Si todo está bien, haga clic en el botón "Aceptar".

  1. Volvemos al editor de Word. Para comenzar a escribir texto usando comandos de voz, solo necesita hacer clic en el ícono "Inicio".

  1. Intentemos decir algo.

  1. Todo funciona muy bien. De acuerdo, escribir texto es mucho más cómodo y sencillo de esta forma. Y lo más importante es que es muy rápido. Para detener la grabación, haga clic en el botón "Detener".

La grabación se desactiva automáticamente si no has accedido al documento de Word durante mucho tiempo (estaba en otra aplicación) o permaneciste en silencio.

Requisitos del sistema

Para poder utilizar este complemento y olvidar lo que significa “escribir a mano”, debes tener instalado “Net Framework 4.5” o posterior en tu computadora. Si no tiene este software o no puede determinarlo (el hecho de instalarlo en una PC), deberá realizar los siguientes pasos.

  1. Vaya al sitio web oficial de Microsoft. Una vez que abra esta página, deberá hacer clic en el enlace de descarga.

  1. Después de esto, se le pedirá que instale actualizaciones adicionales.
  2. Haga clic en el botón "Rechazar".

  1. Ejecute el archivo descargado.
  2. A continuación, hay dos opciones: un mensaje que indica que Net Framework ya está instalado o la página de inicio de instalación.
  3. En este caso vemos que el botón “Continuar” no está activo. Y al mismo tiempo nos dicen que todo está bien en esta computadora.

De lo contrario, sólo tendrás que hacer clic en el botón “Continuar” y esperar a que se complete el proceso de instalación.

Conclusión

En este artículo, le contamos cómo activar la entrada de texto por voz en Microsoft Word. Si esto no funciona, es posible que tu sistema operativo no cumpla con los requisitos o que hayas conectado el micrófono incorrectamente.

Tenga en cuenta que la calidad de la grabación del texto depende de la claridad y distinción con la que pronuncie las palabras.

Instrucciones en vídeo

Si aún tienes problemas para escribir usando la entrada de voz, intenta ver este video. Quizás algunos consejos adicionales le ayuden a resolver sus problemas.

Hoy en día es simplemente imposible vivir sin una computadora en el mundo moderno. No es necesario que seas un maestro de Photoshop o un editor de vídeo profesional (a menos que esté relacionado con el trabajo, por supuesto). Pero poder escribir algo de texto es lo mínimo.

No. 2.


API de voz web

El programa en línea Web Speech API tiene una funcionalidad absolutamente idéntica a los anteriores.

Este servicio, al igual que los enumerados anteriormente, también fue creado por Google.


La página principal se ve así:

La sencilla interfaz hace evidente de inmediato que para comenzar a grabar es necesario seleccionar un idioma y luego hacer clic en el micrófono.


Después de hacer clic en el icono de la derecha, el sistema definitivamente solicitará acceso.

Después de terminar el trabajo, puedes copiar el texto donde lo necesites (nuevamente, Ctrl+C, Ctrl+V).

No 3.

Talktyper

Un programa igualmente simple es Talktyper. Para comenzar, vaya al sitio web:


https://talktyper.com/ru/index.html.

Para comenzar, simplemente haga clic en el ícono del micrófono a la derecha.

A diferencia de las descritas anteriormente, esta máquina de escribir se puede abrir utilizando cualquier navegador. Aunque el sitio fue creado en EE. UU., la aplicación reconoce fácilmente los idiomas más populares del mundo, incluido el ruso.

Talktyper es multifuncional: no solo escribe texto, sino que también pone signos de puntuación y corrige errores por sí solo. Si el sistema no puede reconocer una palabra que leíste como correcta, definitivamente quedará resaltada.

Además, Talktyper tiene función de traducción, así como voz en off.

¡Prestar atención! Una vez que termine de escribir por voz, asegúrese de hacer clic en la flecha para que el documento escrito se transfiera a otro campo. Después de esto, puede enviarse por correo electrónico o copiarse al archivo deseado.

Posibles problemas al trabajar con programas de marcación por voz.

Cuando empieces a utilizar estos programas, seguro que te preguntarás cómo la computadora reconoce nuestra voz y luego la traduce a texto en vivo.

El esquema de reconocimiento de voz del dispositivo se ve así:

    Todo el proceso se puede dividir en 3 etapas principales:

    Reconocedor acústico.

    Es importante hablar claro, en voz alta y el micrófono debe transmitir tu voz sin interrupciones.

    Procesamiento lingüístico.

    Cuantas más palabras haya en el diccionario del programa, mejor será la calidad del texto mecanografiado. Es decir, todo lo que diga será reconocido y transmitido en forma de texto sin distorsión.

    Texto de ortografía reconocida.

El programa muestra automáticamente la versión ortográfica del discurso dictado, en función de pausas, claridad de palabras, lexemas encontrados en el diccionario, etc.

  1. Cuando se trabaja con mecanógrafos informáticos, surgen con mayor frecuencia 2 problemas:
  2. El reconocedor acústico "capta" su discurso de forma intermitente.

No hay suficientes palabras en el diccionario del sistema para reconocer todo lo que dijiste.

Para resolver el primer problema, es necesario hablar claro y en voz alta. Pero para el segundo problema prácticamente no hay solución, al menos no gratuita.

Para proporcionar un programa con un vocabulario extenso, los desarrolladores necesitan invertir mucho dinero, razón por la cual muchos reconocedores demuestran un bajo nivel de traducción de voz a texto.

Google es el que más ha avanzado en este asunto, porque... tiene fondos suficientes para invertir. Esta empresa, entre otras cosas, ha creado el mayor diccionario online que ayuda a reconocer voces y traducirlas a una versión gráfica.

Mire el tutorial detallado en este vídeo:

  1. Cuando das un discurso, la sala debe estar en silencio. El sistema percibe como ruido los sonidos de la naturaleza, la música y el llanto de un niño. Debido a esto, el texto se escribirá con grandes errores.
  2. No hables si comes algo. Esto no sólo afectará a la calidad del conjunto, sino que también pondrá en peligro la vida.
  3. Antes de comenzar, debe elegir el volumen correcto de su voz y también comprender qué sensibilidad tiene su micrófono.

    Para ello, intente escribir algunas frases en un tono familiar. Si hay interrupciones en la grabación, consulte la configuración del micrófono.

  4. Tome breves descansos entre palabras.
  5. Evite frases largas.

Alguien dirá eso programa de marcación por voz es un asistente maravilloso que les libera las manos y les hace la vida más fácil en general. Otros decidirán que “el juego no vale la pena”. Por lo tanto, debes decidir si los utilizarás tú mismo.

Y ya sabes qué servicios elegir...

Esto se hace a través de un micrófono. Las palabras habladas son una fuente de ondas acústicas, que representan una rarefacción y compactación del aire circundante que se alternan periódicamente.

Una onda que golpea un micrófono provoca una señal eléctrica de cierta amplitud y frecuencia en su salida. Esta señal se convierte en una secuencia de pulsos rectangulares, codificados como "unos" y "ceros", y luego puede ser procesada por una computadora.

Con la llegada de computadoras con suficiente potencia informática, escribir texto por voz en una computadora se ha convertido en una realidad, gracias a lo cual es posible reducir significativamente la carga en el teclado.

La tecnología informática para introducir información a partir de la voz permite sintonizar las voces de diferentes personas. Este método se llama sintonizar la computadora con una voz específica. Consta de lo siguiente. Todas las palabras que una persona pronuncia por primera vez son procesadas por una computadora y se ingresan en su base de datos como muestras. Cuando más tarde una persona pronuncia un discurso, la computadora intenta instantáneamente encontrar cada palabra en su base de datos. Ahora existen sistemas informáticos modernos que pueden funcionar con cualquier voz sin necesidad de formación.

El uso de esta tecnología permite no solo ingresar información de texto, sino también controlar la computadora mediante comandos hablados.

¿Cuándo es útil? escritura por voz?

Es conveniente para ingresar cartas, textos de informes, documentos científicos o comerciales complejos en la computadora. Este medio de comunicación con una computadora resultará muy conveniente para médicos, abogados, periodistas, secretarias, administradores de diversos niveles, traductores, escritores y muchos otros.

La entrada de información por voz es indispensable en los casos en que las manos del usuario están ocupadas con otros trabajos, pero necesita urgentemente darle al ordenador una orden para gestionar determinadas tareas. Esto puede ser necesario para operadores de líneas de producción, científicos, trabajadores médicos, etc. Este método también puede ser el único posible en el caso en que el trabajo principal se realiza en una habitación oscura y es difícil ingresar datos desde el teclado, o el La persona debe estar a una distancia suficiente de la computadora. Por cierto, en esta situación es posible introducir datos a través de un micrófono controlado por radio. También es posible ingresar datos o comandos en una computadora remota a través de una red informática.

¿Cómo empezar a utilizar la escritura por voz en la computadora de tu casa?

Para hacer esto, debe conectar un micrófono a su computadora e ir al sitio web http://speechpad.ru/. Este servicio en línea le permite escribir texto por voz en un bloc de notas de voz.

Las tecnologías modernas para la entrada y salida de información por voz brindan a los usuarios muchas oportunidades para facilitar su trabajo y ahorrar tiempo. A nadie le sorprenderá ni un programa para convertir texto en voz ni uno que escriba todo lo que dices por ti. Todavía hay margen de desarrollo en esta dirección, pero incluso hoy en día se pueden encontrar servicios y software bastante decentes para la comunicación verbal con una computadora. Los sistemas de reconocimiento de voz digitalizan el sonido proveniente del micrófono e identifican información accediendo a diccionarios existentes (el software puede admitir diferentes idiomas y tener un vocabulario amplio), después de lo cual muestran el texto ya escrito en la pantalla o configuran varios comandos.

La tecnología se utiliza activamente en teléfonos inteligentes, tabletas y otros dispositivos, donde de forma predeterminada puede haber programas que "entienden" el idioma del usuario, lo cual es muy conveniente de manejar. Ya no es una novedad para los usuarios avanzados utilizar la voz en lugar de escribir comandos y consultas en la barra de búsqueda del navegador desde el teclado. Pero el progreso no se detiene y la conversión de voz en texto en grandes cantidades también se está convirtiendo en algo habitual. El uso de programas especiales, extensiones de navegador y servicios en línea para la entrada de datos de voz le permite liberar parcialmente sus manos y no forzar la vista, además de realizar tareas más rápidamente. Esto es invaluable para representantes de muchas profesiones, incluidos abogados, médicos, escritores, redactores y otros especialistas que trabajan con mecanografía.

A pesar de que normalmente las personas que escriben mucho lo hacen con bastante rapidez y la velocidad de escritura se mantiene a la altura de la idea, a menudo tiene sentido utilizar el programa. La escritura por voz le ayudará si por alguna razón le resulta inconveniente escribir manualmente, si tiene las manos ocupadas con otras cosas o si puede cansarse de trabajar durante mucho tiempo. Además, no se olvide de las personas con discapacidad: para ellas, estas innovaciones son simplemente una salvación. Por otro lado, no todo el mundo conoce el “método de mecanografía”, no escribe al ritmo requerido o simplemente es perezoso. Muchos escritores, periodistas y otras personalidades utilizan desde hace décadas una grabadora de voz para pronunciar rápidamente el texto deseado y evitar que los pensamientos se escapen. Los programas de escritura por voz se utilizan hoy en día con el mismo propósito.

Por supuesto, la conversión de información dictada a formato impreso aún no se encuentra en el nivel más alto. Después de que el programa traduzca la voz en texto, definitivamente será necesario corregirlo, ya que algunas palabras pueden no estar en los diccionarios del software, así como también debido a frases decodificadas incorrectamente por el dispositivo, lo que puede deberse al micrófono o a una pronunciación poco clara. . Las tecnologías aún no son tan perfectas, porque el desarrollo requiere una inversión considerable de capital, pero definitivamente hay cambios. La empresa que más ha avanzado en este ámbito es Google, que produce numerosos productos de software, incluidas aplicaciones para grabar y convertir voz en texto.

El usuario puede elegir la opción que más le convenga, utilizar el software descargándolo a una PC o utilizar recursos web. Los programas para traducir grabaciones de voz y audio a texto pueden estar disponibles gratuitamente para su descarga o distribución comercial.

Un programa de escritura por voz que utiliza Google Voice API reconoce el habla en más de 50 idiomas, hay una variedad de interfaces disponibles (ruso, inglés) y hay una amplia gama de opciones, incluida la transferencia de texto reconocido a los editores, la capacidad de agregar su propios comandos y asignar "comandos rápidos" para activar/detener el proceso de grabación para el reconocimiento. La aplicación MSpeech es completamente gratuita, a pesar de ello su funcionalidad y calidad de trabajo se encuentran en un nivel decente. Lamentablemente, el programa no podrá funcionar sin una conexión a Internet.

Voco

La aplicación, que permite escribir mediante voz, tiene un vocabulario bastante amplio de 85.000 palabras. Las versiones ampliadas del programa incluyen diccionarios temáticos adicionales, que permiten utilizar terminología. El software Voco Professional y Voco Enterprise, además del dictado a través del micrófono del dispositivo, también reconoce grabaciones de audio. La puntuación se realiza cuando se le ordena y, en el caso de traducir grabaciones en formato de audio a texto, los signos de puntuación se colocan automáticamente. El programa se distribuye de forma paga y está disponible para versiones de Windows 7 y superiores. Una gran ventaja del software es la posibilidad de utilizarlo sin conexión a Internet, lo cual es muy conveniente si escribes mucho, pero a menudo estás fuera del área de cobertura de la red.

La extensión para Microsoft Office se lanzó en 2017 y puede utilizar la herramienta instalándola adicionalmente al paquete. En las versiones actualizadas de Word, PowerPoint y Outlook, el servicio Dictar no está habilitado de forma predeterminada. El complemento gratuito le permite escribir texto por voz en más de 20 idiomas y tiene una función de traducción a 60 idiomas. Puede descargar la herramienta en el sitio web oficial de Microsoft, seleccionando la profundidad de bits adecuada del sistema. Después de simplemente instalar el archivo Dictate descargado usando el asistente de instalación, aparecerá la pestaña Dictado en Word, donde podrá dictar texto y, si es necesario, traducirlo a otro idioma. Para quienes trabajan con este editor, esta es una excelente opción para acelerar el ritmo de productividad, en lugar de pasar horas escribiendo teclas.

El bloc de notas de voz gratuito de Google, SpeechPad, es una excelente herramienta para convertir voz en información de texto. Para utilizar el servicio, debe instalar el navegador Google Chrome, que no es conveniente para todos, pero la funcionalidad definitivamente merece atención. El Bloc de notas puede ser utilizado por propietarios de sistemas operativos Windows, Linux y Mac; se requiere una conexión a Internet. El servicio en línea ofrece opciones para convertir audio y video en texto, traducir a otros idiomas y, para mayor comodidad, puede asignar "teclas de acceso rápido". Además, cuando instala extensiones para SpeechPad, tiene opciones adicionales para la entrada directa de texto. El módulo de integración para el sistema operativo le permitirá utilizar la entrada de voz en cada una de las aplicaciones instaladas en el sistema.

Otro producto para escribir mediante voz de Google, similar al bloc de notas SpeechPad, se inicia en el navegador Chrome. Voysnot se puede instalar como una extensión o aplicación en su computadora. Cualquiera que sea la opción que elijas, no será difícil dominar la herramienta. Puede iniciar el procedimiento de grabación haciendo clic en el icono del micrófono y luego simplemente escribir un mensaje de voz. Para evitar una gran cantidad de errores, es necesario hablar con claridad y claridad, haciendo breves pausas.

Esta herramienta de conversión de voz a texto también imprime bien desde dictados, verifica los resultados en busca de errores gramaticales y de puntuación y tiene la función de traducir información de texto a diferentes idiomas. Además, un beneficio de usar la aplicación es una opción muy necesaria que ofrece opciones para palabras que TalkTyper no ha reconocido con precisión; se resaltarán.

Cómo mejorar la calidad de la entrada de texto por voz en una computadora

Cualquier servicio o programa para procesar voz y convertirla en texto funcionará mejor si se brindan todas las condiciones para ello, porque la calidad de la escritura depende directamente de un micrófono correctamente configurado, la dicción del usuario y la ausencia de ruido adicional. No se debe esperar que el reconocedor de voz funcione correctamente si hay defectos evidentes en el habla. Para reducir el número de errores y dedicar menos tiempo a corregir el texto, debes cumplir con las siguientes condiciones:

  • Para una correcta conversión del habla, es necesaria una pronunciación clara y la ausencia de sonidos extraños. Si pronuncias las palabras con signos de puntuación lo más claramente posible, no tendrás que editar el texto por mucho tiempo;
  • Antes de realizar el trabajo, debe configurar el micrófono. Si no es posible eliminar los ruidos extraños, es mejor reducir su sensibilidad y pronunciar las palabras más fuerte y claramente;
  • No es necesario pronunciar frases demasiado largas, aderezadas con muchas estructuras sintácticas complejas.

Si sigues estas recomendaciones y te acostumbras a dictar correctamente, el programa escribirá texto con errores mínimos, lo que tendrá un efecto beneficioso en tu productividad. Al mismo tiempo, todavía no es posible considerar la entrada de voz como una alternativa 100% a la escritura con el teclado; definitivamente será necesario realizar ajustes, pero para muchos usuarios esta oportunidad facilita las tareas cotidianas;

Hubo un tiempo en que tenía que escribir hasta 50 mil caracteres de texto por día. Por supuesto, esto no pudo evitar provocar una búsqueda de motores de software especiales para ingresar texto por voz.

Hace apenas un par de años esto era prácticamente imposible, ya que todos estos programas funcionaban en Occidente y, en consecuencia, estaban adaptados al idioma inglés.

En este momento la situación ha cambiado para mejor. Ahora cualquier redactor puede simplificar significativamente sus tareas diarias.

Naturalmente, no todo es tan sencillo. Para ser honesto, yo mismo utilicé un poco el servicio descrito, pero luego decidí abandonarlo, ya que este desarrollo me pareció un poco tosco. Aunque, de nuevo, si lo comparamos con lo que pasó, por ejemplo, en 2012, ¡es simplemente un milagro!

Servicio de escritura por voz

Entonces, estamos hablando del servicio Speechpad.ru. Cuando acceda a este sitio, verá una ventana en la parte inferior similar a un bloc de notas estándar. En este caso, se trata de un bloc de notas de voz. El texto ingresado por voz se mostrará aquí.

Antes de comenzar a probar el motor de voz, debe asegurarse de que su micrófono esté conectado correctamente a la computadora. Si no hay problemas con esto, puede presionar el botón "Habilitar grabación":

El campo No. 1 muestra el texto que dijiste en los últimos segundos. Mientras su oración está allí, el motor de voz la procesa y reconoce las palabras.

Luego, todo lo dictado se transfiere al segundo campo, donde ya se puede editar utilizando medios estándar: teclado y mouse.

Amigos, como dije anteriormente, el servicio no es una tableta de entrada de teclado en absoluto. En principio, ¡esto no es de extrañar! De hecho, si aparece un motor que reconoce perfectamente las voces, la demanda de redactores y tipógrafos disminuirá considerablemente y, en general, causará una auténtica sensación en el marketing de Internet.

Al menos eso es lo que pienso. Pero volvamos a nuestra libreta de voz y a los consejos prometidos.

  1. Tómate tu tiempo y pronuncia cada palabra con claridad (¡MUY claramente!).
  2. Si ve que la oración en el primer campo está un poco atascada, no se apresure a dictar texto adicional desde arriba, ya que hay ocasiones en las que el programa simplemente se corta. Tienes que volver a encender la grabación y volver a leer la frase dañada.
  3. Ajuste el micrófono para que no registre su respiración, ya que esto afectará negativamente la grabación y el reconocimiento de texto.
  4. Edite el texto con bolígrafos directamente en el segundo campo, inmediatamente después de escribir con éxito una oración. No es necesario apagar la grabación, pero asegúrese de que una pausa demasiado larga no interrumpa automáticamente la grabación. Intenté leer el artículo completo (por supuesto, no se reconoció todo y hubo bastantes errores) y luego inmediatamente edité todo en Word. La práctica ha demostrado que este método no es eficaz. Es mejor hacer esto sobre la marcha.

No debería haber ningún problema con los signos de puntuación. Para agregar una coma, diga lenta y mesuradamente "COMA", "PUNTO" o "Signo de exclamación" en el lugar correcto. En este sentido todo funciona bien y no tuve que cambiar casi nada manualmente.

Opciones adicionales de entrada de voz

Además de las funciones estándar del servicio online, puedes instalar una extensión adicional en Chrome para poder utilizar comandos de voz en cualquier campo.

Además, el desarrollador logró crear un módulo de integración para el sistema operativo Windows. Con su ayuda, puedes controlar varios programas y funciones de Windows sólo con tu voz.

Puedes descargar tanto la primera como la segunda aplicación en la misma web en este párrafo:

No proporciono instrucciones detalladas en esta dirección, ya que personalmente no estoy interesado en esto y todo se describe en detalle en el sitio web. Quienes lo necesiten podrán instalarlo todo ellos mismos.

Si le gusta el servicio, puede registrarse y personalizar muchas cosas en el sitio usted mismo.




Arriba