Descarga el programa de inteligencia artificial a tu computadora. El programa de inteligencia artificial sorprende por sus capacidades. Robin: asistente de voz con IA

Cuando salió en 2011 nuevo modelo iPhone, muchos quedaron asombrados función inusual llamó Siri. Sería más exacto decirlo con el nombre de Siri, porque el programa de inteligencia artificial estaba dotado de una personalidad femenina. El "asistente inteligente" entendía la voz humana y ejecutaba órdenes, por ejemplo, "Siri, marca el número de tu esposa" o "Siri, pon la alarma a las 6:30". Podía responder algunas preguntas de manera extraordinaria como “Siri, ¿existe Dios?” Para aquella época esto era bastante inusual. Sin embargo, las limitaciones de la tecnología pronto quedaron claras. Siri realizó solo el máximo comandos simples, pero por lo demás era sólo una “extensión” de voz al motor de búsqueda de Internet, dirigiendo la solicitud allí.

Tras la muerte de Steve Jobs, los desarrolladores de Siri se organizaron nueva empresa Viv Labs, que está trabajando en una versión mucho más avanzada de " asistente inteligente" llamado Viv.

EN programa viv Implementar un sistema de autoaprendizaje y generación de código de programa sobre la marcha. El resultado debería ser un tipo de IA completamente nuevo. Respondiendo con servidor central A las preguntas de millones de usuarios, se formará gradualmente una especie de "cerebro global" que comprenderá cualquier área temática y jerga, conectará cualquier concepto y revelará el significado de cualquier pregunta. Y, naturalmente, responderá de la manera más adecuada.

Viv funciona así. Después de recibir una solicitud como "De camino a casa con mi hermano, quiero comprar un vino barato adecuado para lasaña", lo analiza en partes y lo compila. programa unico que utiliza diferentes fuentes información de Internet, incluido un mapa de la zona, una base de datos de tiendas, una guía culinaria y una base de datos de precios de vinos. Todo se hace muy rápido y en 0,05 segundos Viv le proporciona una lista de tiendas de vinos adecuadas en el camino hacia su hermano y los nombres de los vinos deseados.

En el diagrama se muestra un análisis más detallado de esta solicitud.

Los principios fundamentales que guían a los desarrolladores: Viv debe entrenarse por sí solo, respondiendo las preguntas de los usuarios y debe hacerlo continuamente, volviéndose más inteligente cada día. Cómo mas gente comunicarse con " asistente digital" - cuanto más rápido crece su base de conocimientos. Por lo tanto, los desarrolladores no quieren ceder el motor a ninguna empresa, sino otorgar licencias a todos, de modo que se pueda acceder a la IA desde todos los televisores y teléfonos móviles.

La tarea de analizar y comprender adecuadamente el lenguaje humano es, por supuesto, difícil. Pero no sólo Viv Labs está trabajando en su solución. Por ejemplo, recientemente empresa google pf compró DeepMind, una empresa que trabaja aproximadamente en la misma área, por 500 millones de dólares. También hay una supercomputadora. IBMWatson y otros proyectos similares. En general, la Inteligencia Artificial con autoaprendizaje constante puede estar más cerca de lo que pensamos.

La inteligencia artificial creada mediante programas informáticos ha sido encontrada por todos los usuarios en juegos de computadora. Por ejemplo, cuando se juega al ajedrez, una computadora analiza las combinaciones del jugador y utiliza su propio algoritmo para realizar su siguiente movimiento. En los juegos, todos los oponentes del usuario están dotados de inteligencia artificial. Hoy en día, la tecnología informática permite comunicarse con programas que utilizan inteligencia artificial. Y la propia inteligencia del software es capaz de desarrollar y mejorar sus funciones en la práctica. En una palabra, hoy los programas son capaces de evolucionar.

Un programa sencillo con inteligencia artificial.

Empecemos desde muy ejemplo sencillo. ChatMaster es un programa de inteligencia artificial que puede hablar con una persona mediante el chat. característica principal A primera vista, un programa sencillo: el autoaprendizaje. Cuanto más interactúas con el programa, más crece vocabulario y la capacidad de adaptarse a su interlocutor a la hora de mantener un diálogo. El autor del programa afirma que logró crear un modelo de software del pensamiento humano.

Cuando empiece a trabajar, el programa puede parecer "débil". Pero la razón es que después del primer lanzamiento no se debe probar inmediatamente su nivel de inteligencia e inteligencia. En un principio, hay que tratar al programa como a un niño de 12 años, que en unas horas se comunicará al nivel de su interlocutor. Para ello, el vocabulario del programa debe crecer de 3.000 a 10.000 palabras. Después de lo cual la impresión de trabajar con el programa supera todas las expectativas.

A simple vista se nota que el programa recuerda no sólo las palabras sino también la reacción lingüística del interlocutor ante las frases planteadas. Si lo desea, puede ajustar las respuestas del programa a sus opciones mediante el aprendizaje forzado. En el mismo modo, puede prohibir recordar frases individuales ingresadas con errores tipográficos. Si lo desea, puede exportar las bases de datos e intercambiarlas con amigos para un aprendizaje más rápido (al importar/exportar activamente, no olvide hacer copias de seguridad). En general, la lógica del programa, aunque única, también está muy desarrollada.

Solución de software de inteligencia artificial mejorada.

muy interesante solución de software en el campo de la inteligencia artificial fue propuesto por los desarrolladores de A.L.I.C.E. Conocen bien la inteligencia artificial y están desarrollando activamente programas en esta área. Para conocer sus desarrollos, se creó una aplicación en línea para comunicarse con el Capitán Kirk en tiempo real. El principio de aplicación es similar. programa anterior, pero hay una característica interesante. El programa responde en voz alta a todas las preguntas escritas. Desventaja significativa El programa es la oportunidad de comunicarse exclusivamente en Inglés. Aplicación similar No pude encontrar uno para comunicarme en ruso y es una pena que los programadores no hayan utilizado esa función. Después de todo, existen muchos programas de síntesis de voz que convierten texto en audio utilizando la tecnología SAPI5. Es una pena que los programadores no desearan crear un programa alternativo compatible con el idioma ruso. Después de todo, de hecho, este sigue siendo un nicho gratuito.

La comunicación con un programa a través de un micrófono se clasifica como inteligencia artificial.

El programa para comunicarse con una computadora en ruso se llama Grisha the Parrot. Lo más probable es que este programa implemente un prototipo de inteligencia artificial. Pero la idea es muy original. La cuestión es que el principal característica distintiva Grisha Parrot puede comunicarse a través de un micrófono y parlantes (sin usar un teclado).

El programa tiene un módulo de reconocimiento de voz independiente del hablante. Es el análisis de la entrada. canal de audio clasifica este programa como inteligencia artificial. Pero, lamentablemente, sólo es capaz de reconocer algunas preguntas (sólo 46 frases dadas en la ayuda). Cuando comienza el programa, el loro duerme. Tan pronto como hablas por el micrófono, este se activa para comenzar el diálogo. El sistema de software de reconocimiento de voz no utiliza funciones de información, y comunicativo:

  • apelativo;
  • emotivo;
  • método de prevalencia.

El diccionario de diálogo categórico se basa en primitivas semánticas. El método de reconocimiento de voz no se realiza a partir del contenido lingüístico, sino determinando la función del enunciado. Así, durante el reconocimiento de voz del habla del usuario, se determinan el acto de habla, el escenario de comunicación y el diálogo en sí. Por tanto, a la hora de comunicarse con un programa, lo importante no es el uso de palabras, sino el acto comunicativo. Durante el reconocimiento, se seleccionan escenas aleatorias. Si señal de entrada Ausente durante algún tiempo, el propio loro provoca el diálogo en el usuario. El escenario de comportamiento del loro se puede controlar mediante frases e incluso se puede cambiar su carácter a: triste, susceptible, alegre.

Para tecnologías móviles Desarrollar e implementar más activamente programas con inteligencia artificial. Puedes verificar esto con vídeo corto descripción general del programa:

Durante otro intento Para implementar ideas de películas de ciencia ficción, los gigantes tecnológicos, uno tras otro, comenzaron a trabajar en asistentes virtuales. En la conferencia Google I/O 2016 la empresa presentado Asistente de Google, así como un análogo de Amazon Echo - hogar asistente de voz Inicio de Google.

último de grandes empresas entra en la carrera de los asistentes virtuales. Averigüemos qué competidores tiene (incluso entre las nuevas empresas).

Primero, recordemos qué es. Google ahora.

Búsqueda por voz de Google/Google Now

Peculiaridades: Rápido. Extremadamente preciso al crear rutas. Te asusta con su conocimiento de tus vuelos, reservas y otros detalles. con algunos aplicaciones de terceros: administre notas, mensajes y reproducción de música.

Defectos: A veces te aburres del exceso de iniciativa (por ejemplo, muestra los resultados de partidos de equipos que no te interesan, o rutas a casa desde lugares famosos). Inútil a la hora de gestionar " hogar inteligente" El trabajo de integración con aplicaciones de terceros parece haberse estancado.

Nivel de humanidad: Nulo. No propicio para la comunicación. Ni siquiera tiene otro nombre que Google.

Reanudar: Grandes reservas de datos personales y acceso a motor de búsqueda, en teoría, debería haber convertido a Google en un líder de la industria, pero la compañía ni siquiera ha podido descubrir cómo aprovechar sus fortalezas y crear un asistente que pueda comprender al usuario. Hoy Google Now y búsqueda por voz Compiten en igualdad de condiciones con Siri, pero aún no han alcanzado un nuevo nivel de desarrollo.

Y ahora, sobre los competidores.

Manzana Siri

Qué: Un asistente de voz que puede hablar con el usuario y dar recomendaciones proactivas. Se activa presionando prolongadamente el botón Inicio en el iPad. El soporte del asistente apareció recientemente en Apple TV y Apple Watch.

Peculiaridades: Fácil de usar en dispositivos iOS. Entiende el habla natural. Conocedor de noticias, clima, deportes, películas, rutas y negocios locales. Puedo decirte qué mirar en la televisión. Capaz de interactuar con algunos elementos de una “casa inteligente”.

Defectos: No se puede interactuar con la mayoría de las otras aplicaciones y servicios. Funciona más lento que algunos competidores.

Nivel de humanidad: No es capaz de mantener una conversación completa, pero en determinados momentos demuestra su propia sabiduría. La voz femenina suena relativamente humana.

Defectos: Se siente muy bien en Windows, la plataforma que menos interesa a los desarrolladores y, posiblemente, a los usuarios. Usar el asistente en Android e iOS es más difícil y tiene menos funciones.

Nivel de humanidad: Le encantan los chistes, especialmente los banales. Tiene lista una larga lista de respuestas ingeniosas. preguntas generales. Puede leer pasajes de Shakespeare.

Reanudar: Después de años de estar a la sombra de Siri y GoogleCortana se ha convertido en un chatbot mucho más interesante. Microsoft quiere hacer el suyo propio asistente de voz Inteligencia básica para todos los demás bots, capaz de gestionar sus viajes, reuniones, listas de tareas pendientes y otras cosas, además de aumentar el grado de integración con otros. productos microsoft, por ejemplo, con Office. La empresa tiene como objetivo crear nuevo caparazón Para tecnologías informáticas Era post-PC, pero es demasiado pronto para juzgar si tendrá éxito o no.

facebookm

Qué: En parte gestionado, en parte por personas y aún en desarrollo. M será el asistente con control de texto en el entorno de Facebook Messenger.

Peculiaridades: Intentaré hacer todo lo que me pidas.

Defectos: Aún no es un producto terminado y no lo será en mucho tiempo. Disponible solo para una pequeña cantidad de usuarios en San Francisco.

Nivel de humanidad: Extremadamente alto, ya que las personas participarán en la formulación de las respuestas a las preguntas. Según Wired, la empresa espera que con el tiempo M aprenda de estos operadores y pueda trabajar de forma más independiente.

Reanudar: En en este momento M es sólo un poco más que una simple idea. Pero dado el interés de Facebook en los chatbots en general, no sería sorprendente que M termine siendo súper inteligente.

X.ai

Qué: Uno de los pocos asistentes virtuales que tiene una sola función. Funciona únicamente a través de correo electrónico, donde puede concertar citas cuando usted lo solicite.

Peculiaridades: Conoce su horario y preferencias, negocia con otros participantes por usted.

Peculiaridades: Viv promete que su producto podrá comprender preguntas complejas como: "¿La temperatura cerca del puente Golden Gate estará por encima de los 20 grados pasado mañana después de las 5 de la tarde?" Se está trabajando para garantizar la compatibilidad con aplicaciones de terceros.

Defectos: Hasta el momento, aparte de las presentaciones preparadas, no hay pruebas de que todo funcione exactamente como se indica.

Nivel de humanidad: Ayudas visuales y valora las respuestas específicas más que descripción detallada. La presencia de ingenio es cuestionable.

Defectos: Las opciones de integración con aplicaciones de terceros son limitadas y es imposible abrir el servicio directamente en iOS o Android. Las solicitudes que el asistente no puede reconocer se redirigen a Ask.com.

Nivel de humanidad: No es propicio para conversaciones largas, pero sabe responder. preguntas adicionales.

Reanudar: parece que aplicaciones moviles En realidad, Hound existe sólo para mostrar las capacidades del servicio Houndify (agregando funcionalidad de asistente de voz a cualquier aplicación, nota del editor), que SoundHound planea vender a otras compañías. Si todo sale bien, ni siquiera sabremos que lo estamos usando.

Özlo

Qué: AI, función principal que actualmente es una búsqueda de cafeterías, bares y restaurantes. Disponible para un número limitado de usuarios.

Peculiaridades: Encuentra y combina datos de múltiples fuentes, incluidos Yelp y Foursquare, y luego presenta todo en forma de convenientes tarjetas. Intenta comunicarse haciendo y respondiendo preguntas de seguimiento, como "¿qué lugares están abiertos ahora?" o "¿qué hay en su menú?"

Defectos: Funciones limitadas, a menos que los creadores de Ozlo agreguen nuevas funciones. La IA depende en gran medida de que los usuarios se capaciten.

Nivel de humanidad: Evita bromas innecesarias, sólo saluda brevemente por su nombre.

Reanudar: Ozlo no sería diferente de muchos otros chatbots si no tuviera la posibilidad de crear algo más. La capacidad de combinar datos de múltiples fuentes en un solo resultado es única, pero aún está por verse si los desarrolladores podrán aprovechar todo el potencial que afirman. Mientras tanto, el plan de negocios de Ozlo se limita solo a la aplicación y puede haber problemas para recopilar los datos necesarios para la capacitación.

Asistente SpeakToIt.ai

Qué: Una de las muchas copias de Siri. En la tienda de aplicaciones, al buscar Siri aparecen muchas programas similares, A ejemplo de voz Comandos, Voz Secretaria y Asistente.

Peculiaridades: No es muy diferente de Siri, pero puede aprender. comandos personalizados para activar la lista de funciones.

Defectos: No es tan útil como el asistente integrado en su teléfono inteligente ni tan conveniente.

Nivel de humanidad: Suena bastante antinatural, pero se presenta a sí mismo como un asistente humano cuyo género y apariencia se puede cambiar.

Reanudar: Algunos de estos clones de Siri parecen una reliquia del pasado, cuando no todos modelos de iPhone podía funcionar con el asistente propietario de Apple y necesitaba un reemplazo. En cualquier caso, parece que sus creadores son conscientes de que este enfoque no logrará el éxito. Por ejemplo, SpeakToIt decidió crear un conjunto de herramientas que otros desarrolladores podrían utilizar para crear sus propios chatbots.




Arriba