¿Cómo elimina la inteligencia artificial las barreras idiomáticas?


¿Cómo elimina la inteligencia artificial las barreras idiomáticas?

La IA borrará todas las barreras idiomáticas dentro de unos pocos años a medida que mejoren las tecnologías de reconocimiento de voz. Es probable que esto se lleve a cabo mediante un conjunto de dispositivos que nos permitan hablar con fluidez a una persona que de otra manera no entendería nuestro idioma.

En esencia, esto quiere decir que podremos hablar al ordenador en cualquier idioma y él respondernos de igual manera.
Aprender a hablar varios idiomas es una tarea para la cual la inteligencia artificial se adapta perfectamente ya que requiere de un gran conjunto de datos de aprendizaje (diferentes lenguas en este caso).

Las siguientes son algunas de las diferentes tecnologías de IA relacionadas con la voz:
  • Reconocimiento de voz (o texto a voz): identifica las palabras que decimos.
  • Procesamiento del lenguaje natural (PLN): analiza el significado de las palabras.
  • Generación de voz (síntesis del habla): genera un lenguaje con sonido humano.
Como probablemente ya sepas, varios asistentes virtuales, tales como el Asistente de Google, Alexa de Amazon, Siri de Apple o Cortana de Microsoft, ya comprenden la mayoría de lo que le decimos. Aún no son perfectos y pueden cometer errores debido a su vocabulario limitado, pero dentro de unos pocos años, serán capaces de entender todo lo que les digamos, incluso teniendo en cuenta los dialectos.
A continuación podrás ver una demostración rápida de lo bien que el Asistente de Google comprende lo que le dices. Simplemente dirígete a https://www.google.com/intl/en/chrome/demos/speech.html y haz clic en el ícono del micrófono a la derecha, luego selecciona el idioma y comienza a hablar.

Como puedes ver, esta es también una forma ágil de generar mucho contenido nuevo ya que los seres humanos hablamos tres veces más rápido de lo que somos capaces de escribir.

Casi todas las grandes empresas tecnológicas ofrecen este tipo de demos de voz a texto. Por ejemplo, aquí tenemos otra de Microsoft: https://azure.microsoft.com/en-us/services/cognitive-services/speech-to-text/

Por otro lado, Google lanzó recientemente una interesante demo de síntesis de voz la cual permite convertir cualquier texto en voz. Esto se puede hacer con más de 30 voces distintas y en múltiples idiomas.

Si deseas probarla tú mismo, visita la siguiente página. Simplemente escribe el texto que quieras escuchar y haz clic en el botón “Speak It” (“Hablar”): https://cloud.google.com/text-to-speech.


La tecnología subyacente que hace posible la síntesis de voz es el aprendizaje profundo, el cual es un subconjunto de la inteligencia artificial. Si deseas una explicación más detallada del funcionamiento de esta tecnología, visita esta página. (ENLACE?)

Como hemos mencionado anteriormente, en el futuro, existirá un número de dispositivos que nos permitirán tener conversaciones con personas que no conocen nuestro idioma de forma natural. Aunque en la actualidad ya contamos con algún sistema.

Google Pixel Buds es un ejemplo perfecto de dichos dispositivos. Es una marca de audífonos Bluetooth fabricados por Google y se comercializan como aparatos capaces de proporcionar servicios de traducción instantánea para más de 40 idiomas. Actualmente, el servicio de traducción de idiomas impulsado por la IA de Google es uno de los mejores disponibles en el mercado.

Al usar los Pixel Buds, una persona puede presionar el botón del audífono derecho y decir “ayúdame a hablar en italiano”. El izquierdo luego traducirá todo lo que se vaya diciendo. Aunque la primera versión de este producto esté lejos de ser perfecta, con el tiempo, podría convertirse en una herramienta clave tanto profesional como personalmente.

No hay duda de que dentro de unos años este tipo de dispositivos serán muy comunes y podremos hacer un uso de ellos a diario.

Comentarios