Alexa: la evolución de la inteligencia artificial

En los últimos años, hemos hablado mucho sobre cómo estamos viviendo en una era dorada de la inteligencia artificial (IA). Ideas que parecían ciencia ficción hace poco tiempo ahora son una realidad, y no hay mejor ejemplo de esto que Alexa. Lo que comenzó como un boceto en un pizarrón se ha convertido en un paradigma informático completamente nuevo, uno que ha cambiado fundamentalmente la forma en que las personas interactúan con la tecnología en sus hogares en todo el entorno. Con más de quinientos millones de dispositivos vendidos y decenas de millones de interacciones cada hora, Alexa se ha convertido en parte de la familia en millones de hogares. Siempre hemos visto a Alexa como un servicio en constante evolución, y lo hemos estado mejorando continuamente desde el día en que lo presentamos en 201Una misión de larga data ha sido hacer que una conversación con Alexa sea tan natural como hablar con otro ser humano, y con el desarrollo rápido de la IA generativa, lo que imaginamos ahora está al alcance. Hoy, nos complace compartir un vistazo temprano de cómo será el futuro.

Índice
  1. Capacidad de conversación
  2. Utilidad en el entorno real
  3. Personalización y contexto
  4. Personalidad
  5. Confianza

Capacidad de conversación

Hemos estudiado mucho sobre la conversación en los últimos años, y sabemos que ser conversacional va más allá de las palabras. En cualquier conversación, procesamos toneladas de información adicional, como el lenguaje corporal, el conocimiento de la persona con la que estás hablando y el contacto visual. Para permitir eso con Alexa, hemos fusionado la entrada de los sensores en un Echo, como la cámara, la entrada de voz y su capacidad para detectar la presencia, con modelos de IA que pueden entender esas señales no verbales. También nos hemos centrado en reducir la latencia para que las conversaciones fluyan de manera natural, sin pausas, y las respuestas sean de la longitud adecuada para la voz, no el equivalente a escuchar párrafos enteros en voz alta. Cuando preguntas por las últimas noticias de una historia popular, obtienes una respuesta concisa con solo la información más relevante. Si quieres saber más, puedes hacer preguntas de seguimiento.

Utilidad en el entorno real

Para ser realmente útil, Alexa debe ser capaz de tomar acción en el entorno real, lo cual ha sido uno de los desafíos sin resolver con los LLM (Large Language Models): cómo integrar APIs a gran escala e invocarlas de manera confiable para tomar las acciones correctas. Este nuevo LLM de Alexa estará conectado a cientos de miles de dispositivos y servicios del entorno real a través de APIs. También mejora la capacidad de Alexa para procesar matices y ambigüedades, de manera similar a una persona, y tomar acciones de manera inteligente. Por ejemplo, el LLM te brinda la capacidad de programar rutinas complejas completamente por voz. Los clientes solo tienen que decir: alexa, todas las noches de lunes a viernes a las 9 p.m., haz un anuncio de que es hora de dormir para los niños, atenúa las luces de arriba, enciende la luz del porche y enciende el ventilador en el dormitorio. Alexa automáticamente programará esa serie de acciones para que ocurran todas las noches a las 9 p.m.

Personalización y contexto

Un LLM para el hogar debe ser personalizado para ti y tu familia. Al igual que una conversación con otra persona se vería influenciada por el contexto, como tus conversaciones anteriores o el contexto situacional, Alexa también debe hacerlo. La próxima generación de Alexa podrá ofrecer experiencias únicas basadas en las preferencias que has compartido, los servicios con los que has interactuado y la información sobre tu entorno. Alexa también mantiene el contexto relevante a lo largo de las conversaciones, de la misma manera que los humanos lo hacen todo el tiempo. Las personas usamos pronombres, frases hechas y construimos contexto sobre los lugares, tiempos o escenas de los que hablamos. Pregunta a Alexa sobre un museo y podrás hacer preguntas de seguimiento sobre sus horarios, exhibiciones y ubicación sin necesidad de repetir ningún contexto anterior, como el nombre o el día que planeas ir.

Personalidad

Los clientes nos han dicho una y otra vez que les encanta la personalidad de Alexa. No quieren un compañero robótico y aburrido en su hogar, y yo diría que la personalidad de Alexa es una de las principales razones por las que ha sido ampliamente adoptada. Como siempre hemos dicho, la cena más aburrida es aquella en la que nadie tiene una opinión, y con este nuevo LLM, Alexa tendrá un punto de vista, lo que hará que las conversaciones sean más interesantes. Alexa puede decirte qué películas deberían haber ganado un Oscar, celebrar contigo cuando respondes correctamente una pregunta de un quiz, o escribir una nota entusiasta para que la envíes para felicitar a un amigo por su reciente graduación.

Confianza

No debería haber un compromiso entre confiabilidad y rendimiento. Los clientes de todo el entorno han dado la bienvenida a Alexa en sus hogares, y para que sea realmente útil en su vida diaria, debemos seguir creando experiencias que tanto les gusten como les generen confianza. Si bien la integración de la IA generativa trae infinitas posibilidades nuevas, nuestro compromiso de ganarnos la confianza de nuestros clientes no cambiará. Al igual que con todos nuestros productos, diseñaremos experiencias para proteger la privacidad y seguridad de nuestros clientes, y para brindarles control y transparencia.

Hasta donde sabemos, esta es la integración más grande de un LLM, servicios en tiempo real y una suite de dispositivos, y no se limita a una pestaña en un navegador. Y esto es solo el comienzo, con la IA generativa también podemos mejorar varios componentes principales de la experiencia de Alexa.

Uno de estos componentes es cómo los clientes inician una interacción con Alexa. Esto se basará en la experiencia existente hoy en día al permitir que los clientes que elijan inscribirse en Visual ID inicien una conversación con Alexa simplemente mirando la pantalla de un Echo Show, sin necesidad de usar la palabra de activación. El resultado es la experiencia de conversación más natural que hemos creado hasta ahora. Además, hemos creado un nuevo motor de reconocimiento de voz conversacional (CSR) utilizando modelos grandes. Como humanos, a menudo hacemos pausas durante una conversación para pensar o enfatizar un punto, y identificar esas señales es increíblemente difícil para una IA. Este nuevo motor CSR es capaz de adaptarse a esas pausas y dudas naturales, lo que permite una conversación más fluida y natural. Por último, la IA generativa nos ha permitido mejorar nuestra tecnología de texto a voz, utilizando un modelo transformador grande para hacer que Alexa sea mucho más expresiva y atenta a las señales de la conversación.

Esto significa que Alexa se adaptará a tus señales y modulará su respuesta y tono de acuerdo con las conversaciones humanas. Si le preguntas a Alexa si tu equipo ganó, responderá con voz alegre si es así; si perdieron, la respuesta será más empática. Si le pides a Alexa una opinión, la respuesta será más entusiasta, como si un amigo estuviera compartiendo un punto de vista.

Para demostrar lo lejos que hemos llegado, aquí tienes un recordatorio de cómo sonaba Alexa cuando la lanzamos por primera vez:

alexa usa inteligencia artificial - Qué IA utiliza Amazon

Y aquí tienes cómo sonará Alexa a principios del próximo año:

Estas mejoras llevarán a Alexa, que ya es la mejor IA personal del entorno, a un nivel aún mejor. He estado usando estas nuevas capacidades durante los últimos meses, y se siente tan transformador como la primera vez que experimenté hablar con Alexa hace una década aproximadamente. Esto no significa que será perfecta, Alexa cometerá errores, pero, como siempre ha sucedido, la experiencia seguirá mejorando con el tiempo.

Estamos al comienzo de un viaje, una base que creemos nos llevará a una nueva versión de Alexa impulsada por la IA generativa. Continuaremos desarrollando y agregando más capacidades como parte de una vista previa gratuita que estará disponible pronto para los clientes de Alexa en Estados Unidos. Sabemos que los clientes tendrán muchos comentarios, y estamos ansiosos por escucharlos.

Mantente atento a más novedades. Mientras tanto, aquí tienes un vistazo temprano a las nuevas capacidades de Alexa.

Si quieres conocer otras notas parecidas a Alexa: la evolución de la inteligencia artificial puedes visitar la categoría Inteligencia artificial.

Subir