La realidad aumentada (RA) y la inteligencia artificial (IA) son dos tecnologías en constante evolución que tienen el potencial de transformar la forma en que interactuamos con el entorno que nos rodea. Cuando se combinan, estas tecnologías pueden crear experiencias inmersivas e interactivas que difuminan la línea entre el entorno físico y el virtual.

¿Qué es la Inteligencia Artificial Aumentada?
La inteligencia artificial aumentada se refiere al uso de algoritmos de aprendizaje automático para generar contenido nuevo y único, como imágenes, videos o incluso texto. Por otro lado, la realidad aumentada implica superponer objetos virtuales en el entorno real, creando una realidad aumentada que se puede experimentar a través de un teléfono inteligente u otro dispositivo habilitado para RA.
Cuando se combinan estas dos tecnologías, las posibilidades son infinitas. Aquí hay algunos ejemplos de cómo la IA generativa y la RA pueden usarse juntas, especialmente con gafas de RA:
- Probador virtual: Las gafas de RA podrían usarse para superponer ropa virtual en el cuerpo de una persona, permitiéndoles probarse ropa sin tener que cambiarse físicamente. La IA generativa podría usarse para crear un modelo 3D único del cuerpo de la persona, que luego se podría utilizar para crear una representación virtual realista.
- Publicidad interactiva: Las gafas de RA podrían usarse para mostrar contenido publicitario virtual en el entorno real. La IA generativa podría usarse para crear contenido publicitario único y atractivo que responda al entorno y las acciones del usuario.
- Tutorial turística personalizada: Las gafas de RA podrían usarse para proporcionar un recorrido personalizado por un museo u otra atracción. La IA generativa podría usarse para crear una tutorial virtual que responda a los intereses y preferencias del usuario, proporcionando una experiencia única y adaptada.
- Juegos inmersivos: Las gafas de RA podrían usarse para crear una experiencia de juego inmersiva que combine el entorno real y el virtual. La IA generativa podría usarse para crear entornos y personajes de juego únicos que respondan a las acciones y movimientos del usuario.
- Educación mejorada: Las gafas de RA podrían usarse para proporcionar una experiencia educativa mejorada. La IA generativa podría usarse para crear modelos y simulaciones virtuales que permitan a los estudiantes interactuar con conceptos complejos de una manera más atractiva e interactiva.
En general, la combinación de IA generativa y RA tiene el potencial de revolucionar la forma en que interactuamos con el entorno que nos rodea. A medida que las gafas de RA se vuelven más comunes, podemos esperar ver cada vez más usos innovadores de esta tecnología, especialmente cuando se trata de crear experiencias inmersivas e interactivas.
Cómo combinar IA y RA
La realidad aumentada y la inteligencia artificial son tecnologías distintas, pero se pueden utilizar juntas para crear experiencias únicas.
En la realidad aumentada, se debe construir una representación 3D del entorno para permitir que los objetos digitales existan junto a los físicos. Se utiliza datos visuales junto con un acelerómetro y giroscopios para crear un mapa del entorno y rastrear el movimiento dentro de él. La mayoría de estas tareas se realizan utilizando técnicas tradicionales de visión por computadora que no utilizan el aprendizaje automático.

Por otro lado, los modelos de IA han mejorado increíblemente en la realización de muchas de las tareas necesarias para construir experiencias de RA inmersivas. Las redes neuronales profundas pueden detectar planos verticales y horizontales, estimar la profundidad y segmentar imágenes para lograr una oclusión realista, e incluso inferir posiciones 3D de objetos en tiempo real. Debido a estas habilidades, los modelos de IA están reemplazando algunos de los enfoques de visión por computadora más tradicionales que sustentan las experiencias de RA.
Los modelos de IA también se están utilizando en conjunto con la RA. Los mismos modelos de segmentación que realizan la oclusión de personas también pueden crear efectos como el bloqueador de personas infame de la serie black mirror. Se pueden intercambiar caras en tiempo real, cambiando la edad o el género de una persona. Cuando se hace correctamente, la IA y la RA funcionan perfectamente juntas para crear experiencias móviles inmersivas.

¿Dónde termina la IA y comienza la RA?
Debido a que la IA se puede utilizar por encima y por debajo de las escenas de RA, puede ser difícil saber qué herramientas proporcionan qué funcionalidad. Al construir una aplicación móvil, deberás alternar entre diversas API para crear la experiencia que deseas.
Veamos algunas de las herramientas de desarrollo más populares y cuándo aplicar cada una:
- ARKit y ARCore: ARKit y ARCore son los SDK de realidad aumentada canónicos en iOS y Android, respectivamente. Aunque difieren ligeramente en sus API, realizan las mismas funciones básicas. Combinan datos de los sensores de un dispositivo para construir el entorno 3D, rastrear el movimiento, renderizar objetos digitales y mediar las interacciones entre el contenido digital y físico. Los utilizarás principalmente para colocar y manipular objetos dentro de las escenas. Aunque pueden hacer uso de la IA, esos modelos generalmente se abstraen de los usuarios, quienes tienen acceso a salidas de alto nivel (por ejemplo, máscaras de oclusión para personas).
- Core ML y TensorFlow Lite: Core ML y TensorFlow Lite son los frameworks de IA en dispositivos móviles. Se utilizan para ejecutar modelos independientes de la realidad aumentada. Estas API proporcionan un control de bajo nivel de los datos de entrada y salida a los modelos y permiten a los desarrolladores insertar sus propios modelos personalizados, que están entrenados para realizar tareas específicas relevantes para sus aplicaciones.
La forma más común en que los desarrolladores combinan los modelos de IA y RA es tomando imágenes o audio de una escena, pasando esos datos a un modelo y utilizando la salida del modelo para activar efectos dentro de la escena. Aquí hay algunos ejemplos:
- Etiquetado de imágenes o escenas: Se ejecuta un modelo de IA en un fotograma de la cámara que clasifica una imagen. La clasificación activa una etiqueta de RA para esa ubicación.
- Detección de objetos: Se pasa un fotograma de la cámara a un modelo de IA que estima la posición y el tamaño de los objetos dentro de una escena. La información de ubicación se utiliza luego para formar cajas de colisión que facilitan las interacciones entre objetos físicos y digitales.
- Segmentación semántica y oclusión: Si bien ARKit puede proporcionar capacidades genéricas de oclusión de personas, se puede utilizar un modelo de IA personalizado para segmentar y ocultar automóviles u otros objetos.
- Estimación de postura: Un modelo de IA infiere la posición de objetos como manos y dedos, que se utilizan para controlar el contenido de RA.
- Reconocimiento y traducción de texto: Un modelo de IA detecta, lee y traduce texto en una imagen. Luego, se utilizan las API de realidad aumentada para superponer el texto traducido en el entorno 3D.
- Reconocimiento de audio: Los modelos de IA escuchan palabras específicas que activan efectos de RA. Por ejemplo, un usuario dice la palabra reina y aparece una corona virtual en su cabeza.
La realidad aumentada y la inteligencia artificial son tecnologías separadas pero complementarias. Los modelos de IA más pequeños, rápidos y precisos serán los motores de la funcionalidad de RA, dada su capacidad para rastrear y comprender el entorno 3D. También continuarán mejorando las experiencias de RA, agregando efectos e interactividad a las escenas de RA.
A medida que la IA y la RA sigan evolucionando, veremos avances aún más emocionantes en la forma en que interactuamos con la tecnología y el entorno que nos rodea. La combinación de IA y RA tiene el potencial de revolucionar industrias como la publicidad, el entretenimiento, la educación y más. Estamos presenciando el comienzo de una nueva era de experiencias digitales inmersivas y personalizadas.
Si quieres conocer otras notas parecidas a Realidad aumentada e inteligencia artificial: fusión futuro puedes visitar la categoría Tecnología.
