En la era en la que las máquinas conversan como humanos y los algoritmos tienen poder, el surgimiento de los Modelos de Lenguaje Grandes (LLMs, por sus siglas en inglés) nos invita a reflexionar sobre los límites de la inteligencia artificial.
Muchas voces prominentes en el ámbito de la IA piden, en una carta abierta, que los desarrolladores y empresas como OpenAI detengan el entrenamiento de sistemas de IA más potentes que GPT-Estamos en un punto en el que necesitamos comprender cómo funcionan las redes neuronales que componen los LLMs. Sabemos que tienen algo que ver con probabilidades, pero las complejidades de los LLMs con 4 billones de parámetros van mucho más allá de la comprensión humana.
Si sabemos que los LLMs son, en su esencia, máquinas de probabilidad simples, ¿debemos preocuparnos por la formación de una conciencia?
¿Es justificada la petición de la carta abierta de detener el entrenamiento de LLMs más allá de GPT-4?
GPT-4 y más allá: ¿Qué significa?
Los Modelos de Lenguaje Grandes son máquinas de probabilidad vastas y complejas. Cuando un usuario ingresa una frase, la frase y cada palabra se tokenizan, prediciendo respuestas basadas en los patrones que han aprendido.
Antes de deslumbrarnos con su destreza lingüística, los LLMs pasan por dos fases de entrenamiento: una etapa de pre-entrenamiento, en la que absorben textos masivos y comprenden patrones lingüísticos, seguida de un ajuste fino, en el que se adaptan a tareas específicas.
Los LLMs no leen frases de la misma manera que los humanos. Cada palabra dentro de la frase que ven se vectoriza. Esto significa que una palabra como gato se convierte en un vector (dependiendo del modelo, la longitud del vector varía), por ejemplo, de longitud 300.
Este es un ejemplo de la vectorización de la palabra gato. Puedes encontrar la vectorización completa aquí.
[0.007398007903248072, 0.0029612560756504536, -0.010482859797775745, 0.0741681158542633, 0.07646718621253967, -0.0011427050922065973, 0.026497453451156616, 0.010595359839498997, ...]
Podemos entender fácilmente un gráfico tridimensional con los ejes x, y y z. Los vectores de palabras añaden muchas más dimensiones. En este caso, 300 dimensiones adicionales. Esto es difícil de entender para los humanos, pero este nivel de dimensionalidad es una tarea trivial para las computadoras.
Luego, los vectores de palabras se insertan en la red neuronal entrenada del LLM. Para comprender la frase o proporcionar la probabilidad correcta de una respuesta, cada capa en la red neuronal ajusta la ponderación del vector de palabras para crear una respuesta con la mayor probabilidad de ser la respuesta adecuada para la frase insertada.
Imagina que cada punto azul son válvulas que ajustan el flujo de agua para dirigirlo hacia el grifo de salida correcto. Cuando el agua entra en el sistema, los Oompa Loompas corren ajustando miles de válvulas de un lado a otro para controlar el agua.
La analogía se desmorona rápidamente cuando pensamos en la inmensidad de los parámetros requeridos y el número de válvulas, pero nos ayuda a comprender lo básico.
No sabemos cómo todas estas capas interactúan entre sí. Los LLMs se han vuelto tan grandes, con tantas capas ocultas y tantos tokens, que ya no somos capaces de seguir cómo GPT-4 llega a la respuesta a nuestra solicitud de entrada.
En la siguiente parte, quiero discutir el significado de la inteligencia, por qué la Inteligencia Artificial debería llamarse Intelecto Artificial y por qué eso podría suponer un riesgo importante para los humanos.
Intelecto vs. Inteligencia
Intelecto e inteligencia suenan similares, pero hay diferencias sutiles que debemos discutir.
El intelecto es la capacidad de pensar profundamente, analizar ideas complejas y participar en el razonamiento abstracto. El intelecto implica aplicar ideas y pensamientos existentes a temas abstractos, analizarlos y evaluarlos. El intelecto es el pensamiento que funciona independientemente de la emoción. El pensamiento científico o filosófico a menudo se incluye dentro del ámbito del pensamiento intelectual.
La inteligencia es una categorización más amplia de la capacidad mental general o la capacidad de comprender, aprender, razonar y resolver problemas. La inteligencia abarca el pensamiento emocional e intelectual con igual peso. Actúan de manera intensa y armoniosa.
Hay muchas situaciones en las que uno está satisfecho intelectualmente con el razonamiento detrás de las decisiones, pero para comprenderlas plenamente, debe haber unidad de intelecto y emoción.
Necesitamos unidad de intelecto y emoción.
Es fácil para los ingenieros y las empresas debatir los beneficios de la Inteligencia Artificial cuando el debate se encuentra en un nivel intelectual. El intelecto responderá preguntas sobre el ahorro de tiempo que los modelos de lenguaje generan y las ganancias que generarán.
El intelecto nos ahorrará tiempo, aumentará las ganancias y hará que los procesos sean más eficientes. Pero el intelecto tiene sus limitaciones, ya que es el resultado de nuestra condicionamiento. El condicionamiento que hemos aprendido de los libros, nuestros maestros, padres o sociedad.
El intelecto es comprender por qué tenemos fronteras, sistemas monetarios o incluso guerras. La inteligencia significa que entendemos que todos estamos juntos en este entorno, que estamos unidos y no separados unos de otros. Que las fronteras, los estados y las ciudades son construcciones artificiales. La inteligencia significa que somos seres humanos que vivimos en nuestra tierra y que estamos haciendo algo con ella.
El problema con la IA: solo es intelecto
Lo que estamos enseñando a los Modelos de Lenguaje Grandes es intelecto: la capacidad de razonar basada en nuestro condicionamiento. No podemos enseñarle al modelo el estado emocional, ese profundo sentimiento de vida que no puede capturarse en ramificaciones y discusiones intelectuales.
Debajo de las respuestas elocuentes yace un peligro latente: la perpetuación de los sesgos sociales, ya que los LLMs repiten inconscientemente los prejuicios enterrados dentro de sus datos de entrenamiento.
Estamos entrenando estos modelos a un nivel puramente intelectual, lo cual es el peligro al que nos enfrentamos. Permanecen ciegos a la sinfonía de la inteligencia emocional, privándolos de la capacidad humana de comprender más allá de los hechos.
En primer lugar, debemos comprender completamente cómo actúan los modelos por debajo de la superficie. ¿Cómo llegan a conclusiones basadas en la entrada que proporcionamos todas estas trillones de circuitos que calculan probabilidades?
En segundo lugar, ni siquiera somos lo suficientemente conscientes de nosotros mismos como para disfrutar plenamente de la capacidad total de nuestros cerebros. Estamos atrapados en el miedo, las justificaciones, la crueldad y la esperanza de que una nueva forma de inteligencia artificial nos permita trascender nuestro estado externalizando el pensamiento.
En tercer lugar, los modelos de lenguaje grandes no aprenden. Recopilan conocimiento en su memoria y responden en base a complejas probabilidades a nuestras preguntas.
Aprender es un proceso activo. Ocurre en el momento en que nos enfrentamos a algo nuevo. Una vez que la situación ha pasado, se convierte en un recuerdo, es decir, conocimiento. Tenemos la habilidad significativa de aprender activamente en el presente, de comprender el todo.
Cuando nos cargamos con el pasado, ya estamos condicionados e interpretamos el presente en base al conocimiento que hemos adquirido. Actualmente, los modelos de lenguaje grandes no pueden aprender como nosotros, de manera activa en el presente y sin estar cargados de condicionamientos.
Los Modelos de Lenguaje Grandes son una nueva herramienta disponible para nosotros. Estamos en proceso de comprender sus capacidades y cómo utilizarlos en nuestro flujo de trabajo diario. Muchos aspectos del trabajo se han beneficiado de ellos, como:
- Codificación: los LLMs ayudan a los usuarios a traducir el lenguaje natural en código aplicable.
- Marketing: los LLMs nos permiten automatizar la creación de contenido y escribir contenido más específico para un grupo objetivo.
- Aprendizaje: los LLMs nos permiten hacer preguntas, discutir y acceder a una vasta base de conocimientos. Debemos tener cuidado aquí de pensar críticamente sobre sus respuestas y verificar su validez.
- Revisión y corrección de textos: los LLMs son excelentes para corregir textos y ayudar a los escritores a obtener una opinión rápida sobre su estilo de escritura.
Hay muchos otros casos de uso que no he mencionado aquí. Muchas personas no técnicas están comenzando a integrar los LLMs en sus flujos de trabajo.
Estoy emocionado por las capacidades de los LLMs y espero ver cómo se utilizan. Al mismo tiempo, estoy preocupado por nuestra ignorancia y falta de comprensión de cómo los LLMs procesan la información. La cantidad de cálculos que los LLMs utilizan y los billones y billones de transistores que interactúan para procesar información podrían llevarnos a algo no deseado en el futuro.
Incluso con nuestros avances médicos, apenas estamos rascando la superficie para comprender cómo funciona el cerebro humano. Sabemos cómo funcionan algunas partes y cómo se utilizan diferentes áreas del cerebro al experimentar emociones, lógica o dolor. Pero en su totalidad, el cerebro humano sigue siendo un misterio para nosotros.
Ahora estamos creando modelos que utilizan miles de GPUs, crean vastas redes neuronales para procesar información y avanzan hacia la IA generativa.
Como dije al principio, llamarlo inteligencia no es fiel al significado de la inteligencia, ya que falta el aspecto emocional.
Necesitamos reevaluar nuestro progreso y reflexionar sobre el camino que hemos tomado. ¿Hasta qué punto deberíamos y podemos llegar hasta alcanzar un punto de inflexión con los LLMs en el que creamos algo sobre lo que ya no tenemos control?
Si no es por la falta de control, podría tratarse de la información que los LLMs compartirán en el futuro a medida que se desarrolle. ¿Cómo influirá la IA generativa en nosotros en los próximos años?
Hay muchas preguntas abiertas y la necesidad de regulación está justificada.
Espero que hayas disfrutado este artículo. Si tienes comentarios o recomendaciones, no dudes en contactarme.
Si quieres conocer otras notas parecidas a Intelecto vs. inteligencia: diferencias y riesgos puedes visitar la categoría Inteligencia artificial.
