Modelos del mundo
En los últimos años, los grandes modelos de lenguaje – LLMS (modelos de idiomas grandes) – como GPT, LLAMA o GEMINI Han marcado hitos importantes como la generación de texto, programación o resolución de problemas matemáticos.
Si bien las grandes figuras en el mundo de la inteligencia artificial predicen la proximidad de la inteligencia artificial general desaudada (Agi por su acrónimo en inglés), otros como Yann Lecun – Científico Jefe de Ai en la meta son más escépticos y advierten que un cambio de paradigma Para lograr la inteligencia artificial realmente comparable al humano.
Los LLM tienen varias deficiencias fundamentales:
-
Falta de comprensión del mundo físico. Las respuestas de estos modelos se basan en patrones estadísticos sobre texto, no en experiencias como las que las personas aprenden en el mundo real y en los que construimos nuestra comprensión del entorno en el que vivimos. Por ejemplo, no entienden fenómenos como la gravedad, ya que van más allá de las correlaciones lingüísticas.
-
Memoria no perseguida. Cada conversación que tenemos con un LLM tiene un comienzo y un final, pero el modelo no continúa continuamente desde esas interacciones. Una vez que terminamos la conversación, olvidan lo que han aprendido y no acumulan esa experiencia para adaptarse a largo plazo.
-
Razonamiento limitado. Como hemos mencionado, se basan en patrones estadísticos sobre texto, no en procesos deductivos reales. No pueden deducir por qué ocurre un fenómeno y dedicar el mismo tiempo o «esfuerzo» a preguntas simples y complejas. Aunque en este sentido ha habido avances como los LLM de razonamiento.
-
Incapacidad para planificar jerárquicamente. Antes de las tareas complejas que requieren planificación y descomposición en los subtastros, los LLM no logran aproximar el resultado con una visión global del problema.
Además de estas limitaciones, hay otros dos obstáculos:
-
Dependencia de datos textuales. Los modelos de entrenamiento requieren grandes cantidades de texto de alta calidad. Hoy es difícil generar nueva información que realmente mejore sus habilidades. Además, los modelos solo «aprenden» palabras, mientras que los seres humanos incorporan múltiples sentidos: visión, tacto, sonido … esa riqueza sensorial no puede reflejarse solo en el texto.
-
Alucinaciones Los LLM continúan fallando y, a veces, generando información falsa. Para ellos, no existe una diferencia inherente entre la información falsa generada y la información verdadera.
Ante estas deficiencias, Lecun y otros investigadores plantean un nuevo enfoque: modelos mundiales (modelos mundiales). Estos son sistemas capaces de construir representaciones del entorno real a partir de datos heterogéneos: Texto, video, audio, imágenes y sensores físicos. Para que estos sistemas sean viables, son esenciales que incorporan capacidades como:
-
Comprensión de la dinámica del físico que gobiernan el mundo. Estos nuevos sistemas construirán una representación de su entorno físico y comprenderán conceptos como las leyes físicas que afectan el movimiento de los objetos y cómo interactúan entre sí.
-
Memoria persistente Deben mantener un estado interno que evolucione después de cada interacción, permitiendo su actualización y aprendizaje continuo.
-
Razonamiento causal. Podrán construir y explicar relaciones de causa y efecto, lo que les permite comprender por qué un cambio en el medio ambiente produce ciertos resultados.
-
Planificación. Pueden desglosar tareas complejas en tareas más simples y evaluar cada alternativa a través de simulaciones.
Nos enfrentamos a un desafío, ya que para construir estos sistemas necesitaremos una gran cantidad de datos multimodales: Sensores, videos, audio y, por supuesto, texto. El costo informático de la inferencia a estos sistemas será mayor en comparación con los modelos de lenguaje actuales.
Lecun anticipa que en aproximadamente cinco años veremos los modelos del primer mundo, como Boss, y en una década nos acercamos a un AGI comparable al humano.
¿Es este el camino que seguirá el campo de la inteligencia artificial? El tiempo lo dirá. Los modelos de idiomas han abierto la ruta revolucionaria sin precedentes en el campo de la inteligencia artificial, pero parece claro que la hoja de ruta pasa a través de este cambio de modelo y crea sistemas que permiten una comprensión del mundo más completo.
Mientras tanto, tenemos excelentes herramientas construidas en los LLM actuales que nos permiten ser más eficientes y ahorrar tiempo en nuestras tareas diarias.
*** José Manuel Rodríguez es profesor de AFI Global Education.
Puedes consultar la fuente de este artículo aquí