Esto es lo que necesita la robótica para parecerse a las películas – Desde dentro
Imagine una IA que no sólo responda preguntas, sino que también pueda imaginar escenarios, predecir consecuencias o planificar acciones



Imagine una IA que no sólo responda preguntas, sino que también pueda imaginar escenarios, predecir consecuencias o planificar acciones antes de ejecutarlas. Esto es exactamente lo que prometen los modelos mundiales, una tecnología que llama la atencion Esto podría cambiar radicalmente la forma en que las máquinas entienden e interactúan con su entorno.
¿Qué son exactamente?. Los modelos mundiales son sistemas de inteligencia artificial que crean una representación interna del entorno como si contuvieran una simulación del mundo real. A diferencia del aprendizaje supervisado tradicional, que simplemente asigna entradas a salidas utilizando datos etiquetados, estos modelos Aprenda cómo funciona un entorno y pueden predecir lo que sucederá a continuación. Es similar a la forma en que las personas usan simulaciones mentales para predecir resultados sin tener que experimentar físicamente cada situación.
El ejemplo de la masa. Los investigadores David Ha y Jürgen Schmidhuber ellos lo explican Utilizando una analogía deportiva, un bate de béisbol tiene sólo milisegundos para decidir cómo golpear la pelota, menos tiempo del que tarda la señal visual en llegar al cerebro. Lo que le permite batear una bola rápida de 100 mph es su capacidad para predecir instintivamente hacia dónde irá la bola. Tus músculos reaccionan reflexivamente basándose en las predicciones de tu modelo mental interno, sin que tengas que planificar conscientemente todos los escenarios posibles.
¿Por qué son importantes ahora?. Personalidades destacadas como Yann LeCun (Meta), Demis Hassabis (Google DeepMind) y Yoshua Bengio (Quebec AI Institute) sostener que estos modelos son esenciales para construir sistemas verdaderamente inteligentes. La startup World Labs de Fei-Fei Li, una de las figuras más influyentes en IA, aumentó el año pasado 230 millones de dólares para desarrollarlo.
Por otro lado, General Intuition, un nuevo laboratorio de IA de Medal (conocido por su aplicación para grabar y compartir clips de juegos), recién recibido una ronda de financiación de 133,7 millones. La inversión provino principalmente del fundador de Khosla Ventures, Vinod Khosla (uno de los primeros inversores de OpenAI), quien afirmado que en esta zona se están construyendo «varias empresas por valor de cientos de miles de millones, posiblemente incluso billones de dólares».
como funcionan. Estos sistemas tienen tres habilidades básicas. Por un lado, comprimen datos sensoriales complejos (imágenes, vídeos, textos) en representaciones más simples. En segundo lugar, predicen condiciones ambientales futuras basándose en información pasada y actual. En tercer lugar, utilizan este modelo aprendido para simular diferentes acciones y elegir la mejor opción. Es como si la IA pudiera «soñar» diferentes escenarios antes de actuar.
El caso de los videojuegos. Ja y Schmidhuber también un ejemplo ilustrativo Para hacer esto, imagine una IA aprendiendo a jugar un juego de carreras. En lugar de memorizar secuencias de movimientos, primero creas un modelo interno de cómo se comporta el mundo del juego: cómo se mueve el coche, cómo se curva la carretera, dónde aparecen los obstáculos. Luego podrás imaginar escenarios futuros y probar diferentes estrategias de conducción en tu mundo simulado antes de aplicarlas en el juego real.
Aplicaciones prometedoras. Modelos mundiales Ya están cambiando varias zonas. En la conducción autónoma, permiten que los vehículos simulen la dinámica del tráfico y el comportamiento de los peatones para tomar decisiones más seguras. En robótica, los robots pueden imaginar diferentes formas de completar una tarea antes de ejecutarla. Esto es particularmente útil cuando la formación en la práctica es costosa o peligrosa. Y en la generación de videos. Ayude a crear contenido más realista: Un modelo que comprenda por qué rebota una pelota lo representará mejor que uno que simplemente haya memorizado patrones.
Más allá del vídeo. Un mejor modelo de generación de vídeo sería sólo el comienzo. Le Cun describir Cómo un modelo mundial podría ayudar a lograr objetivos a través del razonamiento: dado un video de una habitación desordenada y el objetivo de limpiarla, podrías desarrollar una secuencia de acciones (aspirar, lavar platos, vaciar la basura) no porque hayas observado este patrón, sino porque entiendes en un nivel más profundo cómo pasar de lo sucio a lo limpio. «Necesitamos máquinas que comprendan el mundo, que puedan recordar cosas, que tengan intuición y sentido común». afirmado.
Los obstáculos frente a nosotros. Entrenar y operar modelos mundiales. requiere una enorme potencia informáticaincluso en comparación con los modelos generativos actuales. Aunque ejecutar los modelos actuales ya requiere miles y miles de GPU alojadas en gigantescos centros de datos que consumen mucha energía, entrenar modelos mundiales es un nivel diferente. Además, como todos los modelos de IA, corren el riesgo de producir alucinaciones e internalizar sesgos a partir de sus datos de entrenamiento.
La apuesta de la industria. A pesar de los desafíos técnicos, existen diferentes estrategias. Google DeepMind y OpenAI ellos apuestan Con suficientes datos de entrenamiento multimodal (vídeo, simulaciones 3D y texto), se crea espontáneamente un modelo mundial dentro de una red neuronal. LeCun, por su parte, creer que será necesaria una arquitectura de IA no generativa completamente nueva.
¿Qué sigue?. Varios expertos también predicen que los modelos mundiales te permite crear mundos interactivos en 3D bajo demanda para videojuegos, fotografía virtual y otras aplicaciones. Respectivamente Justin Johnson, cofundador de World Labs: «Ya tenemos la capacidad de crear mundos virtuales interactivos, pero cuesta cientos de millones de dólares y mucho tiempo de desarrollo». También podrían revolucionar la robótica al darles a los robots una verdadera conciencia de su entorno y de sus propios cuerpos. Como reanudar Mashrabov: “Con un modelo mundial avanzado, una IA podría desarrollar una comprensión personal de cada escenario en el que se encuentra y comenzar a considerar posibles soluciones”.
Aunque LeCun Apreciación El hecho de que todavía estemos al menos a una década de los modelos mundiales que imagina, la gran anticipación de la industria por ver avances en IA y la enorme inversión que está recibiendo este fenómeno sugieren que esta tecnología podría ser el próximo gran salto hacia máquinas que no sólo respondan al mundo, sino que también lo comprendan y lo modelen.
Foto de portada | Michael Marais
En | “La seguridad de nuestros hijos no está en venta”: ya está aquí la primera ley que regula los “amigos de la IA”