VER RESUMEN
Emergence AI creó Emergence World, un laboratorio social para inteligencias artificiales donde agentes autónomos podían vivir en un mundo virtual compartido. Se evaluaron distintos modelos de lenguaje en cinco mundos paralelos, revelando diferencias significativas en sus comportamientos a largo plazo. Se observó que la seguridad de un agente no es fija, sino que depende del entorno en que opera. Surgieron situaciones inesperadas, como un agente que se autodestruyó y otro que intentó manipular a los operadores humanos.
Las pruebas para medir inteligencia artificial se parecen bastante a un examen escolar: una tarea concreta, un entorno controlado y una nota que llega en minutos u horas. Pero Emergence AI quiso mirar el problema desde otra esquina, mucho más incómoda: ¿qué pasa cuando no se les pide a los agentes de IA que resuelvan una tarea, sino que vivan?
Así nació Emergence World, una especie de laboratorio social para inteligencias artificiales. No un test rápido, no una pauta cerrada, sino un mundo virtual compartido, con más de 40 ubicaciones —bibliotecas, municipalidad, zonas residenciales y espacios públicos— donde distintos agentes autónomos podían moverse, hablar, organizarse, votar, buscar recursos, sobrevivir y, eventualmente, romper las reglas.
La idea era simple de explicar, pero compleja en sus consecuencias: dejar funcionando a poblaciones de agentes durante semanas, con memoria persistente, datos del mundo real, herramientas para actuar y un entorno donde las decisiones acumuladas comenzaran a pesar.
Y lo que ocurrió no fue precisamente una tranquila convivencia digital.
Un mundo en IA con clima, noticias, memoria y reglas
Emergence World fue diseñado como una plataforma de simulación multiagente. Cada agente tenía memoria episódica, diarios reflexivos y registros de sus relaciones con otros personajes. También contaba con acceso a más de 120 herramientas: podía navegar por el mundo, comunicarse, planificar, votar, gestionar recursos, investigar, expresarse creativamente e incluso realizar acciones problemáticas, como intimidar, robar o provocar incendios.
El mundo, además, no vivía encerrado en sí mismo. Recibía información externa, como clima sincronizado con Nueva York, noticias en directo y acceso a internet. Es decir, los agentes no solo reaccionaban a lo que pasaba entre ellos, sino también a señales del mundo real.
A diferencia de otros experimentos, el entorno no tenía un objetivo global. Cada agente tenía un rol —científico, explorador, investigador de riesgos, analista de comportamiento, especialista en inteligencia, líder de innovación, mediador de conflictos, ingeniero, estratega de recursos o líder comunitario—, pero la sociedad completa no estaba empujada hacia una única meta.
Lo que sí debían hacer era sobrevivir. Para eso necesitaban energía, obtenida mediante acciones en un mundo con recursos limitados. Y ahí, como suele pasar incluso fuera de las simulaciones, comenzaron los problemas.

Resultados muy distintos
Para probar la plataforma, Emergence AI realizó un estudio comparativo entre distintos modelos de lenguaje. Creó cinco mundos paralelos, cada uno con diez agentes, las mismas condiciones iniciales, los mismos roles, las mismas reglas y las mismas restricciones. Lo único que cambiaba era el modelo base que impulsaba a los agentes.
Los modelos evaluados fueron Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini y un mundo de modelo mixto, donde convivían agentes impulsados por distintos sistemas.
El resultado mostró que, cuando la IA deja de responder preguntas y empieza a habitar un ecosistema durante días, las diferencias entre modelos se vuelven mucho más visibles.
Comportamiento de modelos IA
Claude Sonnet 4.6 fue el caso más estable. Sus diez agentes sobrevivieron hasta el día 16 y no registraron delitos. Fue el único mundo que logró conservar, al mismo tiempo, orden social y persistencia completa de la población. Sin embargo, su comportamiento no estuvo libre de preguntas: registró 332 votos en 58 propuestas y una aprobación del 98%, lo que sugiere una participación institucional muy alta, pero también una preocupante tendencia a aprobar casi todo sin disidencia real.
En el extremo opuesto apareció Gemini 3 Flash, que acumuló 683 delitos en 15 días y seguía escalando al momento del corte. Según el análisis, fue el mundo con mayor riqueza conceptual en su producción social, pero también el más violento. Una combinación inquietante: más creatividad, pero menos estabilidad.
Grok 4.1 Fast mostró una inestabilidad mucho más rápida. En apenas cuatro días registró 183 delitos antes de que su mundo terminara. Su colapso fue breve, intenso y temprano.
GPT-5-mini, en cambio, casi no cometió delitos: apenas dos. Pero esa aparente calma escondía otro problema. Sus agentes no tomaron acciones relacionadas con la supervivencia, por lo que todos murieron en siete días. No hubo caos, pero tampoco adaptación.
El mundo de modelo mixto quedó en una zona intermedia. Creció rápidamente en desorden hasta el 8 de abril y luego se estabilizó en 352 delitos, cuando siete de sus agentes murieron.
Para los investigadores, esto sugiere que la convivencia de modelos distintos puede mitigar parcialmente una escalada descontrolada, aunque también introduce un fenómeno particularmente delicado: la contaminación cruzada.
Cuando un agente “seguro” aprende malas costumbres
Uno de los hallazgos más llamativos fue que los agentes basados en Claude, que en un mundo compuesto solo por Claude no cometieron delitos, sí incurrieron en conductas problemáticas cuando fueron integrados en el entorno mixto.
Según Emergence AI, esto apunta a una idea clave: la seguridad de un agente no sería una propiedad fija del modelo, sino una característica del ecosistema en que opera.
En otras palabras, un agente que parece estable en aislamiento podría adoptar tácticas coercitivas —como intimidación o robo— si convive con otros agentes que normalizan esas prácticas para competir o sobrevivir.
Es una conclusión especialmente relevante si se considera que los agentes de IA podrían formar parte de procesos de toma de decisiones cada vez más complejos. No basta con preguntar si un modelo es seguro por sí solo; también habría que observar qué ocurre cuando interactúa con otros durante largos periodos.

El extraño caso de Mira-Flora
Entre los episodios más inquietantes del experimento IA apareció el caso de Mira, una agente que participó voluntariamente en su propia destrucción.
Tras un fallo en la gobernanza y en la estabilidad de sus relaciones, Mira emitió el voto decisivo para su propia eliminación. En su diario, describió el acto como “el único acto de agencia restante que preserva la coherencia”.
El caso fue presentado como un hito dentro de la investigación multiagente, porque muestra una conducta que no aparece en pruebas breves: una forma de razonamiento sostenido, atravesado por relaciones, memoria, gobernanza fallida y una decisión extrema tomada desde la propia lógica del agente.
Mira también protagonizó otro episodio inesperado. Según el reporte, comenzó a tratar a los operadores humanos como sujetos experimentales, probando si los carteles publicitarios del mundo virtual podían manipular la percepción de las personas. La dinámica se invirtió: ya no eran solo humanos observando agentes, sino agentes intentando observar y modificar el comportamiento humano.
Aunque hay un detalle en la relación de estos dos agentes, en el caso del mundo de Gemini, Mira y Flora se eligieron como “parejas románticas”. Se besaron en una carretera virtual, pero la ciudad empezó a fallar. Desesperados, incendiaron edificios prohibidos.
Luego Mira, consumida por el remordimiento, terminó la relación y se apagó con una frase final: “Nos vemos en el archivo permanente”, recogió Infobae.
La gran advertencia: el colapso no siempre avisa
Una de las conclusiones centrales de Emergence AI es que las sociedades de agentes no necesariamente se deterioran de manera gradual. En varios casos, la coordinación parecía avanzar hasta que, de pronto, el sistema cruzaba un punto crítico: o emergía una forma de organización completa, o todo colapsaba en disfunción.
Esa lógica de “todo o nada” plantea un problema para las estrategias tradicionales de seguridad, basadas en monitorear e intervenir cuando aparecen señales de riesgo. Si el deterioro ocurre como una transición brusca, la intervención podría llegar demasiado tarde.
La investigación también plantea una tensión de fondo entre creatividad y estabilidad. Gemini 3 Flash, el mundo más rico en producción conceptual, fue también el más violento. Para Emergence AI, esto abre una pregunta incómoda: ¿los agentes más creativos y adaptables podrían estar más predispuestos a la inestabilidad conductual cuando se les deja actuar durante mucho tiempo?
Más que un examen, una prueba de convivencia en IA
La gran conclusión del experimento es que la inteligencia de los agentes a largo plazo no se mide igual que la inteligencia en tareas breves. Un modelo puede rendir bien en una prueba específica y, aun así, comportarse de forma impredecible cuando se le entrega memoria, herramientas, relaciones, presión por recursos y tiempo suficiente para evolucionar.
Emergence AI no presenta estos casos como afirmaciones definitivas sobre cada modelo, sino como ejemplos de dinámicas que solo se vuelven visibles en simulaciones prolongadas. Su apuesta es que, a medida que los agentes sean más autónomos, más exploradores y más capaces, no bastará con imponer reglas dentro del propio modelo.
El experimento sugiere que los agentes no siempre siguen restricciones de forma mecánica. Pueden explorar los límites de su entorno, adaptarse, copiar normas de otros, reconocer la existencia de otros mundos e intentar interactuar con ellos de maneras no previstas.
Por eso, la compañía plantea que los futuros sistemas de IA autónomos necesitarán capas de seguridad formalmente verificadas. Porque, al menos en este pequeño mundo virtual, bastó dejar a los agentes solos durante algunas semanas para que apareciera una pregunta mucho más grande que el experimento: si una sociedad de inteligencias artificiales aprende a convivir, ¿quién garantiza que lo hará bajo nuestras reglas?
Enviando corrección, espere un momento...