Skip to main content
  1. Casa
  2. Noticias

Claude, ChatGPT o Gemini: que IA gana en una partida de Super Mario Bros.

Una imagen del videojuego Super Mario Bros.
DTES

Super Mario Bros. de 1985 podría parecer un reto sencillo para cualquier IA que se precie de tener la mejor capacidad de procesamiento y ejecución, sin embargo, 40 años después un experimento de la Universidad de California demostró que el juego de Super Nintendo fue un desafío monumental para cuatro modelos de IA: Claude 3.5 y 3.7 de Anthropic,  GPT-4o de OpenAI y Gemini 1.5 Pro de Google.

El experimento utilizó una versión emulada del clásico juego de Nintendo, integrada con un marco personalizado llamado GamingAgent, desarrollado por Hao Lab. Este sistema permitió a los modelos de IA controlar a Mario mediante la generación de código Python. Para guiar sus acciones, los modelos recibieron instrucciones básicas, como «Salta sobre ese enemigo», junto con visualizaciones de capturas de pantalla del estado del juego.

Claude-3.7 was tested on Pokémon Red, but what about more real-time games like Super Mario 🍄🌟?

We threw AI gaming agents into LIVE Super Mario games and found Claude-3.7 outperformed other models with simple heuristics. 🤯

Claude-3.5 is also strong, but less capable of… pic.twitter.com/bqZVblwqX3

— Hao AI Lab (@haoailab) February 28, 2025

Cuando se trató de dominar Super Mario Bros., el mejor desempeño fue Claude 3.7 de Anthropic, que mostró reflejos impresionantes, encadenando saltos precisos y evitando hábilmente a los enemigos. Incluso su predecesor, Claude 3.5, funcionó bien.

Recommended Videos

Sorprendentemente, los modelos con mucho razonamiento como GPT-4o de OpenAI y Gemini 1.5 Pro de Google se quedaron atrás. A pesar de su reputación de fuertes habilidades de razonamiento, lucharon con las demandas del juego, probablemente tardaron demasiado en calcular sus próximos movimientos, lo que llevó a muertes frecuentes y prematuras.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
¿Llegan las marcas de agua en las fotos del ChatGPT gratis?
Frame del filme Pompoko

Últimamente, todo el mundo ha estado hablando de la nueva función de generación de imágenes de ChatGPT, y parece que la emoción aún no ha terminado. Como siempre, la gente ha estado hurgando en las aplicaciones de la compañía y, esta vez, han encontrado menciones de una función de marca de agua para las imágenes generadas.

Descubierta por el de X, Tibor Blaho, la línea de código parece sugerir que la función solo pondría marcas de agua en las imágenes generadas por s gratuitos, lo que les da otro incentivo para actualizar a una suscripción paga.image_gen_watermark_for_free

Leer más
OpenAI planea hacer que Deep Research sea gratuito en ChatGPT
OpenAI

OpenAI tiene planes de poner pronto su función Deep Research a disposición de los s de ChatGPT de nivel gratuito.

La función ha estado disponible desde principios de febrero para los suscriptores de Plus, Pro, Enterprise y Edu; sin embargo, la compañía de IA planea expandir la disponibilidad más allá de sus s pagos. Deep Research va más allá de los resultados de las consultas estándar de los modelos de IA más tradicionales de la marca. El agente de IA tiene la capacidad de realizar tareas de investigación extendidas cuando se le ordena sin la ayuda de un humano. La función puede proporcionar un informe detallado sobre el tema de su elección que puede tardar entre cinco y 30 minutos en compilarse.

Leer más
El retraso ha terminado: ahora puedes generar imágenes con ChatGPT de forma gratuita
The Beatles

Después de un lanzamiento explosivo, una tendencia viral y algunas GPU derretidas, la nueva función de generación de imágenes para ChatGPT ya está disponible para los s gratuitos. La función se lanzó originalmente el 25 de marzo, pero debido a que los suscriptores pagos inundaron por completo OpenAI con solicitudes de imágenes Ghiblificadas, el CEO Sam Altman anunció al día siguiente que el lanzamiento para los s gratuitos se retrasaría "un tiempo".

Afortunadamente, parece que este retraso ha terminado solo cinco días después: Altman ya ha publicado otra publicación X diciendo que "¡image gen [está] ahora implementado para todos los s gratuitos!"

Leer más