LA SEÑAL
Posts
Gemini 2.0 se vuelve Pro

Gemini 2.0 se vuelve Pro

ADEMÁS: Documentos de OpenAI sugieren desarrollo de robots humanoides y hardware para consumidores

13 de agosto de 2025

In partnership with

La era de la IA incorporada se centra en el entrenamiento mediante simulaciones… pero, ¿qué ocurre cuando ciertos escenarios son demasiado complejos de construir o incluso de imaginar?

El nuevo Genie 3 de Google ha resuelto ese problema al poder generar entornos ricos y jugables que evolucionan en tiempo real a medida que los agentes de IA (o los usuarios) los exploran, abriendo así una nueva frontera de entrenamiento prácticamente infinito.

Want to get the most out of ChatGPT?

ChatGPT is a superpower if you know how to use it correctly.

Discover how HubSpot's guide to AI can elevate both your productivity and creativity to get more things done.

Learn to automate tasks, enhance decision-making, and foster innovation with the power of AI.

Download the free guide

Modelo de mundo interactivo Genie 3 de Google
OpenAI lanza por fin modelos de código abierto
Anthropic presenta Claude Opus 4.1
4 nuevas herramientas de IA

Modelo de mundo interactivo Genie 3 de Google

Google DeepMind acaba de presentar Genie 3, un nuevo modelo de mundo de propósito general capaz de generar entornos interactivos en tiempo real a partir de un único comando de texto, manteniendo coherencia tanto en los escenarios como en los personajes.

Detalles principales:

Con Genie 3, los usuarios pueden crear entornos únicos en 720p con física realista y explorarlos en tiempo real, con nuevos elementos visuales que aparecen a 24 fps.

La memoria visual del modelo alcanza hasta un minuto, lo que le permite simular la siguiente escena garantizando coherencia con las anteriores.

Para lograr este nivel de control, Google explica que Genie calcula la información relevante de trayectorias pasadas varias veces por segundo.

Además, permite a los usuarios modificar los mundos sobre la marcha, añadiendo nuevos personajes, objetos o cambiando por completo la dinámica del entorno.

Por qué es importante:

Los mundos consistentes de Genie 3, generados cuadro a cuadro según la acción del usuario, no solo representan un avance para los videojuegos y el entretenimiento. También sientan las bases para el entrenamiento escalable de IA incorporada, donde las máquinas pueden enfrentarse a escenarios de “qué pasaría si” —como que un camino desaparezca— adaptándose en tiempo real, tal y como haría un humano.

OpenAI lanza por fin sus modelos de código abierto

OpenAI ha presentado gpt-oss-120b y gpt-oss-20b, sus tan esperados LLMs de razonamiento con pesos abiertos, que igualan o superan el rendimiento de o4-mini y o3-mini y están disponibles para implementación local bajo licencia Apache 2.0.

Detalles principales:

Disponibles bajo Apache 2.0, la familia gpt-oss, los primeros LLMs abiertos de OpenAI desde GPT-2 en 2019, se convirtieron de inmediato en los más populares entre 2 millones de modelos en Hugging Face.

La variante de 120B rinde de forma comparable a o4-mini en los principales benchmarks y supera en ciertos dominios, pudiendo desplegarse en una GPU de 80 GB.

Por su parte, la versión más pequeña de 20B es competitiva con o3-mini y apta para uso local en portátiles con 16 GB de memoria.

Ambos modelos permiten ajustar el nivel de razonamiento (alto, medio, bajo) y gestionar flujos de trabajo automáticos, incluyendo llamadas a funciones, búsquedas web y ejecución de Python.

Por qué importa:

Tras mantener sus mejores modelos cerrados durante años, OpenAI por fin cumple con su nombre, ofreciendo a los desarrolladores acceso a modelos de razonamiento casi de frontera que pueden ejecutar y modificar en sus propios entornos. Esto supone un gran impulso para el ecosistema de código abierto, que ha ido reduciendo rápidamente la brecha con los modelos cerrados.

¿Te gusta estar al día con la IA?

Accede a contenido exclusivo cada día.

En la versión PRO de esta newsletter recibes un reporte diario con las noticias más relevantes, herramientas que aún no conoces, y recursos exclusivos: desde cursos hasta guías prácticas para instalar modelos de IA en tu ordenador.

Haz el salto a PRO y lleva tu conocimiento al siguiente nivel.

Anthropic lanza Claude Opus 4.1

Anthropic ha lanzado Claude Opus 4.1, una actualización incremental de Opus 4 que mejora el rendimiento en tareas de programación real, investigación profunda y análisis de datos, especialmente en aquellas que requieren atención al detalle y acciones autónomas.

Detalles principales:

Opus 4.1 ofrece una mejora significativa en programación respecto a su predecesor, aumentando el rendimiento en SWE-bench Verified del 72,5 % al 74,5 %.

También se observan mejoras en matemáticas, codificación autónoma en terminales (TerminalBench), razonamiento GPQA y razonamiento visual (MMMU).

Los usuarios han destacado beneficios reales con el modelo, señalando que sobresale en tareas como la refactorización de código en múltiples archivos y la identificación de correlaciones en bases de código.

Anthropic afirmó que esta actualización —disponible para usuarios de pago y empresas— marca el inicio de “mejoras sustancialmente mayores” que tienen previstas para sus modelos.

Por qué importa:

Con Opus 4.1, Anthropic suma impulso a lo que se perfila como una semana muy emocionante para los entusiastas de la IA. Estas mejoras son un regalo bienvenido, pero con el posible lanzamiento de GPT-5 de OpenAI en cualquier momento, todas las miradas estarán puestas en cómo los modelos de la compañía mantienen su posición, especialmente en programación, donde ya destacan.

NUEVAS HERRAMIENTAS

🔄 Claude Code Sessions de Depot – Sesiones de programación con IA persistentes que se sincronizan entre equipos y entornos para una colaboración fluida*
⚙️ Kaggle Game Arena – Benchmark para evaluar LLMs en juegos estratégicos en evolución
📽️ ChatGPT – El asistente de IA de OpenAI, ahora con herramientas para detectar signos de malestar mental
📝 Gemini Storybooks – La IA de Google crea ahora cuentos narrados

NOTICIAS EXPRESS

ElevenLabs presentó Eleven Music, su modelo de generación musical multilingüe, que permite controlar género, estilo y estructura, además de ofrecer la opción de editar tanto los sonidos como las letras.
Google incorporó una nueva función de Storybook en la app Gemini, que permite a los usuarios generar cuentos personalizados sobre cualquier tema, con narración en voz alta y de forma gratuita.
Perplexity adquirió Invisible, una empresa que desarrolla una plataforma de orquestación multiagente, para ampliar su navegador Comet tanto para usuarios particulares como empresariales.
Elon Musk compartió que Grok, el generador de imágenes y vídeos Imagine, está despertando un interés masivo, con 20 millones de imágenes generadas solo ayer.
Alibaba lanzó su serie Flash de modelos Qwen3-Coder y Qwen3-2507 a través de
API, con ventanas de contexto de hasta 1 millón de tokens y precios reducidos.
Shopify añadió nuevas funciones centradas en agentes, incluyendo un kit de checkout para integrar widgets de comercio, búsqueda de productos global de baja latencia y un carrito universal.