- LA SEÑAL
- Posts
- Google supera el hito matemático de OpenAI — 9 a 1
Google supera el hito matemático de OpenAI — 9 a 1
ADEMÁS: Documentos de OpenAI sugieren desarrollo de robots humanoides y hardware para consumidores
The LA Mayor Market Ends June 2. The Odds Are Moving Now.
Karen Bass is at 68%. Spencer Pratt at 27%. Over $21 million is already trading on the Los Angeles Mayor race on Kalshi — and the prices are shifting every day as local news breaks. The window to get in before the consensus hardens is closing. The best prediction market trades happen before everyone agrees on the outcome. That moment is right now, before June 2. Peer-to-peer, no house, cash out anytime. Trade $10, get $10 free to start.
Trade responsibly.
La semana pasada, OpenAI acaparó titulares al anunciar que su IA había resuelto un problema matemático de 80 años de antigüedad. Resulta que no fue la única. Google DeepMind lo ha superado en ocho problemas más, sin hacer demasiado ruido.
Su sistema AlphaProof Nexus resolvió de forma autónoma nueve problemas abiertos de Erdős, considerados algunos de los interrogantes sin resolver más complejos de las matemáticas, y todo ello a un coste de apenas unos cientos de dólares por problema.
La IA de Google resuelve nueve problemas matemáticos sin solución
Claude Mythos detecta más de 10.000 vulnerabilidades críticas

AlphaProof Nexus, el sistema de IA de Google DeepMind capaz de generar demostraciones matemáticas verificadas por ordenador, ha resuelto nueve problemas abiertos de Erdős, entre ellos dos que llevaban sin resolverse 56 años, apenas un día después de que OpenAI anunciara su propio avance en este ámbito.
Los detalles:
El sistema combina un modelo de lenguaje con Lean, un asistente de demostración, para generar pruebas matemáticas verificadas automáticamente sobre nueve problemas de combinatoria y teoría de grafos.
Cada problema tuvo un coste de resolución de apenas unos cientos de dólares, y la IA también demostró 44 conjeturas abiertas de la Enciclopedia Online de Secuencias de Enteros.
Una versión más sencilla del agente obtuvo resultados similares, aunque con un coste mayor, y los problemas que requerían construir nuevos conceptos matemáticos quedaron fuera de su alcance.
El logro de OpenAI la semana pasada consistió en refutar una conjetura de Erdős de 80 años de antigüedad, meses después de haber tenido que rectificar una afirmación anterior sobre la resolución de 10 problemas inéditos.
Por qué importa:
El avance de Google en problemas matemáticos sin resolver durante décadas ilustra la velocidad a la que la IA avanza hacia soluciones originales, y cómo la verificación formal cambia las reglas del juego. El sistema genera demostraciones, las verifica en Lean y repite el proceso hasta que una supera la prueba. Con el tiempo, esto permitirá a los investigadores realizar descubrimientos inéditos a la velocidad de una máquina.

Anthropic ha compartido los primeros resultados del Proyecto Glasswing, revelando que Claude Mythos Preview y sus aproximadamente 50 colaboradores han detectado más de 10.000 vulnerabilidades de gravedad alta o crítica en tan solo un mes.
Los detalles:
Cloudflare por sí sola encontró 2.000 errores con una tasa de falsos positivos mejor que la de los testers humanos. Mozilla detectó y corrigió 271 vulnerabilidades en Firefox 150.
Anthropic también analizó más de 1.000 proyectos de código abierto, con Mythos clasificando 6.202 como de gravedad alta o crítica. Tras una revisión independiente, el 62% de ellas, casi 3.900, se confirmaron como válidas.
La capacidad de detección de Mythos fue más allá de la simple identificación de vulnerabilidades: un banco colaborador utilizó el sistema para detectar y bloquear una transferencia bancaria fraudulenta de 1,5 millones de dólares.
A partir de ahora, Glasswing se ampliará a nuevos socios, entre ellos gobiernos de Estados Unidos y países aliados, con un lanzamiento general de los modelos de la clase Mythos previsto para más adelante.
Por qué importa:
Anthropic afirma que Mythos sigue siendo de acceso restringido porque ninguna empresa, incluida ella misma, cuenta con salvaguardas suficientemente sólidas como para prevenir un uso indebido. Sin embargo, con OpenAI intensificando el desarrollo de sus modelos de ciberseguridad y los actores chinos acortando distancias, es cuestión de tiempo que surja una IA igual de capaz o incluso superior. Cuando eso ocurra, la verdadera prueba será la velocidad con la que el mundo sea capaz de parchear sus sistemas.

