Actualidad y Noticias IA - Octubre 2025, semana del 20 de Octubre

Actualidad y Noticias IA - Octubre 2025, semana del 20 de Octubre

OpenAI DevDay 2025: la revolución de los agentes y las apps dentro de ChatGPT

El DevDay 2025 de OpenAI no fue un evento cualquiera, sino un golpe sobre la mesa en el mundo de la inteligencia artificial. En él se presentaron las nuevas apps dentro de ChatGPT y el esperado “AgentKit”, una herramienta que promete convertir a cualquier usuario en un creador de agentes personalizados. Y sí, todo desde una interfaz visual tan intuitiva que hasta tu gato podría entrenar un bot (si tuviera dedos).

Lo más destacado fue el nuevo ecosistema de “Apps in ChatGPT”, que permite crear extensiones dinámicas y módulos con solo lenguaje natural. En otras palabras, los usuarios podrán hacer que ChatGPT “piense y actúe” según sus necesidades. Este enfoque lleva la personalización de los LLMs a un nuevo nivel, combinando funciones de API, datos contextuales y flujos automáticos.

El nuevo “AgentKit” representa un paso más hacia los agentes autónomos. Su objetivo: permitir que ChatGPT conecte con herramientas, APIs y sistemas externos sin complicaciones. Los desarrolladores ya pueden construir asistentes que compren billetes, reserven hoteles o gestionen correos. En pocas palabras, OpenAI ha soltado a sus agentes al mundo digital… y el mundo digital debería prepararse.

Además, OpenAI anunció mejoras en la latencia y el contexto de memoria. Ahora los agentes pueden “recordar” tareas pasadas y continuar conversaciones en distintos hilos, acercándose cada vez más a lo que podríamos llamar una IA persistente. El concepto de “memoria viva” en ChatGPT es ya una realidad.

En tono más técnico, OpenAI también actualizó su API para permitir ejecución asíncrona, nuevos permisos de usuario y soporte para datos en tiempo real. Esto permite que las apps dentro de ChatGPT se comporten como verdaderas aplicaciones web. El ecosistema se perfila como un nuevo “App Store de IA”.

Y si todo esto suena a ciencia ficción, espera a ver los demos. Desde agentes financieros que gestionan carteras hasta asistentes que crean webs completas, el futuro ya está aquí. Y esta vez, viene con interfaz gráfica y café virtual incluido.

 

Claude Sonnet 4.5: el nuevo TOP 1 de la programación con IA

Anthropic ha vuelto a mover ficha con Claude Sonnet 4.5, su modelo más avanzado hasta la fecha. Esta nueva versión ha sido descrita como “el mejor modelo de programación del mundo”, y no sin motivo. Su rendimiento en benchmarks de codificación, comprensión y razonamiento supera incluso al GPT-4o en varios apartados. Y lo hace sin alucinar tanto… al menos la mayoría del tiempo.

Sonnet 4.5 introduce mejoras clave en razonamiento lógico y uso de herramientas externas. Esto significa que puede ejecutar comandos, analizar bases de datos y hasta depurar código sin que tengas que intervenir. Es un paso más hacia los agentes cognitivos que entienden y actúan en entornos reales, no solo responden preguntas.

Anthropic también ha potenciado su rendimiento en tareas de “computer use”, es decir, su capacidad para navegar interfaces o manipular sistemas operativos de forma simulada. El resultado es un modelo más autónomo, ideal para automatizar flujos de trabajo complejos o tareas de soporte técnico.

Una de las grandes novedades está en su contexto ampliado: hasta 200K tokens. Esto le permite procesar proyectos enteros o grandes repositorios de código. ¿Quieres que analice toda tu app? Sonnet 4.5 puede hacerlo sin pestañear (si es que pestañeara).

Otra mejora destacable es la velocidad de respuesta. Anthropic ha reducido significativamente la latencia, haciendo de Sonnet 4.5 una herramienta útil para entornos empresariales en tiempo real. Además, su integración con Claude API ya permite conectar con IDEs y pipelines CI/CD.

El salto cualitativo de Sonnet 4.5 consolida a Anthropic como un jugador imprescindible en el tablero LLM. Y si la tendencia sigue, pronto podríamos tener “Claude DevOps Edition”: una IA que programa, prueba y despliega mientras tú te tomas el café.

 

Microsoft presenta Agent Mode: tu copiloto para toda la suite Office

Microsoft ha presentado oficialmente su Agent Mode, una funcionalidad integrada en Copilot para la suite Office que permite crear y gestionar agentes de IA dentro de las herramientas de productividad. Con esto, la empresa de Redmond busca que Word, Excel y Outlook no solo te ayuden… sino que trabajen por ti.

Agent Mode permite diseñar agentes personalizados capaces de ejecutar tareas complejas: desde responder correos de forma autónoma hasta coordinar reuniones o analizar datos en hojas de cálculo. En esencia, Microsoft quiere que tu PC tenga un “asistente personal” que no duerme ni pide aumentos.

La parte técnica más interesante es su integración con el entorno de permisos de Microsoft 365, lo que garantiza un control granular del acceso a los datos. Es decir, tus agentes IA podrán actuar con tu autorización, pero sin comprometer la seguridad ni la privacidad.

Otro punto clave es la interoperabilidad. Los agentes creados en Agent Mode pueden comunicarse entre aplicaciones, compartir contexto y trabajar en equipo. ¿Un WordBot que colabora con ExcelBot? Exactamente. Microsoft ha inventado el coworking digital… sin las conversaciones de pasillo.

Para desarrolladores, Microsoft abre su SDK de agentes, permitiendo integraciones con APIs externas y modelos de terceros. Es un movimiento estratégico que convierte a Office en una plataforma abierta de IA empresarial.

El futuro del trabajo ya no será solo con Copilot, sino con toda una flota de mini Copilots trabajando sincronizados. Y tú, probablemente, supervisando que no te reserven el café del viernes por error.

 

Gemini 2.5 Computer Use: Google enseña a sus modelos a “usar el ordenador”

Google ha dado un paso gigante con Gemini 2.5 Computer Use, un modelo diseñado para entender y manipular interfaces de usuario directamente. En lugar de limitarse a generar texto, ahora los modelos Gemini pueden hacer clic, escribir, desplazarse y ejecutar tareas en el navegador como un humano (solo que sin café ni distracciones).

Esta nueva arquitectura combina visión y lenguaje para interpretar pantallas y actuar en consecuencia. En términos técnicos, Gemini 2.5 implementa un módulo de razonamiento multimodal capaz de traducir texto, imágenes y estructuras DOM en acciones programáticas. Básicamente, le enseñaron a “usar Chrome”.

El potencial es enorme: desde automatizar tests hasta ejecutar flujos de trabajo corporativos. Google demostró que Gemini puede rellenar formularios, revisar documentos o enviar correos con Gmail. Y aunque suene trivial, es un gran salto hacia la automatización universal con IA.

Para los desarrolladores, Computer Use introduce un nuevo marco de permisos y logs de auditoría. Así, cada acción del modelo queda registrada y explicada, un paso necesario para garantizar la confianza en agentes autónomos.

Además, la integración con Android Studio y Workspace abre un abanico de aplicaciones: control de entornos de desarrollo, administración de sistemas o asistencia remota. La combinación de Gemini con estas herramientas apunta a redefinir lo que entendemos como “asistente digital”.

¿Lo siguiente? Probablemente modelos que instalen sus propias actualizaciones. Y cuando eso ocurra, los sysadmins del mundo necesitarán vacaciones largas (y justificadas).

 

Cursor lanza su primera formación oficial para programar con IA

La herramienta de desarrollo impulsada por IA Cursor ha presentado su primera formación oficial enfocada en enseñar a programar con inteligencia artificial. El curso, titulado “Cursor Learn”, combina teoría práctica y ejercicios en vivo sobre cómo usar LLMs para acelerar el desarrollo de software.

La iniciativa busca capacitar tanto a principiantes como a desarrolladores experimentados en la creación de proyectos asistidos por IA. Con ejemplos reales, se enseña a aplicar prompts, refactorizar código y construir pipelines con apoyo de modelos como GPT-4o y Claude. Es un paso más hacia la democratización del AI coding.

Cursor Learn también aborda buenas prácticas de ingeniería de prompts, detección de errores y control de versiones. En definitiva, no solo enseña a pedirle cosas a la IA, sino a hacerlo bien (y sin que te devuelva un bucle infinito).

Una característica curiosa es su sistema de aprendizaje adaptativo: el modelo ajusta las lecciones según el estilo y ritmo del estudiante. Es como tener un tutor personal, pero que nunca llega tarde ni olvida lo que te explicó ayer.

El curso incluye módulos sobre agentes de desarrollo, integración de APIs y despliegue automatizado. Además, introduce a los estudiantes en la filosofía del “pair programming con IA”, una tendencia que ya se considera la próxima gran ola del desarrollo colaborativo.

Con Cursor Learn, la formación en IA da un salto cualitativo: no se trata de aprender a programar, sino de aprender a pensar con una IA al lado. Eso sí, todavía no corrige café derramado sobre el teclado… al menos por ahora.