- Digital Brain
- Posts
- 🤔 ChatGPT aprende a "pensar" con imágenes
🤔 ChatGPT aprende a "pensar" con imágenes
ADEMÁS: Google lanza Gemini 2.5 Flash y llega lo último en vídeo con IA con Kling 2.0 y Seaweed
¡Feliz domingo, Digital Brainers!
Bienvenidos a los 2.046 nuevos lectores de esta semana 👋
Si hasta ahora pensabas que lo de la IA iba rápido, agárrate fuerte porque esto ya es una montaña rusa. Hoy veremos cómo OpenAI lanza modelos que ahora razonan con imágenes, Google responde con Gemini 2.5 Flash y su “presupuesto de pensamiento” y China contraataca con avances brutales en vídeo IA.
Cada semana se tensa más la carrera: los modelos son más rápidos, más visuales, más baratos… y cada vez más personales. Ya no hablamos sólo de productividad o código, sino de cómo usamos la IA para organizarnos, entendernos… o simplemente no sentirnos solos.
En el menú de hoy tenemos:
🤔 OpenAI lanza o3 y o4-mini: los primeros modelos que “piensan con imágenes”
⚡️ Google responde con Gemini 2.5 Flash: razonamiento a bajo coste
🎬 Kling 2.0 encabeza la nueva ola china en generación de vídeo con IA
💡 Tutorial IA: Crea vídeos estilo UGC para tus redes
✍🏼 Prompt de la semana: Agente de viajes
📊 Insights: La IA entra en nuestra vida personal (y se queda)
📸 Imágenes IA: Figuras de acción
📰 NOTICIAS
🤔 OpenAI lanza o3 y o4-mini: los primeros modelos que “piensan con imágenes”

Fuente: OpenAI
Esta semana, OpenAI ha presentado una nueva generación de modelos que lleva la IA un paso más allá. Los nuevos o3 y o4-mini no sólo destacan por su rendimiento técnico, sino que por primera vez permiten que un modelo de lenguaje razone utilizando imágenes como parte de su proceso interno. Además, se han anunciado nuevas herramientas para desarrolladores: el modelo GPT-4.1, con contextos de hasta un millón de tokens, y Codex CLI, un agente de código open-source.
Puntos clave:
o3 se convierte en el nuevo modelo de referencia de OpenAI, dominando tareas complejas de razonamiento matemático, programación y análisis multimodal.
o4-mini ofrece un rendimiento sobresaliente a bajo coste, superando modelos anteriores y obteniendo resultados casi perfectos en benchmarks.
Ambos modelos pueden usar y combinar todas las herramientas de ChatGPT (web, código, imágenes, etc.) dentro de un mismo razonamiento.
Por primera vez, un modelo puede “pensar con imágenes”, incorporando análisis visual en su proceso interno de resolución de problemas.
GPT-4.1 está optimizado para desarrolladores: ofrece mejor rendimiento, mayor contexto y precios más bajos que GPT-4o.
Codex CLI, el nuevo agente de código open-source, puede interpretar imágenes de aplicaciones, recrearlas en local y personalizarlas.
Por qué es importante: Por primera vez, la IA no sólo razona con texto, sino también con imágenes. Esta nueva generación de modelos combina herramientas, visión y pensamiento lógico para crear ideas nuevas y resolver problemas complejos. ChatGPT ya no sólo genera respuestas: ahora analiza, interpreta… y empieza a pensar visualmente.
📰 NOTICIAS
⚡️ Google responde con Gemini 2.5 Flash: razonamiento a bajo coste
Google no se ha quedado quieto tras los lanzamientos recientes de OpenAI. La compañía ha presentado Gemini 2.5 Flash, un nuevo modelo híbrido de razonamiento que planta cara directamente a o4-mini y supera a Claude 3.5 Sonnet en múltiples benchmarks técnicos y científicos. Pero la gran novedad aquí es la introducción de un “presupuesto de pensamiento” ajustable para optimizar costes sin sacrificar calidad.
Puntos clave:
Gemini 2.5 Flash permite activar o desactivar su capacidad de razonamiento según las necesidades específicas de cada tarea.
El modelo ofrece un rendimiento notable en benchmarks científicos y visuales, manteniendo una eficiencia superior a la de modelos rivales.
Incluye un innovador sistema de “thinking budget” que permite ajustar la calidad, velocidad y coste de cada respuesta.
Ya está disponible en versión preliminar desde Google AI Studio, Vertex AI y como opción experimental en la aplicación Gemini.
Por qué es importante: Google demuestra una vez más su capacidad de respuesta rápida en la carrera por el liderazgo en IA. La incorporación de un sistema ajustable de razonamiento supone un paso clave hacia una IA más eficiente, flexible y accesible económicamente, justo en el momento en que OpenAI parecía marcar el ritmo.
📰 NOTICIAS
🎬 Kling 2.0 encabeza la nueva ola china en generación de vídeo
Si hace unas semanas eran Runway y Midjourney quienes captaban todas las miradas desde EE.UU., ahora China responde con fuerza. Kling AI ha lanzado una potente actualización de sus modelos con KLING 2.0 Master para vídeo y KOLORS 2.0 para imágenes, elevando significativamente el estándar del contenido visual generado por IA. Por su parte, ByteDance aporta su granito de arena con Seaweed, un modelo eficiente que maximiza calidad con mínimos recursos.
Puntos clave:
KLING 2.0 Master permite generar vídeos cinematográficos con movimientos naturales, mayor realismo visual y alta fidelidad a instrucciones.
KOLORS 2.0 genera imágenes hiperrealistas en más de 60 estilos, además de ofrecer potentes herramientas de edición como inpainting y restyling visual.
Kling también actualiza su anterior modelo 1.6, incorporando un editor multi-elementos para facilitar la edición y manipulación de vídeos generados.
ByteDance presenta Seaweed, capaz de generar clips de vídeo de hasta 20 segundos con un rendimiento comparable al de modelos mucho más grandes.
De vuelta en EE.UU., Gemini ya integra acceso directo a Veo 2, el potente modelo de vídeo de Google que genera vídeos cortos altamente realistas.
Por qué es importante: Tras una reciente oleada de avances estadounidenses en IA generativa visual, China recupera protagonismo con lanzamientos sólidos y prometedores en vídeo e imagen. Este constante ir y venir entre las principales potencias tecnológicas asegura una aceleración continua en las capacidades de generación visual con IA, beneficiando enormemente a usuarios y creativos en todo el mundo.
🔥 NOTICIAS EN 1 MINUTO
🚀 Safe Superintelligence (SSI), cofundada por ex-OpenAI Ilya Sutskever, recauda $2.000M y alcanza valoración récord de $32.000M.
🩺 Una IA supera a expertos humanos en diagnóstico de tuberculosis, alcanzando precisión mayor que pruebas recomendadas por la OMS.
📸 Microsoft lanza oficialmente Recall, función que registra actividad en pantalla para búsquedas posteriores, pese a preocupaciones sobre privacidad.
📺 Netflix prueba nueva función de búsqueda basada en el estado de ánimo del usuario, impulsada por tecnología OpenAI.
🐬 Google presenta DolphinGemma, modelo de IA desarrollado con Georgia especializado en analizar y entender patrones en las vocalizaciones de delfines.
💰 Nvidia anuncia inversión masiva de $500.000M para fabricar chips de IA en EE.UU., acelerando producción local ante la creciente demanda.
🔍 Anthropic estrena 'Research', función que integra búsquedas en internet y documentos internos, además de incorporar a Claude en Google Workspace.
📩 Notion lanza Inbox Zen, app minimalista de email que redacta respuestas, agenda reuniones y filtra automáticamente los correos más importantes.
🏥 Hospital de Londres desarrolla app IA que detecta lesiones benignas con 99% de precisión y ayuda a diagnosticar +14.000 casos de cáncer.
🛡️ OTAN adquiere Maven Smart System de Palantir, plataforma que integra modelos IA para mejorar planificación y toma de decisiones en combate.
💡TUTORIAL IA
📹 Crea vídeos estilo UGC para tus redes

Necesitas vídeos UGC pero no te da la vida (o el presupuesto) para grabarlos tú mismo? Olvídate de cámaras: te enseñamos cómo crearlos desde cero usando sólo ChatGPT y Kling AI.
1. Abre ChatGPT y selecciona el modelo GPT-4o.
2. Pídele que genere una imagen estilo UGC con un prompt como este:
Crea una imagen de una mujer joven en su cocina por la mañana, sirviéndose una taza de café recién hecho. Lleva un jersey de punto cómodo y tiene el pelo recogido de forma natural. La luz entra por la ventana creando un ambiente cálido y acogedor. Haz que parezca auténtico y cotidiano, como una escena de un vídeo casero grabado con el móvil.
3. Ve a Kling, crea una cuenta y entra en la opción Image to Video.
4. Sube la imagen, espera unos minutos, y ¡listo!
Tienes tu vídeo UGC generado con IA en menos tiempo de lo que habrías tardado en buscar espacio para la sesión con modelos.
✍️ PROMPT DE LA SEMANA
Agente de viajes
"Basado en vuelos desde [MI CIUDAD], sugiéreme 5 destinos baratos para viajar el próximo mes. Ordénalos por coste total (ida y vuelta), aerolínea y fechas recomendadas. Para cada destino, explica brevemente por qué vale la pena visitarlo (comida, cultura, naturaleza, etc.). Incluye además algún consejo para ahorrar en alojamiento o transporte local en cada ciudad.
🚀 5 HERRAMIENTAS PARA 10X TU PRODUCTIVIDAD
Voicenotes: Graba tus pensamientos y reuniones, y recupéralos cuando más los necesitas. Recibe insights en tiempo real sin tomar notas.
SpreadSimple: Convierte tus Google Sheets en webs profesionales sin escribir una sola línea de código.
Readdy: Diseña tu web ideal hablando con la IA. Sin drag & drop, sin líos. Sólo dilo y listo.
Taskade: Organiza proyectos, notas, tareas y flujos de trabajo con una interfaz colaborativa impulsada por IA.
Compose AI: Mejora tu escritura con autocompletado inteligente y resúmenes y respuestas con un clic. Ideal para emails y contenido rápido.
📊 INSIGHTS
La IA entra en nuestra vida personal (y se queda)

Fuente: Filtered.com
Hace sólo un año usábamos la IA principalmente para generar ideas o corregir textos, pero las cosas están cambiando rápido. Según un reciente estudio de Harvard Business Review, basado en el análisis de foros como Reddit, los usos más populares de la IA en 2025 son cada vez más personales: apoyo psicológico, organización personal e incluso la búsqueda de un propósito vital.
Puntos clave:
El apoyo psicológico y la compañía ahora encabezan la lista, mostrando un claro aumento frente al uso más técnico del año pasado.
Nuevos casos de uso como "organizar mi vida" o "encontrar un propósito" surgen con fuerza, indicando una adopción más profunda en nuestro día a día.
La IA se está integrando más en nuestras emociones y relaciones y usos profesionales, como generación de código, aparecen en un segundo plano.
Se revela una creciente comodidad social para interactuar con IA en contextos personales y emocionales, más allá de simples consultas técnicas.
Este cambio muestra lo rápido que estamos integrando la inteligencia artificial en aspectos íntimos de nuestra vida diaria. Lejos del ámbito meramente práctico o laboral, estamos empezando a confiar en las máquinas para gestionar emociones, decisiones personales e incluso nuestro bienestar psicológico. Este avance acelerado plantea tanto oportunidades como importantes preguntas sobre cómo nos relacionamos no sólo con la tecnología, sino también con nosotros mismos.
📸 IMÁGENES IA
🦸🏻 Figuras de acción
Primero fueron las imágenes estilo Studio Ghibli, y ahora la última moda son las figuras de acción de famosos, personajes históricos… o de ti mismo/a! 😎
¿Cuál de estas te llevarías a tu estantería?
¡Hasta la semana que viene! 🙌🏼


Cuando estés list@, hay 2 formas en las que podemos ayudarte:
1.- LA ACADEM·IA de Digital Brain está cerrada después del aluvión de solicitudes que recibimos en su lanzamiento, pero puedes apuntarte para ser el primero en enterarte cuando volvamos a abrir.
2.- Domina ChatGPT en 10 días: Nuestro curso estrella sobre cómo Dominar ChatGPT desde cero. Compartimos todos los aprendizajes que hemos sacado después de utilizar esta fantástica herramienta durante los 2 últimos años. Te llevará de la mano desde los conceptos básicos hasta un nivel avanzado, para que puedas aplicar la inteligencia artificial en tu día a día y elevar tu productividad al máximo 🚀.
3.- Promociona tu negocio a más de 70.000 aficionados de la IA: Escríbenos a través de nuestra plataforma Passionfroot y hablemos sobre cómo podemos ayudarte a hacer crecer tu negocio ✨.
¿Que te ha parecido esta newsletter?Ayudanos con tu feedback a seguir mejorando |
Iniciar Sesión o Suscríbete para participar en las encuestas. |
Si te gusta Digital Brain, ayúdanos a seguir creciendo utilizando este enlace para compartirnos con amigos, familiares e incluso en tus redes sociales. Te estaremos infinitamente agradecidos🙏!
Mil gracias por el apoyo y por seguir leyéndonos.
¡Nos vemos la próxima semana!
Reply