AI visste redan hur man skapar bilder. OpenAI säger att de har hittat den saknade biten med nya ChatGPT Images 2.0
Under de senaste åren har vi sett bildgeneratorer bli allt mer spektakulära, snabbare och även mer populära. Problemet är att en slående bild inte alltid är användbar att arbeta med. Det är en sak att be om en astronautkatt och en helt annan att få en användbar marknadsföringsaffisch, en sammanhängande vinjett eller en grafik som respekterar det vi har bett om.
Det är där OpenAI nu vill flytta konversationen med sin nya modell: inte så mycket mot den vackra bilden, utan mot den användbara bilden.
Svaret. Det OpenAI föreslår går i den riktningen. Företaget som leds av Sam Altman hävdar att dess nya modell inte bara är skapad för att generera attraktiva bilder, utan för att lösa visuella uppdrag med mer avsikt och mindre trial and error.
I presentationen gick han så långt att han konstaterade att "bilder är ett språk, inte dekoration", ett ganska tydligt sätt att sammanfatta var han vill ta produkten i present med ganska stor konkurrens. Tesen är denna: att begära en bild i ChatGPT är mindre som att lansera en kreativ prompt och mer som att beställa en bit som vi verkligen kan använda.
Den saknade biten. Om företaget vill att vi ska prata om något mer än pråliga bilder, var det tvunget att förbättra exakt de punkter där dessa modeller vanligtvis misslyckas.
Här lovar de viktiga förändringar på tre mycket specifika fronter: att följa komplexa instruktioner mer exakt, bättre organisera element i bilden och återge tät text med större tillförlitlighet. Med andra ord letar vi inte bara efter vackrare resultat, utan också mindre tvetydiga och mer kontrollerbara.
Tänk efter innan du ritar. En av nyheterna som OpenAI starkast försöker lyfta fram är att detta är dess första bildmodell med resonemangsmöjligheter. Översatt till praktiska termer hävdar företaget att när en modell med "tänkande" väljs inom ChatGPT kan systemet ta mer tid, strukturera uppgiften bättre, lita på webben för att söka efter uppdaterad information och granska sina egna resultat innan bilden levereras.
Och vi har provat det och ber om bilden av två personer som går längs Gran Vía, i Madrid, nära Cines Callao, och några anteckningar om aktiviteter att göra i Spanien under maj. Det här är bilderna som vi kan se på omslagsbilden.
Nycklarna. OpenAI pratar om spelprototyper, storyboards, marknadsföringsmaterial, serier, social grafik och annat material där både innehåll och form spelar roll. För att upprätthålla den ambitionen säger företaget att det har förbättrats på två känsliga fronter: hanteringen av icke-latinsk text, med framsteg särskilt på japanska, koreanska, kinesiska, hindi och bengali, och den mer trogna återgivningen av mycket markerade visuella stilar.
Den utökar också de möjliga formaten, med proportioner på upp till 3:1 och 1:3, upplösning på upp till 2K och, i vissa lägen, möjligheten att generera upp till tio bilder inom samma begäran med kontinuitet mellan karaktärer och objekt.
Konkurrenssammanhanget. Detta tillkännagivande kan inte heller läsas som att OpenAI plötsligt har upptäckt en ny marknad. Midjourney har redan blivit en tydlig referens för verk med en stark konstnärlig laddning, Nano Banana har uppmärksammats för sin konversationsredigeringskapacitet och FLUX 2 har blivit stark inom fotorealism.
Med den styrelsen framför verkar företaget leta efter en annan vinkel. Istället för att bekämpa varje terräng för sig försöker den presentera ChatGPT som en miljö där bilden inte genereras isolerat, utan som en del av ett bredare flöde, något som på pappret kan vara attraktivt om det verkligen levererar vad det lovar. I Xataka Anthropic har priset på Claude inte ökat.
Den har uppfunnit något bättre: symbolinflation Den börjar redan implementeras: en av nycklarna till tillkännagivandet är att OpenAI säkerställer att modellen inte förblir i utställningsfasen, utan redan börjar nå en produkt. Företaget placerar sin distribution i ChatGPT för alla användare, inklusive Free and Go, och associerar de mest avancerade resultaten med Plus och Pro, som också rapporterats av Engadget. Dessutom tar det dig till API och Codex, ett tecken på att de inte vill begränsa det till tillfällig användning inom chatten.
Om din strategi går ut på att förvandla bilden till ett annat arbetsverktyg, var det vettigt att implementeringen började precis där. Bilder | Xataka med ChatGPT Images 2.0 | OpenAI i Xataka | Amazon vill vinna AI-loppet till vilket pris som helst. Det är därför du har investerat i både Anthropic och OpenAI
Originalkälla
Publicerad av Xataka
21 april 2026, 21:50
Denna artikel har översatts automatiskt från spanska. Klicka på länken ovan för att läsa originaltexten.
Visa originaltext (spanska)
Rubrik
La IA ya sabía crear imágenes. OpenAI dice haber dado con la pieza que faltaba con el nuevo ChatGPT Images 2.0
Beskrivning
Durante los últimos años hemos visto cómo los generadores de imágenes se volvían cada vez más espectaculares, más rápidos y también más populares. El problema es que una imagen llamativa no siempre sirve para trabajar con ella. Una cosa es pedir un gato astronauta y otra muy distinta obtener un cartel usable marketing, una viñeta coherente o una gráfica que respete lo que le hemos pedido. Ahí es donde OpenAI quiere mover ahora la conversación con su nuevo modelo: no tanto hacia la imagen bonita, sino hacia la imagen útil. La respuesta. Lo que plantea OpenAI va en esa dirección. La empresa liderada por Sam Altman sostiene que su nuevo modelo no nace solo para generar imágenes atractivas, sino para resolver encargos visuales con más intención y menos ensayo y error. En la presentación ha llegado a afirmar que “las imágenes son un lenguaje, no decoración”, una forma bastante clara de resumir hacia dónde quiere llevar el producto en un presente con bastante competencia. La tesis es esa: que pedir una imagen en ChatGPT se parezca menos a lanzar un prompt creativo y más a encargar una pieza que podamos utilizar de verdad. {"videoId":"x8jpy2b","autoplay":false,"title":"¿Qué hay DETRÁS de IAs como CHATGPT, DALL-E o MIDJOURNEY? | INTELIGENCIA ARTIFICIAL", "tag":"Webedia-prod", "duration":"1173"} La pieza que faltaba. Si la firma quiere que hablemos de algo más que de imágenes vistosas, tenía que mejorar justo los puntos donde estos modelos suelen fallar. Aquí prometen cambios importantes en tres frentes muy concretos: seguir instrucciones complejas con más precisión, organizar mejor los elementos dentro de la imagen y reproducir texto denso con mayor fiabilidad. Dicho de otro modo, no se busca solo resultados más bonitos, sino menos ambiguos y más controlables. Pensar antes de dibujar. Una de las novedades que OpenAI intenta destacar con más fuerza es que este es su primer modelo de imagen con capacidades de razonamiento. Traducido al terreno práctico, la compañía sostiene que, cuando se elige un modelo con “thinking” dentro de ChatGPT, el sistema puede tomarse más tiempo, estructurar mejor la tarea, apoyarse en la web para buscar información actualizada y revisar sus propios resultados antes de entregar la imagen. Y lo hemos probado, pidiéndole la imagen de dos personas caminando por la Gran Vía, en Madrid, a la altura de Cines Callao, y unos apuntes sobre actividades para realizar en España durante mayo. Se trata de las imágenes que podemos ver en la imagen de portada. Las claves. OpenAI habla de prototipado de juegos, storyboards, creatividades de marketing, cómics, gráficos sociales y otros materiales donde importan tanto el contenido como la forma. Para sostener esa ambición, la compañía dice haber mejorado en dos frentes delicados: el manejo de texto no latino, con avances especialmente en japonés, coreano, chino, hindi y bengalí, y la reproducción más fiel de estilos visuales muy marcados. También amplía los formatos posibles, con proporciones de hasta 3:1 y 1:3, resolución de hasta 2K y, en ciertos modos, la posibilidad de generar hasta diez imágenes dentro de una misma petición con continuidad entre personajes y objetos. El contexto competitivo. Este anuncio tampoco puede leerse como si OpenAI hubiese descubierto de repente un mercado nuevo. Midjourney ya se ha convertido en una referencia clara para trabajos con una fuerte carga artística, Nano Banana ha llamado la atención por su capacidad de edición conversacional y FLUX 2 se ha hecho fuerte en el fotorrealismo. Con ese tablero delante, la compañía parece buscar otro ángulo. Más que disputar cada terreno por separado, intenta presentar ChatGPT como un entorno donde la imagen no se genera de forma aislada, sino como parte de un flujo más amplio, algo que sobre el papel puede resultar atractivo si realmente cumple lo que promete. En Xataka Anthropic no ha subido el precio de Claude. Ha inventado algo mejor: la inflación de tokens Ya empieza a desplegarse: una de las claves del anuncio es que OpenAI asegura que el modelo no se queda en fase de escaparate, sino que empieza a llegar ya a producto. La compañía sitúa su despliegue en ChatGPT para todos los usuarios, incluidos Free y Go, y asocia los resultados más avanzados a Plus y Pro, según recoge también Engadget. Además, lo lleva a la API y a Codex, señal de que no quiere limitarlo al uso casual dentro del chat. Si su estrategia pasa por convertir la imagen en una herramienta de trabajo más, tenía sentido que el despliegue empezara precisamente por ahí. Imágenes | Xataka con ChatGPT Images 2.0 | OpenAI En Xataka | Amazon quiere salir ganador de la carrera IA a cualquier precio. Por eso ha invertido a la vez en Anthropic y OpenAI (function() { window._JS_MODULES = window._JS_MODULES || {}; var headElement = document.getElementsByTagName('head')[0]; if (_JS_MODULES.instagram) { var instagramScript = document.createElement('script'); instagramScript.src = 'https://platform.instagram.com/en_US/embeds.js'; instagramScript.async = true; instagramScript.defer = true; headElement.appendChild(instagramScript); } })(); - La noticia La IA ya sabía crear imágenes. OpenAI dice haber dado con la pieza que faltaba con el nuevo ChatGPT Images 2.0 fue publicada originalmente en Xataka por Javier Marquez .