Teknik • 5 tim sedan

Det räcker inte längre att räkna fingrar för att veta om en bild är gjord med AI. Nu måste du lära dig teknisk ritning

Att upptäcka bilder som genererats av artificiell intelligens har blivit ett katt- och råttspel. Och det värsta är att det kommer att bli värre. Ett tag började vi alla uppmärksamma händerna och antalet fingrar som AI representerade i bilder av människor genom modellernas diffusionsmekanismer.

För några år sedan var det uppenbart att se när en bild skapades av AI. Nu, med bild- och videomodeller som blir mer exakta, är uppgiften mycket mer komplex. Den goda nyheten är att det fortfarande finns sätt att upptäcka om en bild har genererats av AI, även om det snart kan ändras igen när man ser den takt som modellerna avancerar med.

Att upptäcka dem är mindre intuitivt än tidigare, men var bara uppmärksam på geometri, skuggor och perspektiv. I grund och botten teknisk ritning.

Vem ligger bakom denna idé. Hany Farid, specialist vid University of California i Berkeley och en av världens ledande experter inom bildkriminalteknik, har ägnat mer än två decennier åt att avgöra om ett foto eller en video har manipulerats. Santiago Lyon, tidigare chef för fotografi för Associated Press och som idag arbetar med digital säkerhet på Adobe, beskriver Farid i en Science-rapport som "en sorts dekan för digital forensics", just för att han har hållit på så länge.

Farid var med och grundade denna disciplin för mer än 20 år sedan och säger att AI är den största utmaningen han har ställts inför. Farid exemplifierar sin metod med denna bild. Om vi drar en linje mot horisonten mellan plattorna och golvlisterna ser vi att linjerna inte konvergerar vid en enda punkt, vilket talar om för oss att bilden genereras av AI.

Det är svårt att veta vad som är sant och inte. Vi förlorar förmågan att lita på det vi ser. Kombinationen av generativ AI, som kan skapa bilder nästan omöjliga att skilja från verkligheten, och ljummen reglering på sociala nätverk gör att bluffar till slut förstärks, vilket gör det allt svårare att veta om det vi ser är verkligt eller inte.

Och i många fall bryr vi oss inte ens. Farid talar direkt om ett "globalt krig för sanningen", med konsekvenser för människor, institutioner och demokratier. I ett TED-talk sa han att han tror att andelen falska bilder på internet är nära 50%.

I Xataka Historic Sorpasso i Silicon Valley: Anthropic har precis överträffat OpenAI som den mest värdefulla AI-startupen i världen. Det är inte längre användbart att fokusera på pixlar. En av de första teknikerna som Farid utvecklade var baserad på "bruset" från riktiga kameror.

Ett autentiskt foto skapas från ljus som träffar en elektronisk sensor; En AI-bild, å andra sidan, kommer från en statistisk process som omvandlar slumpmässigt brus till en bild som överensstämmer med den efterfrågade texten. Detta mycket olika ursprung lämnade spår som kan detekteras på pixelnivå. Problemet är att generatorer har lärt sig att imitera även dessa brister, sensorbrus och linsartefakter.

Som Science-rapporten förklarar fungerar många av Farids banbrytande metoder baserade på statistiska relationer mellan pixlar "inte längre bra, om alls", eftersom AI-bilder skapas från grunden istället för att redigeras över ett tidigare foto.

Teknisk ritning. AI, säger Farid, "kan inte fysik, kan inte geometri och gör alla typer av grymheter." Och det är där den tekniska ritningen kommer in. Enligt Farid är det de här tre fronterna som vi måste undersöka: Flyktpunkter.

I den verkliga världen konvergerar parallella linjer (tågspår, golvplattor, sidorna på en vägg) mot en enda punkt när de rör sig längre isär. Det är en princip som konstnärer har känt till i århundraden, men som AI ignorerar eftersom den inte förstår det tredimensionella rummet. Om dessa linjer inte möts vid en enda punkt är scenen fysiskt omöjlig.

Skuggor. Solen är så långt borta att dess strålar når jorden praktiskt taget parallellt. Det betyder att linjerna som förbinder varje objekt med skuggan det kastar också ska skära varandra i en punkt som överensstämmer med ljusets position.

I många AI-genererade bilder kommer dessa linjer inte ens i närheten av att korsas.

Reflektioner. Samma princip gäller för speglar, eftersom linjer som förbinder en punkt på ett objekt till dess reflektion bör konvergera vid en försvinnande punkt. När de inte gör det ges bilden bort.

Samma sak händer i den här bilden. Om vi ritar en linje som går genom både hörn av varje kub och hörn av dess projicerade skugga, ser vi att de inte konvergerar vid en enda punkt Ansamling av ledtrådar. Ingen teknik är idiotsäker på egen hand, och Farid insisterar på att metoden består i att samla ledtrådar, som i en undersökning.

I sitt TED-talk exemplifierade han detta med en bild gjord med AI av flera soldater som ser fram emot. I den upptäckte han det misstänkta mönstret i bruset, frånvaron av en sammanhängande försvinnande punkt på väggarna och skuggor som inte korsade varandra. Tre anomalier som gav ledtrådar om att bilden inte var verklig.

Den underliggande anledningen till att detta tillvägagångssätt står sig bättre över tid är att AI-företag inte vill lura kriminaltekniska experter som Farid, utan snarare den genomsnittliga användaren, eftersom vi ligger på en mycket lägre nivå. Som han säger, "det visuella systemet förlåter alla typer av nonsens på bilder eftersom det inte bryr sig." I den här bilden, om vi ritar en linje från en punkt i figuren, till samma punkt som reflekteras i spegeln, ser vi att linjerna inte konvergerar vid en enda punkt.

Tvivel och gränser. Alla på området delar inte samma optimism. Vissa forskare bekräftar att varje detektionsteknik har en mycket kort "användbar livslängd", ibland några månader, eftersom AI förbättras mycket snabbt.

Faktum är att de berömda misstagen på sexfingrade händer försvann i en blixt. Farid är dock skeptisk till att AI någonsin kommer att bemästra komplex fysik i den verkliga världen, som en explosion, för att simulera det är djävulskt svårt och företag har lite incitament att gå så långt. Trots det erkänner han att han får ett dussin e-postmeddelanden varje dag från journalister runt om i världen som ber om verifieringar, när det för år sedan var en eller två förfrågningar i månaden.

Lösningar. Farid säger att de kriminaltekniska verktyg han utvecklar med sitt team görs tillgängliga för journalister, institutioner och domstolar, vilket indirekt skyddar alla. Det finns också en internationell standard för "innehållsreferenser" som försöker autentisera bildernas ursprung vid tidpunkten för skapandet.

Det kommer inte att lösa alla problem, men det kommer att vara en del av lösningen. Han varnade också i sitt föredrag för att sociala nätverk inte är en plats för information, eftersom de är "för fulla av lögner" och "AI-slask" för att vara tillförlitliga. Omslagsbild | chaindrop och Sora In Xataka | Smarta glasögon för polisen verkade som science fiction.

Vissa kinesiska agenter har redan börjat använda dem

Det räcker inte längre att räkna fingrar för att veta om en bild är gjord med AI. Nu måste du lära dig teknisk ritning

Originalkälla

Publicerad av Xataka

30 maj 2026, 19:30

Läs original

Denna artikel har översatts automatiskt från spanska. Klicka på länken ovan för att läsa originaltexten.

Visa originaltext (spanska)

Rubrik

Ya no vale con contar dedos para saber si una imagen está hecha con IA. Ahora hay que aprender dibujo técnico

Beskrivning

Detectar imágenes generadas por inteligencia artificial se ha convertido en un juego del gato y el ratón. Y lo peor es que va a ir a más. Durante un tiempo, todos nos empezábamos a fijar en las manos y en la cantidad de dedos que representaba la IA en las imágenes de personas a través de los mecanismos de difusión de los modelos. Hace unos pocos años era evidente ver cuándo una imagen estaba creada por IA. Ahora, con modelos de imagen y vídeo cada vez más precisos, la tarea es mucho más compleja. La buena noticia es que todavía hay maneras de detectar si una imagen ha sido generada por IA, aunque viendo el ritmo al que avanzan los modelos, posiblemente esto vuelva a cambiar dentro de muy poco. Detectarlas es menos intuitivo que antes, pero basta con prestar atención a la geometría, las sombras y la perspectiva. Básicamente, dibujo técnico. Quién está detrás de esta idea. Hany Farid, especialista de la Universidad de California en Berkeley y uno de los mayores expertos mundiales en análisis forense de imágenes, lleva más de dos décadas dedicado a determinar si una foto o un vídeo han sido manipulados. Santiago Lyon, exdirector de fotografía de Associated Press y que hoy trabaja en seguridad digital en Adobe, describe a Farid en un reportaje de Science como "una especie de decano del análisis forense digital", precisamente por llevar tanto tiempo en ello. Farid ayudó a fundar esta disciplina hace más de 20 años, y asegura que la IA es el mayor reto al que se ha enfrentado. Farid ejemplifica su método con esta imagen. Si trazamos una línea hacia el horizonte entre las baldosas y los rodapiés, vemos que las líneas no convergen en un único punto, lo que nos indica que la imagen está generada por IA Cuesta saber lo que es verdad y lo que no. Estamos perdiendo la capacidad de fiarnos de lo que vemos. La combinación de IA generativa, capaz de crear imágenes casi indistinguibles de la realidad, y una tibia regulación en redes sociales hace que los bulos se acaben amplificando, siendo cada vez más difícil saber si lo que estamos viendo es real o no. Y en muchos casos, igual ni nos importa. Farid habla directamente de una "guerra global por la verdad", con consecuencias para las personas, las instituciones y las democracias. En una charla de TED contaba que cree que el porcentaje de imágenes falsas en internet se acerca al 50%. En Xataka Sorpasso histórico en Silicon Valley: Anthropic acaba de superar a OpenAI como la startup de IA más valiosa del mundo Ya no sirve fijarse en los píxeles. Una de las primeras técnicas que desarrolló Farid se basaba en el "ruido" que dejan las cámaras reales. Una foto auténtica nace de la luz que golpea un sensor electrónico; una imagen de IA, en cambio, surge de un proceso estadístico que convierte ruido aleatorio en una imagen coherente con el texto que se le pide. Ese origen tan distinto dejaba huellas detectables a nivel de píxel. El problema es que los generadores han aprendido a imitar incluso esas imperfecciones, el ruido del sensor y los artefactos de lente. Como explica el reportaje de Science, muchos de los métodos pioneros de Farid basados en relaciones estadísticas entre píxeles "ya no funcionan bien, si es que funcionan", porque las imágenes de IA se crean desde cero en lugar de editarse sobre una foto previa. {"videoId":"xa5no8w","autoplay":false,"title":"Usa Claude mejor que el 90% de la gente", "tag":"", "duration":"595"} Dibujo técnico. La IA, dice Farid, "no sabe de física, no sabe de geometría, y hace todo tipo de barbaridades". Y ahí es donde entra el dibujo técnico. Según Farid, estos son los tres frentes que debemos examinar: Puntos de fuga. En el mundo real, las líneas paralelas (las vías del tren, los azulejos del suelo, los lados de una pared) convergen hacia un único punto a medida que se alejan. Es un principio que los artistas conocen desde hace siglos, pero que la IA ignora porque no entiende el espacio tridimensional. Si esas líneas no se encuentran en un solo punto, la escena es físicamente imposible.Sombras. El Sol está tan lejos que sus rayos llegan a la Tierra prácticamente paralelos. Eso significa que las líneas que unen cada objeto con la sombra que proyecta deberían cruzarse también en un punto coherente con la posición de la luz. En muchas imágenes generadas por IA, esas líneas ni se acercan a cruzarse.Reflejos. El mismo principio se aplica a los espejos, ya que las líneas que conectan un punto de un objeto con su reflejo deberían converger en un punto de fuga. Cuando no lo hacen, la imagen se delata. Lo mismo ocurre en esta imagen. Si trazamos una línea que pase tanto por los vértices de cada cubo como por los vértices de su sombra proyectada, vemos que tampoco convergen en un único punto Acumulación de pistas. Ninguna técnica es infalible por sí sola, y Farid insiste en que el método consiste en acumular pistas, como en una investigación. En su charla TED lo ejemplificaba con una imagen hecha con IA de varios soldados mirando al frente. En ella detectó el patrón sospechoso en el ruido, la ausencia de un punto de fuga coherente en las paredes y unas sombras que no intersecaban. Tres anomalías que daban pistas de que la imagen no era real. La razón de fondo por la que este enfoque resiste mejor el paso del tiempo es que las empresas de IA no buscan engañar a expertos forenses como Farid, sino al usuario medio, ya que estamos en un listón mucho más bajo. Como él mismo dice, "el sistema visual perdona todo tipo de disparates en las fotos porque no le importan". En esta imagen, si trazamos una línea desde un punto de la figura, al mismo punto reflejado en el espejo, vemos que las líneas tampoco convergen en un único punto Las dudas y los límites. No todos en el campo comparten el mismo optimismo. Algunos investigadores se reafirman en que cada técnica de detección tiene una "vida útil" cortísima, a veces de pocos meses, porque la IA mejora muy rápido. De hecho, los famosos errores en las manos con seis dedos desaparecieron en un suspiro. Farid, sin embargo, se muestra escéptico ante la idea de que la IA llegue a dominar la física compleja del mundo real, como una explosión, porque simularla es endiabladamente difícil y las empresas tienen pocos incentivos para llegar tan lejos. Aun así, reconoce que recibe cada día una decena de correos de periodistas de todo el mundo pidiéndole verificaciones, cuando hace años eran una o dos peticiones al mes. Soluciones. Farid cuenta que las herramientas forenses que desarrolla con su equipo se están poniendo a disposición de periodistas, instituciones y tribunales, lo que indirectamente protege a todos. Existe además un estándar internacional de "credenciales de contenido" que busca autenticar el origen de las imágenes en el momento de su creación. No va a resolver todos los problemas, pero será parte de la solución. También advertía en su charla que las redes sociales no son un lugar para informarse, porque están “demasiado plagadas de mentiras” y de "AI slop" (basura generada por IA) como para ser fiables. Imagen de portada | chaindrop y Sora En Xataka | Las gafas inteligentes para policías parecían ciencia ficción. Algunos agentes chinos ya han empezado a utilizarlas (function() { window._JS_MODULES = window._JS_MODULES || {}; var headElement = document.getElementsByTagName('head')[0]; if (_JS_MODULES.instagram) { var instagramScript = document.createElement('script'); instagramScript.src = 'https://platform.instagram.com/en_US/embeds.js'; instagramScript.async = true; instagramScript.defer = true; headElement.appendChild(instagramScript); } })(); - La noticia Ya no vale con contar dedos para saber si una imagen está hecha con IA. Ahora hay que aprender dibujo técnico fue publicada originalmente en Xataka por Antonio Vallejo .

2 visningar

Dela:

Det räcker inte längre att räkna fingrar för att veta om en bild är gjord med AI. Nu måste du lära dig teknisk ritning

Originalkälla

Rubrik

Beskrivning

Fler nyheter

Under andra världskriget begravdes en klocka för att skydda den. En bonde hittade den 2024

Trump kommer att ha "tålamod" för att uppnå en pakt som förhindrar ett kärnvapen Iran

Fler nyheter i Teknik

Vetenskapen har mätt hur middagen påverkar sömnen och resultatet förklarar varför du vaknar med sockersug

Många europeiska arbetstagare säger att distansarbete tar bort deras möjligheter: deras chefer främjar människor de ser

Under andra världskriget begravdes en klocka för att skydda den. En bonde hittade den 2024

Vi använder cookies