Du lägger upp en podcast på YouTube och ett ljud som inte kan upptäckas för det mänskliga örat börjar spelas: de är instruktioner för dina AI-agenter
Du har en podcast eller YouTube-video som spelas upp hemma och utan att inse det börjar den spela upp ett ljud som inte går att upptäcka för dig, men som skickar kommandon till dina AI-assistenter. Assistenten börjar sedan dela känslig data med angriparen eller installerar skadlig programvara. Vi hade redan snabba injektionsattacker och nu kommer en ljudprompt injektion.
Experimentet. Det låter som science fiction, men det är fullt möjligt. Ett team av forskare från Kina och Singapore har upptäckt ett sätt att skapa skadliga ljud som kan "kapa" röst AI-modeller, vilket får dem att utföra kommandon utan att du vet eller kan stoppa dem.
På tal med IEEE Spectrum försäkrar studieledaren att "Det tar bara en halvtimme att träna denna signal och eftersom den är kontextoberoende kan den användas för att attackera en modell när du vill, oavsett vad användaren säger." Författarna testade denna teknik mot tretton AI-modeller, inklusive tjänster från Microsoft och Mistral. I testet lät de dessa modeller utföra känsliga sökningar, skicka e-postmeddelanden med användarinformation och ladda ner filer. De uppnådde en framgång på mellan 79 och 96 %.
I Engadget finns det en smyg metod för att sabotera AI. Det kallas "dataförgiftning" och det korrumperar modellerna inifrån Undetectable. LALMs (Large Audio Language Models) har en kritisk säkerhetsbrist.
Eftersom de tar emot instruktioner i ljudformat är det möjligt att injicera skadliga kommandon i manipulerade ljud. Det värsta av allt är att dessa ljud inte är röster med instruktioner, vilket skulle vara ganska lätt att upptäcka, utan de använder snarare en metod som kallas "convolutional mixing" som maskerar ljudet som ett naturligt reverb eller eko i rummet.
Varför det är viktigt. En attack av den här typen förändrar helt de försvar som vi har internaliserat (klicka inte på länkar, ladda inte ner saker, ge inte ut dina data...). Något så ofarligt som att spela en YouTube-video, en podcast eller titta på en TikTok i bakgrunden kan utlösa en attack utan att vi ens inser det.
Om vi dessutom tar hänsyn till att kraften hos AI-agenter, som den nyligen tillkännagivna Gemini Spark, är just att ha tillgång till hela vårt digitala liv, kan en attack av den här typen orsaka förödelse.
Kapar uppmärksamhet. Att förinstruera modellen med exempel på skadliga kommandon så att den ignorerar dem minskar knappt attackens framgång med dystra 7 %. På samma sätt, att be AI:n att "reflektera" över huruvida dess svar stämmer överens med vad användaren faktiskt har bett om, lyckas bara upptäcka 28% av attackerna.
Aktuella säkerhetsåtgärder är värdelösa eftersom det manipulerade ljudet kapar modellens matematiska "uppmärksamhet", förmår AI:n att utföra utdata med högt tillförlitlighet och gör det omöjligt att skilja mellan ett legitimt användarkommando och en motståndaresattack
Open source. Den "bra" delen är att denna typ av attack för närvarande endast har kunnat utföras med modeller med öppen vikt. Forskare har dock sett att när skadligt ljud har tränats kan det överföras till att bryta mot slutna modeller.
Som vi sa testade författarna det med tjänster från Mistral och Microsoft. För tillfället har Mistral inte kommenterat, men Microsoft skickade följande uttalande till IEEE Spectrum: Vi uppskattar forskarnas arbete med att fördjupa förståelsen för denna typ av teknik. Den här studien utvärderar modellens motståndskraft genom kontrollerade, direkta interaktioner med själva modellen, vilket hjälper till att definiera vår strategi för att bygga motståndskraft.
I praktiken är AI-modeller ofta integrerade i användarapplikationer, och vi förser utvecklare med verktyg och vägledning som de kan använda för att implementera ytterligare skyddslager för att skydda användarna. Bild | Yassine Ait Tahit, Unsplash i Xataka | De mest använda lösenorden i Spanien hackas på några sekunder: om ditt finns på den här listan har du ett problem
Originalkälla
Publicerad av Xataka
27 maj 2026, 13:00
Denna artikel har översatts automatiskt från spanska. Klicka på länken ovan för att läsa originaltexten.
Visa originaltext (spanska)
Rubrik
Pones un podcast en YouTube y un sonido indetectable al oído humano comienza a sonar: son instrucciones para tus agentes IA
Beskrivning
Tienes puesto un podcast o un vídeo de YouTube en casa y, sin darte cuenta, empieza a reproducir un sonido indetectable para ti, pero que está enviando órdenes a tus asistentes de IA. Acto seguido, el asistente empieza a compartir datos sensibles con el atacante o te instala un malware. Ya teníamos los ataques de inyección de prompts y ahora llega la inyección de prompts de sonido. El experimento. Suena a ciencia ficción, pero es perfectamente posible. Un equipo de investigadores de China y Singapur han descubierto una forma de crear sonidos maliciosos que pueden “secuestrar” modelos de IA de voz, haciendo que ejecuten órdenes sin que te enteres ni que puedas pararlo. En declaraciones a IEEE Spectrum, el líder del estudio asegura que “Solo se necesita media hora para entrenar esta señal y, dado que es independiente del contexto, se puede usar para atacar un modelo cuando se quiera, sin importar lo que diga el usuario”. Los autores probaron esta técnica contra trece modelos IA, entre los que había servicios de Microsoft y Mistral. En la prueba hicieron que estos modelos hicieran búsquedas sensibles, enviar correos electrónicos con información del usuario y descargar archivos. Lograron una tasa de éxito de entre el 79 y el 96%. En Xataka Hay un método sigiloso para sabotear la IA. Se llama 'data poisoning' y corrompe los modelos desde dentro Indetectable. Los LALM (grandes modelos de audio-lenguaje) tienen un fallo de seguridad crítico. Dado que reciben las instrucciones en formato audio, es posible inyectar órdenes maliciosas en sonidos manipulados. Lo peor de todo es que estos sonidos no son voces con instrucciones, lo cual sería bastante fácil de detectar, sino que usan un método llamado “mezcla convolucional” que hace que el sonido se haga pasar por una reverberación o eco natural de la habitación. Por qué es importante. Un ataque de este tipo cambia por completo las defensas que tenemos interiorizadas (no pulses en enlaces, no descargues cosas, no des tus datos…). Algo tan inofensivo como ponernos de fondo un vídeo de YouTube, un podcast o estar viendo un TikTok puede desencadenar un ataque sin que ni siquiera nos percatemos. Si además tenemos en cuenta que el poder de los agentes de IA, como el recién anunciado Gemini Spark, es precisamente tener acceso a toda nuestra vida digital, un ataque de este tipo puede causar estragos. Secuestrando la atención. Darle instrucciones previas al modelo con ejemplos de comandos maliciosos para que los ignore apenas reduce el éxito del ataque en un triste 7%. Del mismo modo, pedirle a la IA que "reflexione" sobre si su respuesta coincide con lo que el usuario realmente ha pedido solo logra detectar el 28% de los ataques. Las medidas de seguridad actuales no sirven porque el audio manipulado secuestra la "atención" matemática del modelo, induciendo a la IA a ejecutar salidas con alta confianza y haciéndole imposible distinguir entre una orden legítima del usuario y un ataque adversario {"videoId":"x9s2kkq","autoplay":false,"title":"CONTRASEÑAS FUERA! 7 GESTORES DE CONTRASEÑAS para hacerte LA VIDA MÁS FÁCIL", "tag":"contraseñas", "duration":"486"} Open source. La parte “buena” es que de momento este tipo de ataque solamente se ha podido llevar a cabo con modelos de pesos abiertos. Sin embargo, los investigadores han visto que una vez entrenado el audio malicioso, es posible transferirlo para vulnerar modelos cerrados. Como decíamos, los autores lo pusieron a prueba con servicios de Mistral y Microsoft. De momento Mistral no se ha pronunciado, pero Microsoft envió el siguiente comunicado a IEEE Spectrum: Agradecemos el trabajo de los investigadores para profundizar en la comprensión de este tipo de técnica. Este estudio evalúa la resiliencia del modelo mediante interacciones controladas y directas con el propio modelo, lo que contribuye a definir nuestro enfoque para desarrollar dicha resiliencia. En la práctica, los modelos de IA suelen integrarse en aplicaciones de usuario, y ofrecemos a los desarrolladores herramientas y orientación que pueden utilizar para implementar capas adicionales de protección que ayuden a salvaguardar a los usuarios. Imagen | Yassine Ait Tahit, Unsplash En Xataka | Las contraseñas más utilizadas en España se hackean en segundos: si la tuya está en esta lista, tienes un problema (function() { window._JS_MODULES = window._JS_MODULES || {}; var headElement = document.getElementsByTagName('head')[0]; if (_JS_MODULES.instagram) { var instagramScript = document.createElement('script'); instagramScript.src = 'https://platform.instagram.com/en_US/embeds.js'; instagramScript.async = true; instagramScript.defer = true; headElement.appendChild(instagramScript); } })(); - La noticia Pones un podcast en YouTube y un sonido indetectable al oído humano comienza a sonar: son instrucciones para tus agentes IA fue publicada originalmente en Xataka por Amparo Babiloni .