Radiologist and AI system struggling to identify deepfake X-ray images in a medical study.

Studie visar att radiologer och AI-modeller har svårt att identifiera AI-genererade ”deepfake”-röntgenbilder

26 mars 2026

Rapporterad av AI

Bild genererad av AI

Faktagranskad

En studie publicerad den 24 mars 2026 i Radiology rapporterar att AI-genererade ”deepfake”-röntgenbilder kan vara tillräckligt övertygande för att vilseleda både radiologer och flera multimodala AI-system. Vid testning ökade radiologernas genomsnittliga träffsäkerhet från 41 % när de inte informerades om att förfalskningar ingick, till 75 % när de förvarnades, vilket belyser potentiella risker för säkerheten inom medicinsk bildbehandling och kliniskt beslutsfattande.

Radiologer från 12 institutioner i sex länder – USA, Frankrike, Tyskland, Turkiet, Storbritannien och Förenade Arabemiraten – deltog i bildgranskningstester som beskrivs i en studie publicerad den 24 mars 2026 i Radiology, tidskriften för Radiological Society of North America.

Studien inkluderade 17 radiologer med erfarenhet från nybörjare till läkare med upp till 40 års yrkesverksamhet. De utvärderade 264 röntgenbilder uppdelade jämnt mellan verkliga skanningar och AI-genererade bilder.

Deltagarna granskade två bilduppsättningar utan överlappning. En uppsättning blandade verkliga bilder med AI-genererade röntgenbilder skapade med ChatGPT och inkluderade röntgenbilder från olika delar av kroppen. Den andra uppsättningen fokuserade på bröströntgen, där hälften var verkliga och hälften genererade med RoentGen, en öppen diffusionsmodell utvecklad av forskare vid Stanford Medicine.

När radiologerna inte fick veta att förfalskade bilder ingick, identifierade de de AI-genererade röntgenbilderna i 41 % av fallen. Efter att ha informerats om att syntetiska bilder förekom, ökade deras genomsnittliga träffsäkerhet i att skilja verkliga från falska bilder till 75 %.

Prestationen varierade kraftigt mellan individerna. Radiologerna identifierade korrekt mellan 58 % och 92 % av de ChatGPT-genererade bilderna. För RoentGen-genererade bröströntgenbilder varierade radiologernas träffsäkerhet från 62 % till 78 %.

Forskarna testade också flera multimodala stora språkmodeller på samma uppgift. Fyra system – GPT-4o och GPT-5 från OpenAI, Gemini 2.5 Pro från Google och Llama 4 Maverick från Meta – uppnådde träffsäkerhet mellan 57 % och 85 %. Inte ens ChatGPT-4o, som användes för att generera några av deepfake-bilderna, upptäckte alla, även om den presterade bättre än de andra modellerna.

Studien fann inget samband mellan antalet års erfarenhet inom radiologi och förmågan att identifiera falska röntgenbilder, men rapporterade att muskuloskeletala radiologer presterade betydligt bättre än andra subspecialister.

Huvudförfattaren Mickael Tordjman, M.D., postdoktor vid Icahn School of Medicine vid Mount Sinai i New York, menar att resultaten pekar på sårbarheter inom både juridik och cybersäkerhet. ”Detta skapar en högriskutsatt sårbarhet för bedrägliga rättstvister om exempelvis en fabricerad fraktur skulle vara omöjlig att skilja från en verklig”, sade han, och tillade att det finns ”en betydande cybersäkerhetsrisk om hackare skulle få tillgång till ett sjukhus nätverk och injicera syntetiska bilder för att manipulera patientdiagnoser eller orsaka omfattande kliniskt kaos genom att undergräva den grundläggande tillförlitligheten i den digitala patientjournalen.”

Tordjman beskrev även visuella mönster som kan förekomma i syntetiska bilder och menar att medicinska deepfake-bilder kan se ”för perfekta” ut, med överdrivet jämna ben, onaturligt raka ryggrader, överdrivet symmetriska lungor, alltför enhetliga mönster i blodkärl och ovanligt rena frakturer.

För att minska risken för manipulation och felaktig attribuering rekommenderade forskarna säkerhetsåtgärder, inklusive osynliga vattenstämplar inbäddade direkt i bilderna och kryptografiska signaturer kopplade till röntgensjuksköterskan vid tidpunkten för bildtagningen. De uppgav även att de har släppt ett kurerat deepfake-dataset med interaktiva frågesporter avsedda för utbildning och medvetandegörande.

”Vi ser potentiellt bara toppen av isberget”, sa Tordjman och argumenterade för att AI-genererade 3D-bilder som CT och MRI kan bli nästa steg, och att verktyg för detektering samt utbildningsresurser bör utvecklas tidigt.

Vad folk säger

Diskussioner på X uttrycker oro över en studie som visar att radiologer endast upptäcker AI-genererade deepfake-röntgenbilder med 41 % träffsäkerhet utan förvarning, vilket förbättras till 75 % vid varning, medan AI-modeller också sviktar. Reaktionerna lyfter fram risker för kliniska beslut, forskningsintegritet, försäkringar och cybersäkerhet. Experter och publikationer efterlyser träning i att upptäcka förfalskningar samt framtagning av datamängder. Stämningarna präglas av oro, rädsla för urholkat förtroende och krav på säkerhetsåtgärder.

AI-generated “deepfake” X-ray images can be difficult to distinguish from authentic images, even for experienced radiologists and advanced multimodal AI models, according to a new study published in @radiology_rsna. Read the full story: https://t.co/87pXCixMZe #MedicalImaging… pic.twitter.com/yCv72Oz2aH
— RSNA (@RSNA) 24 mars 2026

A new study published bears disturbing news: Radiologists are not able to easily distinguish AI-generated “deepfake” x-ray images from authentic ones #radiology #medicalAI #xray @IcahnMountSinai https://t.co/p7C3IrMetc https://t.co/p7C3IrMetc
— AuntMinnie.com (@AuntMinnie) 24 mars 2026

The majority of radiologists and 4 LLMs were unable to differentiate synthetic, deepfake scans from real oneshttps://t.co/aAJhP0cpfG @RSNA pic.twitter.com/q0wdIKicK6
— Eric Topol (@EricTopol) 24 mars 2026

Can you spot a deepfake X-ray? Neither can your radiologist https://t.co/bI9ETj07k1
— STAT (@statnews) 24 mars 2026

Can you spot a deepfake X‑ray? 🧠🩻

Radiologists, and AI, struggled to tell ChatGPT‑generated radiographs from real ones. No model caught them all.

As synthetic imaging advances, deepfake detection training is critical.

🔍 Explore the dataset:https://t.co/soACrmSPRh pic.twitter.com/4Uk6BseWS9
— @RadiologyEditor (@RadiologyEditor) 25 mars 2026

Studie visar att radiologer och AI-modeller har svårt att identifiera AI-genererade ”deepfake”-röntgenbilder

Vad folk säger

Relaterade artiklar

Deezer reports 44% of music uploads are now AI-generated amid rising fraud concerns

Generative AI outperforms human teams in analyzing medical data

UK study reveals AI agents evading safeguards in user interactions

Kobe University team reports AI can flag acromegaly from privacy-conscious hand photos

Top AI coding assistants fail one in four tasks

ZDF director calls for transparency after AI scandal

AI models fail to profit from Premier League betting in new study

Japan shows high AI trust despite low workplace use

Study shows AI can deanonymize online users from posts

AIs frequently recommend nuclear strikes in war simulations

OpenAI and Google bolster AI safeguards after Grok image scandal

Denna webbplats använder cookies