Generativ AI överträffar mänskliga team i analys av medicinska data

Forskare vid UC San Francisco och Wayne State University har funnit att generativ AI kan bearbeta komplexa medicinska dataset snabbare än traditionella mänskliga team, ibland med starkare resultat. Studien fokuserade på att förutsäga för tidig födsel med data från över 1 000 gravida kvinnor. Denna metod minskade analys tiden från månader till minuter i vissa fall.

Forskare vid UC San Francisco och Wayne State University genomförde ett verklighetsbaserat test av generativ AI inom hälsoforskning och jämförde dess prestanda med mänskliga experter. Uppgiften handlade om att förutsäga för tidig födsel, en ledande orsak till nyföddadödlighet i USA, där cirka 1 000 barn föds för tidigt varje dag. Forskarnas använde mikrobiomdata samlade från cirka 1 200 gravida kvinnor från nio studier, hämtade från March of Dimes Preterm Birth Data Repository. För att utvärdera AI:s förmågor använde teamet dataset från DREAMs crowdsourcingtävling, som tidigare involverade över 100 globala team som utvecklade maskininlärningsmodeller för risker vid för tidig födsel och uppskattning av graviditetsålder. Mänskliga deltagare i den tävlingen tog cirka tre månader på att bygga modeller, följt av nästan två år för att sammanställa och publicera resultaten. I den nya studien gavs åtta AI-chatbots naturliga språkprompts för att generera analytisk kod utan direkt mänsklig programmering. Endast fyra av systemen producerade användbar kod, men de som lyckades matchade eller överträffade mänskliga teamens prestanda. Till exempel utvecklade ett juniorpar – UCSF:s masterstudent Reuben Sarwal och en gymnasieelev Victor Tarca – prediktionsmodeller med AI-stöd och genererade fungerande kod på minuter istället för de timmar eller dagar som erfarna programmerare kräver. Hela processen, från idé till tidskriftsinlämning, tog bara sex månader. «Dessa AI-verktyg kan lindra en av de största flaskhalsarna i datavetenskap: att bygga våra analysflöden», säger Marina Sirota, PhD, professor i pediatrik vid UCSF och huvudforskare vid March of Dimes Prematurity Research Center. Medförfattare Adi L. Tarca, PhD, från Wayne State University, tillade: «Tack vare generativ AI behöver forskare med begränsad bakgrund i datavetenskap inte alltid bilda breda samarbeten eller spendera timmar på att felsöka kod. De kan fokusera på att besvara de rätta biomedicinska frågorna.» Studien, skriven av Sirota och Tarca, betonar att AI kräver mänsklig översyn för att undvika vilseledande resultat. Den publicerades i Cell Reports Medicine den 17 februari och belyser potentialen för snabbare framsteg i förståelsen av riskfaktorer för för tidig födsel.

Relaterade artiklar

Arbetare som får betalt för att träna avancerade AI-modeller förlitar sig i allt högre grad på chattbotar som ChatGPT för att generera de krävda konversationerna och testerna. Denna genväg, som beskrivs som utbredd av flera källor, riskerar att försämra kvaliteten på framtida modeller genom rekursiv träning på syntetisk data.

Rapporterad av AI

AI-system från ledande företag som Google, OpenAI, Anthropic och xAI förlorade pengar när de satsade på fotbollsmatcher under en simulerad Premier League-säsong 2023–24, enligt en rapport från startup-företaget General Reasoning. Studien, som kallas KellyBench, testade åtta toppmodeller på deras förmåga att hantera risker och anpassa sig över tid. Anthropics Claude Opus 4.6 presterade bäst med en genomsnittlig förlust på 11 procent, medan xAI:s Grok 4.20 misslyckades upprepade gånger.

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj