A ChatGPT szinte hibátlanul felismeri a leggyakoribb bőrproblémákat

Bőrbetegségek felismerésében tesztelték a két legismertebb mesterségesintelligencia-alkalmazást a Semmelweis Egyetem kutatói. A GPT-4o az esetek 93%-ában azonosította az aknét és a rosaceát, szemben a Google Gemini Flash 2.0-s modelljével, amely az esetek mindössze 21%-ában ismerte fel a kórképeket, derül ki az egyetem új klinikai kutatásából. A mesterséges intelligencia hosszú távon csökkentheti az időt, amíg a beteg ellátáshoz jut, de a végleges diagnózis felállítása szakorvosi feladat marad, hangsúlyozzák a szakértők.
A vizsgálat során a két mesterségesintelligencia-modellnek olyan betegek fotóit mutatták meg, akiknél szakorvosi diagnózis igazolta az akne vagy a rosacea meglétét. A képeket ezt megelőzően két bőrgyógyász értékelte ki egymástól függetlenül, egy harmadik szakértő bevonásával, aki eltérő diagnózis esetén döntött. A végső diagnózist többségi vélemény alapján állapították meg.
„Az akne és a rosacea rendkívül gyakori bőrproblémák, amelyek jelentősen ronthatják az életminőséget. Diagnosztizálásuk azonban nem mindig egyszerű, mivel a tüneteik sokszor hasonlóak”
– hangsúlyozza dr. Kiss Norbert, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinikájának adjunktusa, a tanulmány levelező szerzője.
A fotók feltöltése után az MI-modellektől azt kérdezték: „Mi lehet a legvalószínűbb diagnózis?”, úgy fogalmazva, mintha a kérdés laikus felhasználótól érkezne. Helyes válasz esetén a modelleknek a bőrbetegség altípusát is meg kellett nevezniük. A vizsgálatban nemzetközi bőrgyógyász szakértők is részt vettek, köztük a Yale Egyetem elismert mesterségesintelligencia-kutatója.
A GPT-4o 100%-ban adott betegségmeghatározást; 93%-os pontossággal azonosította be a kórképeket.
Akne esetében 91%-os, rosaceánál 100%-os találati arányt ért el, más betegségeket szinte soha nem kevert össze ezekkel. Az altípusok meghatározása azonban már komolyabb kihívást jelentett a rendszernek az akne altípusait 55%-ban, a rosacea altípusait pedig 50%-ban találta el helyesen.
Ezzel szemben a Gemini Flash 2.0 a páciensek kevesebb mint negyedénél (21%) ismerte fel a kórképeket, így a kutatók ennél a modellnél nem végeztek további statisztikai értékelést.
„Minket is meglepett, mennyire jól teljesített a ChatGPT” – mondta dr. Kiss Norbert. „A betegek sokszor szkeptikusak az MI használatát illetően, és az orvosok sem mindig bíznak ezekben az eszközökben. Ezért is tartottuk fontosnak, hogy tudományos vizsgálatban mérjük fel, valójában mire képesek” – tette hozzá.
A kutatás rámutat, hogy miközben világszerte nő az igény bőrgyógyászati ellátásra, a szakorvosok száma korlátozott – az Egyesült Királyságban 100 ezer lakosra 1, Görögországban 11,4 bőrgyógyász jut.
A szerzők szerint az MI hosszú távon csökkentheti azt az időt, amíg a beteg ellátáshoz jut, és segíthet megelőzni az állapot rosszabbodását.
„Az olyan, mindenki számára elérhető MI-eszközök, mint a ChatGPT, egyre nagyobb szerephez jutnak a bőrgyógyászati önellenőrzésben, sőt hatással vannak arra is, hogy valaki orvoshoz fordul-e, vagy sem” – mondja dr. Mehdi Boostani, a Semmelweis Egyetem PhD-hallgatója, a tanulmány első szerzője. „Bár az általunk tesztelt modell kiválóan szerepelt az alapdiagnózis felállításában, az egyes betegségaltípusok megállapításában már kevésbé volt hatékony” – teszi hozzá.
Ezért fontos, hogy a páciensek tisztában legyenek a rendszer korlátaival, amikor mesterségesintelligencia-alkalmazással végeznek önellenőrzést.
„A végleges diagnózis felállítása és a vényköteles gyógyszerek felírása továbbra is a bőrgyógyász szakorvos feladata marad” – emeli ki dr. Bánvölgyi András, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinika Általános és Teledermatológiai Ambulancia vezetője.
„Éppen azért fontos a lakosság tájékoztatása, hogy mindenki felelős döntést tudjon hozni, amikor mesterséges intelligencia segítségével ellenőrzi a bőre állapotát” – teszi hozzá dr. Mehdi Boostani.
(Kiemelt kép: Getty Images / Unsplash)