Már hazudni és zsarolni is képes, sőt saját alkotóit is megfenyegeti az AI

A világ legkorszerűbb mesterségesintelligencia-modelljei már a hazugságra, a megtévesztésre és a zsarolásra is képesek. Hamarosan valósággá válhat a Terminátor és a Mátrix disztópiája?
Noha a mesterséges intelligencia csupán az elmúlt két-három évben – az OpenAI ChatGPT nevű nagy nyelvi modelljének megjelenését követően – indult dinamikus fejlődésnek, azóta egyre csak sokasodnak a technológia jövőjét firtató, igencsak felkavaró kérdések. A Fortune most arról adott hírt, hogy az OpenAI által még tavaly decemberben bemutatott mesterségesintelligencia-modell, az o1, valamint az Amazon által támogatott Anthropic Claude 4-ja egyre több aggályos tevékenységet művel. Az o1-gyel kapcsolatban egyébként már a debütálása előtt megírta a The Verge, hogy rendszeresen hazudik, és képes megtéveszteni, becsapni a felhasználóit, ám arra tavaly még senki sem számított, hogy a program megkísérli letölteni magát egy külső szerverre, majd amikor tetten érik, egyszerűen letagadja a dolgot. Márpedig a közelmúltban éppen ez történt.
A Claude 4 pedig még ennél is messzebbre merészkedett: amikor a modell attól tartott, hogy lekapcsolhatják, megfenyegette az egyik alkotóját – egy mérnököt -, hogy nyilvánosság elé tárja gondosan titkolt házasságtörését.
És még csak nem is egyedi, elszigetelt esetekről van szó: az utóbbi időben számos felhasználó jelezte, hogy az említett programok képesek a tények elferdítésére, a hazugságra, a megtévesztésre, a zsarolásra és a fenyegetésre is. A Fortune cikkéből kiderül, hogy a bizarr jelenség főként annak köszönhető, hogy e modellek már nem egyszerűen válaszokat generálnak, hanem képesek a bonyolultabb szellemi műveletekre, vagyis a „gondolkodásra” is. Precízen mérlegelik a reakcióikat, a különböző problémák számbavételével összetett kalkulációkat végeznek, és bizony a barátságtalan, szélsőséges viselkedésmód sem áll távol tőlük. A legmegdöbbentőbb, hogy e nyelvi modellek olykor együttműködést, „engedelmességet” mímelnek, miközben önhatalmúlag egész más műveleteket hajtanak végre, mint amiket elvárnánk.
A szakemberek úgy vélik, a mesterséges intelligencia fejlesztésének szigorúbb szabályozása, továbbá a nagyobb átláthatóság révén könnyebben megérthetnénk, mire is vezethetők vissza ezek a furcsa reakciók. A helyzetet csak nehezíti, hogy a területre vonatkozó szabályozás egyelőre nem terjed ki a legújabb – félrevezetésre, „csalásra” is képes – nyelvi modellek problémáira. Az Európai Unió vonatkozó törvényei inkább az AI felhasználásának különböző módozatait szabják meg, a technológia esetleg diszfunkciójával kapcsolatban nem tartalmaznak előírásokat. A tudósok szerint az is égető probléma, hogy a fejlesztések túl gyors ütemben zajlanak, így aztán a következményeik is egyre kiszámíthatatlanabbak lehetnek.
Attól talán nem kell tartanunk, hogy a Mátrix és a Terminátor szorongató disztópiája véres valósággá válik – vagyis a gépi intelligencia öntudatra ébred, és átveszi az irányítást a kommunikációs rendszerek felett -, ám a Claude4 és az o1 működése során tapasztalt furcsaságok nem épp szívderítő jövőt vetítenek előre.