Megérkezett a ChatGPT eddigi legfejlettebb kihívója

Kovács Patrik Kovács Patrik | 2024.07.27 | Tech | Olvasási idő: 3 perc
Megérkezett a ChatGPT eddigi legfejlettebb kihívója

A Meta piacra dobta legújabb és legfejlettebb mesterségesintelligencia-modelljét: a 405 milliárd paraméterből álló Llama 3.1 405B nyílt forráskódú, vagyis képességei bárki számára elérhetők. De vajon mit tud pontosan az utóbbi évek egyik legjelentősebb nyelvi modelljeként emlegetett szoftver? Akár a ChatGPT trónja is megremeghet?

A Meta vadonatúj mesterséges intelligenciája képes kódolni, gond nélkül megoldja a nem túlságosan összetett matematikai feladványokat, és a dokumentumok összegzése sem esik nehezére. Ez utóbbi feladatot egyébként nyolc különböző nyelven (angol, német, francia, olasz, portugál, hindi, spanyol, thai) tudja elvégezni Az utóbb évek egyik legfontosabb nyelvi modelljeként emlegetett innováció legnagyobb hátulütője, hogy kizárólag szövegeket képes elemezni, azaz a különböző vizuális tartalmakkal nem tud mit kezdeni. A TechCrunch kiemeli, hogy a Meta már hozzálátott a különböző fotókat, videófelvételeket, valamint az emberi beszédet felismerni és generálni képes modellek előállításához, ezek a fejlesztések azonban még túlságosan korai stádiumban tartanak.

A Meta közölte: a Llama 3.1 405B a ChatGPT mögött álló GPT-4-gyel azonos fejlettségi szintet képvisel, a GPT-4o-val és a Claude 3.5 Sonnettel szemben viszont vegyes eredményeket produkált.

Kiderült továbbá, hogy az új mesterséges intelligencia egy 15 trillió (milliárdszor milliárd) tokenes adatkészleten lett betanítva, ami nagyjából 750 milliárd kifejezést jelent. A szoftver egészen 2024-ig bezárólag kiterjedt ismeretekkel rendelkezik. Az alapok sok hasonlóságot mutatnak a régebbi Llama-modellekével, de a cég ezen a téren is végzett némi finomhangolást. A szakemberek összesen 16 ezer darab Nvidia H100 GPU-t használtak a betanításhoz.

Az új modellt bárki letöltheti, ráadásul egy fillért sem kell fizetni érte. A lehetőség azonban főként a programozók számára lehet gyümölcsöző, hiszen a termék futtatásához rendkívül korszerű hardver szükségeltetik, ilyesmit pedig elsősorban az üzleti felhőszolgáltatók tudnak kínálni.

A Llama 3.1 405B-t a laikus felhasználók is kipróbálhatják, ám kizárólag az Egyesült Államokban, Európában ugyanis a Meta nem tette elérhetővé a terméket. A tengerentúlon viszont már a Facebook, az Instagram és a Messenger chatbotjaiban is megtalálható a vadonatúj nyelvi modell, mely a bonyolultabb kérdések megválaszolásakor sem vall szégyent.

Iratkozz fel hírlevelünkre és értesülj elsőként az újdonságokról!