A Google bemutatta a ChatGPT kihívóját
A techóriás bemutatta legújabb és eddigi legfejlettebb nagy nyelvi modelljét (large language model – LLM), a Geminit. A már most a ChatGPT kihívójának tekintett fejlesztés különlegessége, hogy multimodális, vagyis többfajta beérkező jelet is képes értelmezni, legyen az szöveg, kép, hang, programozási kód, illetve ezek kombinációja.
Sundar Pinchai, a Google és az Alphabet vezérigazgatója bejelentő közleményében hangsúlyozta: a fejlesztési folyamat során egyenlő mértékben vették figyelembe a gyors fejlődés és a megfontolt, biztonságos haladás kritériumait. A Gemini – mely immáron a Google saját chatbotját, a Bardot is működteti – egyik legfontosabb nóvuma, hogy multimodális, azaz többféle médiatípust tartalmazó bemeneteket fogad el, legyen az szöveg, hang, kép, programozási kód vagy ezek kombinációja.
A Geminit hamarosan a Google keresőmotorjához és a Chrome webböngészőjéhez is hozzáadják.
Az ígéretek szerint az új mesterséges intelligencia minden korábbi vetélytársánál könnyebben értelmezi a különböző tudományos feladatokat, és a kézzel írt megoldási kísérleteket is gond nélkül ismeri fel. Sőt, arra is képes, hogy érthetően elmagyarázza a népszerű programozási kódokat, de az sem esik nehezére, hogy saját maga generáljon ilyeneket.
A Google tényleg óriási elvárásokat támaszthat új nyelvi modelljével szemben – mindezt az is bizonyítja, hogy a Gemini 1.0 három különböző „méretben” (változatban) lesz elérhető. A Nano-t mobileszközökre és alkalmazásfejlesztőkre optimalizálták, a Pro az alapértelmezett, a legáltalánosabb feladatok végrehajtására tervezett, a legnagyobb ügyfélkört megszólító verzió, az Ultra pedig a techcég eddigi legfejlettebb MI-modellje, amit még további biztonsági teszteknek vetnek majd alá.
A szerdai bemutató alkalmával a Google a felhőalapú számítástechnika terén az utóbbi időben elért eredményeit is ismertette. Ez utóbbi egyébként az egyik legfontosabb erőforrás az MI-fejlesztők számára. A cég ígéretei szerint a Gemini teljesítményéért a nagy teljesítményű felhőalapú processzorok új generációja szavatol. E technológia vitathatatlan előnye, hogy hozzáférhetőbbé teszi az MI-képzést, így alkalmazása valójában az egész iparág számára hasznos lehet.
A cég egyébként azt is közölte, hogy a Gemini a tesztek folyamán számos, az algoritmusok olvasásértésének, matematikai készségeinek és többlépcsős gondolkodási képességeinek osztályozására használt benchmark során szárnyalta túl a rivális MI-modelleket.
Az új bejelentés egyik legfontosabb célja, hogy a Google piacvezető pozícióra tegyen szert az MI-iparágban, megelőzve a jelenlegi legnagyobb konkurenst, a ChatGPT-t fejlesztő OpenAI-t.