A HVG beszámolója szerint az OpenAI bemutatta legújabb nyelvi modelljét, az o1-et, amely a cég vezérigazgatója, Sam Altman szerint „egy új paradigma kezdete”. Az új modell jelentős előrelépést mutat az érvelésben, kódolásban és többlépéses problémák megoldásában az előző verziókhoz képest, de még mindig nem mentes a hibáktól.
A Gizmodo beszámolója szerint az o1-modellek, beleértve az o1 mini verziót is, az emberek gondolkodási technikáját utánozzák, és a háttérben ellenőrzik válaszaikat. „Megtanulja, hogyan bontsa egyszerűbbekre a bonyolult lépéseket – és megtanul megpróbálni egy másik megközelítést, ha az aktuális nem vált be” – magyarázza az OpenAI.
Bár az új modell jobb teljesítményt nyújt, mint a GPT-4o, a tökéletességtől még messze van. Az OpenAI saját tesztjei szerint 100 000 beszélgetésből 800 esetben adott helytelen választ az o1. Ezek körülbelül harmada akkor is helytelen volt, amikor a modell tudatában volt annak, hogy a válasz nem megfelelő. A modell nem mentes a hallucinációktól sem.
Az o1 programozóverseny kérdéseit 89 százalékos helyességgel, míg a Nemzetközi Matematikai Diákolimpia kérdéseit 83 százalékos eredménnyel teljesítette. Ezzel szemben a GPT-4o csupán 14 százalékot ért el a diákolimpián.
A The Verge megjegyzi, hogy az o1 „az egyik első lépés azon cél felé, hogy elkészüljön egy emberszerű mesterséges intelligencia”. Az OpenAI nem közölt részleteket arról, hogy milyen adatokon képezték az o1-et, csak annyit árultak el, hogy nyilvános és partneri megállapodások révén szerzett adatokat használtak. Az új modellhez a ChatGPT Plus és Team előfizetői már hozzáférnek, míg a vállalati és oktatási felhasználók jövő héten kapják meg az o1 előzetes változatát. A „mini” verzió ingyenes felhasználók számára is elérhető lesz, de az időpont még nem ismert.