OpenAI ka lansuar GPT-5.4 , një model të ri me Al të cilësuar si “modeli më i aftë dhe efikas në kufijtë e punës profesionale”.
Përveç versionit standard, GPT-5.4 është gjithashtu i disponueshëm si një model arsyetimi (GPT-5.4 Thinking) ose i optimizuar për performancë të lartë (GPT-5.4 Pro).
Modeli i ri vjen me rezultate të përmirësuara ndjeshëm, duke përfshirë rezultate rekord në testet e përdorimit të kompjuterit OSWorld-Verified dhe WebArena Verified.
Modeli i ri gjithashtu shënoi një rezultat rekord prej 83% në testin GDPval të OpenAI për detyrat e punës me njohuri.
GPT-5.4 gjithashtu mori kryesimin në testin APEX-Agents të Mercor , i projektuar për të testuar aftësitë profesionale në drejtësi dhe financë, sipas një deklarate nga CEO i Mercor, Brendan Foody.
“GPT-5.4 shkëlqen në krijimin e rezultateve afatgjata, siç janë diapozitivat, modelet financiare dhe analizat ligjore”, tha Foody në deklaratë, “duke ofruar performancë të lartë ndërsa funksionon më shpejt dhe me një kosto më të ulët sesa modelet konkurruese të nivelit të lartë.”
GPT-5.4 vazhdon përpjekjet e kompanisë për të kufizuar gabimet.