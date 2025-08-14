Modeli i ri ChatGPT-5 i OpenAI është më pak i prirur ndaj “halucinacioneve” – shpikjes së informacionit të rremë – sesa versionet e mëparshme, sipas testeve të fundit nga Vectara.
Sipas rezultateve, “shkalla e halucinacioneve të bazuara” e ChatGPT-5 është 1.4 përqind, që është më e mirë se GPT-4o (1.49%) dhe GPT-4 (1.8%).
Megjithatë, ka modele me shkallë gabimesh edhe më të ulëta: o3-mini High Reasoning regjistron vetëm 0.795%, ndërsa GPT-4.5 Preview është në 1.2%.
Nga ana tjetër, Grok-4 konkurrues nga xAI doli të ishte më i prirur ndaj fabrikimit, me deri në 4.8% halucinacione.
Edhe pse ChatGPT-5 është teknikisht më i përparuar, disa përdorues u ankuan se modeli i ri është “më i ftohtë”, më pak kreativ dhe jep përgjigje më të shkurtra krahasuar me GPT-4o.
Drejtori ekzekutiv i OpenAI, Sam Altman, pranoi se kompania bëri një gabim duke hequr modelet e vjetra pa paralajmërim dhe njoftoi se GPT-4o do të vihej përsëri në dispozicion përkohësisht.
Ai gjithashtu premtoi përmirësime të reja, duke përfshirë një “modalitet të të menduarit” për detyra më komplekse dhe ndërrim automatik më të mirë midis versioneve.
Përveç nivelit të lartë të halucinacioneve, Grok-4 është kritikuar edhe për modalitetin e tij “Pikant”, i cili dyshohet se gjeneroi përmbajtje të papërshtatshme dhe materiale të rreme pavarësisht filtrave të integruar.
Më keq, Grok e bëri këtë pavarësisht se sistemi supozohet se kishte filtra kundër krijimit të përmbajtjes së tillë