V OpenAI vytvořili nový benchmark. Aby zjistili, že pro skutečné pracovní úkoly je nejlepší konkurenční Claude
Datum publikování: 26. 9. 2025
OpenAI si zaslouží uznání, že si výsledky svého průzkumu, kde jeho ChatGPT neskončil jako nejlepší, nenechalo pro sebe. Projekt GDPval, který hodnotil schopnosti AI chatbotů na reálných pracovních úkolech, i s výsledky podrobně popsalo na webu. Přidalo také graf, jak s pěkným náskokem zvítězil ...