Přední modely AI mají potíže s řešením originálních matematických problémů
11. 2. 2026
Dosud neexistuje široce přijímaná realistická metodika pro hodnocení schopností AI řešit matematiku na této úrovni. Skupina matematiků se proto rozhodla stroje vyzkoušet.
Předchozí pokusy o testování AI využívaly úlohy a otázky z matematických soutěží, které už se nacházejí v učebnicích. Co tuto studii odlišuje je fakt, že otázky, kterým programy čelily, vycházely z výzkumu samotných matematiků. Nikdy nebyly zveřejněny v časopisech ani publikovány online, což znamená, že AI si nemohla zapamatovat odpovědi ze svých tréninkových dat.
Každý matematik zapojený do studie přispěl jedinečným problémem a nejprve ho sám vyřešil, aby dokázal, že otázky nejsou nesmyslné. Také šifrovali odpovědi, aby se neobjevovaly ve veřejných zdrojích, ke kterým by modely měly přístup.
Celkem bylo deset problémů napříč různými matematickými obory, včetně stochastické analýzy, spektrální teorie grafů, symplektické geometrie a algebraické topologie. Výzkumníci testovali otázky na několika předních systémech, včetně GPT-5.1 Pro a Gemini 3 Pro, a modely měly pouze jeden pokus na otázku. Nebyly tam žádné další podněty ani rozhovory, ani žádné nápovědy, které by jim mohly pomoci najít řešení.
Experiment nazvaný První důkaz byl navržen k testování konkrétní části matematického procesu.
Výsledky mohou rozptýlit obavy každého, kdo se obává, že umělá inteligence nahradí matematiky. Ačkoliv AI programy jsou vynikající v shrnování existujících znalostí nebo hledání vzorců v datech, měly potíže vyřešit problémy na jeden pokus.
Celkový závěr zní, že AI je v tuto chvíli dobrá v úkolech podobných soutěžím, ale postrádá kreativní hloubku a intuici potřebnou k orientaci a řešení neznámého.
Další v pořadí pro tým je zveřejnění šifrovaných řešení 13. února a následné zahájení práce na druhé sadě problémů.
Zdroj v angličtině: ZDE
