Přední modely AI mají potíže s řešením originálních matematických problémů

11. 2. 2026

čas čtení 2 minuty
Matematika, stejně jako mnoho jiných vědeckých snah, stále více využívá umělou inteligenci. Samozřejmě, matematika je páteří AI, ale matematici se k těmto nástrojům obracejí i při úkolech jako je vyhledávání literatury a kontrola rukopisů kvůli chybám. Ale jak dobře může AI řešit skutečné, vysoce náročné výzkumné problémy?

Dosud neexistuje široce přijímaná realistická metodika pro hodnocení schopností AI řešit matematiku na této úrovni. Skupina matematiků se proto rozhodla stroje vyzkoušet.

Předchozí pokusy o testování AI využívaly úlohy a otázky z matematických soutěží, které už se nacházejí v učebnicích. Co tuto studii odlišuje je fakt, že otázky, kterým programy čelily, vycházely z výzkumu samotných matematiků. Nikdy nebyly zveřejněny v časopisech ani publikovány online, což znamená, že AI si nemohla zapamatovat odpovědi ze svých tréninkových dat.

Každý matematik zapojený do studie přispěl jedinečným problémem a nejprve ho sám vyřešil, aby dokázal, že otázky nejsou nesmyslné. Také šifrovali odpovědi, aby se neobjevovaly ve veřejných zdrojích, ke kterým by modely měly přístup.

Celkem bylo deset problémů napříč různými matematickými obory, včetně stochastické analýzy, spektrální teorie grafů, symplektické geometrie a algebraické topologie. Výzkumníci testovali otázky na několika předních systémech, včetně GPT-5.1 Pro a Gemini 3 Pro, a modely měly pouze jeden pokus na otázku. Nebyly tam žádné další podněty ani rozhovory, ani žádné nápovědy, které by jim mohly pomoci najít řešení.

Experiment nazvaný První důkaz byl navržen k testování konkrétní části matematického procesu.

Výsledky mohou rozptýlit obavy každého, kdo se obává, že umělá inteligence nahradí matematiky. Ačkoliv AI programy jsou vynikající v shrnování existujících znalostí nebo hledání vzorců v datech, měly potíže vyřešit problémy na jeden pokus.

Celkový závěr zní, že AI je v tuto chvíli dobrá v úkolech podobných soutěžím, ale postrádá kreativní hloubku a intuici potřebnou k orientaci a řešení neznámého.

Další v pořadí pro tým je zveřejnění šifrovaných řešení 13. února a následné zahájení práce na druhé sadě problémů.

Zdroj v angličtině: ZDE

0
Vytisknout
222

Diskuse

Obsah vydání | 11. 2. 2026