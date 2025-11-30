Нов модел на AI е способен сам да проверява дали разсъждава правилно

Китайската компания за изкуствен интелект „ДийпСийк“ (DeepSeek) пусна DeepSeekMath-V2, новаторски математически модел, който задава нови стандарти за производителност и разширява границите за решаването на проблеми, породени от изкуствения интелект, предаде агенция Синхуа.

Новият модел, достъпен вече с отворен код на софтуерните платформи Hugging Face и GitHub, въвежда иновативни принципи за самопроверка, предназначени да гарантират не само правилни отговори, но и логически обосновани и проверими доказателства.

Моделът демонстрира отлични резултати, като показва ниво, което би му донесло златни медали както на Международната математическа олимпиада (IMO) през 2025 г., така и на Китайската математическа олимпиада (CMO) през 2024 г. Забележително е, че този модел успя да постигне 118 от 120 точки на математическото състезание с висока трудност Putnam в Северна Америка през 2024 г., като с лекота и със значителна разлика надмина 90-те точки - най-високия резултат, който може да бъде постигнат от човек, посочва Синхуа.

Мощността на модела беше допълнително потвърдена чрез системата за проверка на IMO-ProofBench, където той надмина модели като DeepThink на DeepMind. Тази система противопоставя два големи езикови модела един на друг – единият поема ролята на „доказващ“ и генерира математически доказателства, докато другият е с функцията на „рецензент“ - внимателно проверява правилни ли са предложените разсъждения с цел да установи.

Този подход е насочен към най-критикувания етап от работата на изкуствения интелект в момента – системата, задвижвана от изкуствен интелект, може да предложи правилен краен отговор, което обаче не гарантира правилен процес на разсъждение, поясняват от екипа на „ДийпСийк“, цитирани от Синхуа.
изкуствен интелектИИ
