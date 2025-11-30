Нов модел на AI е способен сам да проверява дали разсъждава правилно

Източник: vecteezy

Китайската компания за изкуствен интелект „ДийпСийк“ (DeepSeek) пусна DeepSeekMath-V2, новаторски математически модел, който задава нови стандарти за производителност и разширява границите за решаването на проблеми, породени от изкуствения интелект, предаде агенция Синхуа.



Новият модел, достъпен вече с отворен код на софтуерните платформи Hugging Face и GitHub, въвежда иновативни принципи за самопроверка, предназначени да гарантират не само правилни отговори, но и логически обосновани и проверими доказателства.



Моделът демонстрира отлични резултати, като показва ниво, което би му донесло златни медали както на Международната математическа олимпиада (IMO) през 2025 г., така и на Китайската математическа олимпиада (CMO) през 2024 г. Забележително е, че този модел успя да постигне 118 от 120 точки на математическото състезание с висока трудност Putnam в Северна Америка през 2024 г., като с лекота и със значителна разлика надмина 90-те точки - най-високия резултат, който може да бъде постигнат от човек, посочва Синхуа.



Мощността на модела беше допълнително потвърдена чрез системата за проверка на IMO-ProofBench, където той надмина модели като DeepThink на DeepMind. Тази система противопоставя два големи езикови модела един на друг – единият поема ролята на „доказващ“ и генерира математически доказателства, докато другият е с функцията на „рецензент“ - внимателно проверява правилни ли са предложените разсъждения с цел да установи.



Този подход е насочен към най-критикувания етап от работата на изкуствения интелект в момента – системата, задвижвана от изкуствен интелект, може да предложи правилен краен отговор, което обаче не гарантира правилен процес на разсъждение, поясняват от екипа на „ДийпСийк“, цитирани от Синхуа.

Абонирай се!

Абонамент за списание BGlobal може да заявите:-във фирма &bd...