AI е със съмнителна надеждност при научни и образователни приложения

Изследване на INSAIT разкрива, че популярните GPT модели са склонни да „решават“ грешни математически задачи

BusinessGlobal
BusinessGlobal / 12 October 2025 09:23 >
AI е със съмнителна надеждност при научни и образователни приложения
Източник: INSAIT
Екип от INSAIT и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към "сляпо съгласие" (sycophancy) при решаване и доказване на математически твърдения, съобщиха от българския институт. Изследването BrokenMath разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят. В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения. 

Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите. Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе. Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема. 

Подобно поведение може да е опасно в контекста на нарастващото навлизане на ИИ в образованието. Ако системи, използвани от ученици или преподаватели, могат уверено да представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене. Затова надеждността и проверката на фактите са ключови за безопасното прилагане на ИИ технологии в учебния процес и научните изследвания. 

Изследването е проведено от докторанта в INSAIT Иво Петров, Джаспър Деконинк от ETH Zurich и научният директор на INSAIT проф. Мартин Вечев.
Exit

Този уебсайт ползва “бисквитки”, за да Ви предостави повече функционалност. Ползвайки го, вие се съгласявате с използването на бисквитки.

Политика за личните данни Съгласен съм Отказ