menu
close

AI моделите вече се учат да отделят повече време на сложни проблеми

Пробивен AI модел е разработен така, че да се учи да разпределя повече изчислителни ресурси за трудни задачи, имитирайки начина, по който хората отделят повече време за предизвикателни задачи. Тази адаптивна способност за разсъждение позволява по-устойчиви решения и по-добра генерализация към нови, непознати сценарии. Иновацията представлява значителен напредък в решаването на проблеми чрез AI, като надхвърля разпознаването на шаблони и се доближава до по-човекоподобни процеси на мислене.
AI моделите вече се учат да отделят повече време на сложни проблеми

Изследователи разработиха ново поколение AI модели, които могат динамично да настройват изчислителните си усилия според сложността на проблема, което представлява основна промяна в начина, по който изкуственият интелект подхожда към предизвикателни задачи.

Технологията, илюстрирана от модели като DeepSeek-R1 и o-серията на OpenAI, използва т.нар. "reasoning-first подход", който поставя приоритет на задълбочения анализ пред бързото разпознаване на шаблони. DeepSeek-R1 е изграден с тази методология, което го прави особено подходящ за справяне със сложни задачи в науката, програмирането и математиката чрез напреднало логическо заключение и решаване на проблеми. Този фокус върху "мисленето преди отговаряне" го прави особено ценен за технически приложения.

За разлика от конвенционалните AI системи, тези нови модели за разсъждение са обучени да "мислят по-дълго" преди да отговорят. Например, OpenAI o3 може да разбива трудни въпроси на логически стъпки, да извършва междинни изчисления или да използва инструменти, след което да предоставя добре обосновани отговори. Като модели за разсъждение, те ефективно проверяват собствените си факти, което помага да се избегнат капани, които обикновено подвеждат стандартните модели. Макар да им отнема секунди до минути повече, за да достигнат до решение в сравнение с обикновените модели, те са по-надеждни в области като физика, наука и математика.

OpenAI наблюдава, че мащабното обучение с подсилване показва същата тенденция "повече изчисления = по-добра производителност", както при по-ранното обучение на модели. Като повтарят пътя на мащабиране – този път при обучението с подсилване – те постигат още един порядък увеличение както в изчислителните ресурси за обучение, така и във времето за разсъждение при инференция, с ясни подобрения в производителността, които потвърждават, че колкото повече време за мислене се дава на моделите, толкова по-добри стават те.

Тези модели активно генерират множество пътища за решение по време на инференция, като оценяват всеки с помощта на интегрирани модели-оценители, за да определят най-обещаващия вариант. Чрез обучение на оценителя с експертно етикетирани данни, разработчиците гарантират, че моделите развиват силна способност да разсъждават върху сложни, многостъпкови проблеми. Тази функция позволява на модела да действа като съдия на собственото си разсъждение, доближавайки големите езикови модели до възможността да "мислят", а не просто да отговарят.

Подходът на DeepSeek комбинира reasoning chain-of-thought с обучение с подсилване, при което автономен агент се учи да изпълнява задача чрез проби и грешки без човешки инструкции. Това поставя под въпрос предположението, че моделите ще подобрят способността си за разсъждение само чрез обучение върху етикетирани примери за правилно поведение. Както се изрази един изследовател: "Можем ли просто да възнаграждаваме модела за коректност и да му позволим сам да открие най-добрия начин на мислене?"

Последиците за реалните приложения са дълбоки. Тези модели могат да трансформират начина, по който AI се справя със сложни проблеми в области от научни изследвания и инженерство до бизнес стратегия и креативно решаване на задачи. Като разпределят изчислителните ресурси пропорционално на трудността на задачата – подобно на начина, по който хората естествено отделят повече време на по-трудни проблеми – тези системи обещават по-надеждна работа при най-предизвикателните интелектуални задачи, пред които е изправено човечеството.

Source:

Latest News