AI моделите вече се учат да отделят повече време на сложни проблеми

Пробивен AI модел е разработен така, че да се учи да разпределя повече изчислителни ресурси за трудни задачи, имитирайки начина, по който хората отделят повече време за предизвикателни задачи. Тази адаптивна способност за разсъждение позволява по-устойчиви решения и по-добра генерализация към нови, непознати сценарии. Иновацията представлява значителен напредък в решаването на проблеми чрез AI, като надхвърля разпознаването на шаблони и се доближава до по-човекоподобни процеси на мислене.

Изследователи разработиха ново поколение AI модели, които могат динамично да настройват изчислителните си усилия според сложността на проблема, което представлява основна промяна в начина, по който изкуственият интелект подхожда към предизвикателни задачи.

Технологията, илюстрирана от модели като DeepSeek-R1 и o-серията на OpenAI, използва т.нар. "reasoning-first подход", който поставя приоритет на задълбочения анализ пред бързото разпознаване на шаблони. DeepSeek-R1 е изграден с тази методология, което го прави особено подходящ за справяне със сложни задачи в науката, програмирането и математиката чрез напреднало логическо заключение и решаване на проблеми. Този фокус върху "мисленето преди отговаряне" го прави особено ценен за технически приложения.

За разлика от конвенционалните AI системи, тези нови модели за разсъждение са обучени да "мислят по-дълго" преди да отговорят. Например, OpenAI o3 може да разбива трудни въпроси на логически стъпки, да извършва междинни изчисления или да използва инструменти, след което да предоставя добре обосновани отговори. Като модели за разсъждение, те ефективно проверяват собствените си факти, което помага да се избегнат капани, които обикновено подвеждат стандартните модели. Макар да им отнема секунди до минути повече, за да достигнат до решение в сравнение с обикновените модели, те са по-надеждни в области като физика, наука и математика.

OpenAI наблюдава, че мащабното обучение с подсилване показва същата тенденция "повече изчисления = по-добра производителност", както при по-ранното обучение на модели. Като повтарят пътя на мащабиране – този път при обучението с подсилване – те постигат още един порядък увеличение както в изчислителните ресурси за обучение, така и във времето за разсъждение при инференция, с ясни подобрения в производителността, които потвърждават, че колкото повече време за мислене се дава на моделите, толкова по-добри стават те.

Тези модели активно генерират множество пътища за решение по време на инференция, като оценяват всеки с помощта на интегрирани модели-оценители, за да определят най-обещаващия вариант. Чрез обучение на оценителя с експертно етикетирани данни, разработчиците гарантират, че моделите развиват силна способност да разсъждават върху сложни, многостъпкови проблеми. Тази функция позволява на модела да действа като съдия на собственото си разсъждение, доближавайки големите езикови модели до възможността да "мислят", а не просто да отговарят.

Подходът на DeepSeek комбинира reasoning chain-of-thought с обучение с подсилване, при което автономен агент се учи да изпълнява задача чрез проби и грешки без човешки инструкции. Това поставя под въпрос предположението, че моделите ще подобрят способността си за разсъждение само чрез обучение върху етикетирани примери за правилно поведение. Както се изрази един изследовател: "Можем ли просто да възнаграждаваме модела за коректност и да му позволим сам да открие най-добрия начин на мислене?"

Последиците за реалните приложения са дълбоки. Тези модели могат да трансформират начина, по който AI се справя със сложни проблеми в области от научни изследвания и инженерство до бизнес стратегия и креативно решаване на задачи. Като разпределят изчислителните ресурси пропорционално на трудността на задачата – подобно на начина, по който хората естествено отделят повече време на по-трудни проблеми – тези системи обещават по-надеждна работа при най-предизвикателните интелектуални задачи, пред които е изправено човечеството.

AI моделите вече се учат да отделят повече време на сложни проблеми

Latest News

Google привлича таланти от Windsurf AI в стратегическа сделка за 2,4 млрд. долара

OpenTools.ai стартира ежедневен AI новинарски хъб за технологични професионалисти

HP придобива AI активите на Humane за 116 млн. долара и прекратява AI Pin

Nvidia влиза в историята като първия технологичен гигант с пазарна стойност от 4 трилиона долара

Китайската AI компания DeepSeek скъсява дистанцията с западните гиганти

Първият в света Закон за изкуствения интелект на ЕС влиза в сила

xAI премахва антисемитско съдържание от Grok на фона на промени в ръководството

OpenAI и Microsoft стартират AI академия за $23 млн. за 400 000 учители

Google представя усъвършенствани AI инструменти за трансформация на здравеопазването

ЕС отхвърля исканията за отлагане на насоките за съответствие с Акта за изкуствения интелект

AI моделите вече се учат да отделят повече време на сложни проблеми

Related Articles

HP придобива AI активите на Humane за 116 млн. долара и прекратява AI Pin

OpenTools.ai стартира ежедневен AI новинарски хъб за технологични професионалисти

Google привлича таланти от Windsurf AI в стратегическа сделка за 2,4 млрд. долара

xAI премахва антисемитско съдържание от Grok на фона на промени в ръководството

Първият в света Закон за изкуствения интелект на ЕС влиза в сила

Latest News

Google привлича таланти от Windsurf AI в стратегическа сделка за 2,4 млрд. долара

OpenTools.ai стартира ежедневен AI новинарски хъб за технологични професионалисти

HP придобива AI активите на Humane за 116 млн. долара и прекратява AI Pin

Nvidia влиза в историята като първия технологичен гигант с пазарна стойност от 4 трилиона долара

Китайската AI компания DeepSeek скъсява дистанцията с западните гиганти

Първият в света Закон за изкуствения интелект на ЕС влиза в сила

xAI премахва антисемитско съдържание от Grok на фона на промени в ръководството

OpenAI и Microsoft стартират AI академия за $23 млн. за 400 000 учители

Google представя усъвършенствани AI инструменти за трансформация на здравеопазването

ЕС отхвърля исканията за отлагане на насоките за съответствие с Акта за изкуствения интелект