Apple: Вештачката интелигенција „пука“ кога задачите стануваат премногу тешки

од Vladimir Zorba
15 прегледи

Нова студија од истражувачите на Apple открива сериозни ограничувања во напредните модели на расудување со вештачка интелигенција, доведувајќи ја во прашање трката на технолошката индустрија кон вештачка општа интелигенција (AGI)

Apple објави труд минатиот викенд во кој тврди дека нивните најнови системи со вештачка интелигенција, познати како Големи модели на расудување (Large Reasoning Models – LRM), страдаат од она што го нарекуваат „колапс на точноста“ при решавање на многу сложени проблеми. Со други зборови, кога им се даваат премногу тешки задачи, моделите не само што прават грешки – туку престануваат да се обидуваат логички да го решат проблемот.

Студијата покажува дека стандардните модели со вештачка интелигенција продолжуваат да работат подобро на едноставни задачи, додека и стандардните и моделите на расудување целосно не успеваат кога сложеноста на темата надминува одреден праг. Интересно е што, како што се приближуваат до тој праг, моделите на расудување го намалуваат нивото на напор што го вложуваат во расудувањето, што истражувачите го опишаа како „особено загрижувачки“, според „Гардијан“.

Дали системите со вештачка интелигенција достигнаа граница?

Гари Маркус, американски научник и истакнат критичар на прекумерните очекувања за вештачката интелигенција, ги опиша наодите како „проблематични“. Во својот билтен, тој напиша дека резултатите од студијата на Apple се дополнителен доказ дека идејата за непосреден развој на вештачка општа интелигенција (AGI) – систем што може да ги извршува сите интелектуални задачи како човек – е нереална.

„Секој што мисли дека големите јазични модели се директен пат до AGI што фундаментално ќе го трансформира општеството, греши“, пишува Маркус.

Студијата, исто така, предупредува дека LRM се неефикасни во користењето на компјутерските ресурси – кога решаваат едноставни проблеми, тие брзо стигнуваат до точното решение, но за умерено сложени задачи, прво истражуваат неточни решенија пред да стигнат до точното. Сепак, за високо сложени проблеми, се случува целосен когнитивен колапс, дури и кога експлицитно му го презентирате точниот алгоритам на моделот.

„Како што моделите се приближуваат до критичен праг – кој е многу блиску до точката на колапс на точноста – тие, спротивно на очекувањата, го намалуваат напорот во расудувањето, иако проблемот станува сè потежок“, се наведува во трудот. Научниците од Apple веруваат дека ова укажува на фундаментално ограничување во скалабилноста на сегашниот пристап кон развој на резонирачка вештачка интелигенција.

Прашањето за „генерализирано расудување“ останува отворено

Студијата тестираше голем број добро познати модели на вештачка интелигенција, вклучувајќи ги o3 на OpenAI, Gemini Thinking на Google, Claude 3.7 Sonnet-Thinking на Anthropic и DeepSeek-R1.

Тестовите вклучуваа класични логички задачи и задачи за решавање проблеми, како што се Кулата Ханој и загатките преку реката, кои се вообичаени алатки за тестирање на апстрактното расудување. Истражувачите признаваат дека изборот на задачи донекаде ги ограничува заклучоците, но нагласуваат дека резултатите сериозно ја доведуваат во прашање способноста на моделот да генерализира заклучоци од едноставни до посложени ситуации.

„Овие сознанија ги предизвикуваат преовладувачките претпоставки за можностите на моделите на расудување на големи размери и сугерираат дека сегашните пристапи може да достигнуваат фундаментални граници во нивната способност да извршуваат генерализирано расудување“, заклучува трудот.

Ендру Рогојски, од британскиот Институт за вештачка интелигенција центрирана на човекот (Универзитет во Сари), рече дека наодите од студијата сугерираат дека индустријата за вештачка интелигенција сè уште „бара вистинска насока“ во развојот на вештачката интелигенција.

„Откритието дека моделите на расудување ја губат својата способност да решаваат сложени проблеми, додека добро се справуваат со едноставни, сугерира дека можеби сме стигнале до ќорсокак со сегашниот пристап“, рече Рогојски.

Слични содржини