DeepSeek обвинет за користење на модели во сопственост на OpenAI

OpenAI вели дека пронашол докази дека кинеската старт-ап компанија за вештачка интелигенција DeepSeek користела модели на американската компанија за да го обучи својот конкурент со отворен код, откако расте загриженоста за потенцијалното прекршување на интелектуалната сопственост.

Производителот на ChatGPT од Сан Франциско изјави за Financial Times дека виделе некои докази за „дестилација“, за кои се сомнева дека потекнуваат од DeepSeek.

Програмерите ја користат оваа техника за да постигнат подобри перформанси на помали модели со користење на излезите од поголемите, поспособните, што им овозможува да постигнат слични резултати на специфични задачи по многу пониска цена.

Прочитајте повеќе:

Дестилацијата е вообичаена практика во индустријата, но загриженоста беше дека DeepSeek можеби го прави тоа за да изгради свој конкурентен модел, што е прекршување на условите за користење на OpenAI. „Проблемот е кога [го исфрлувате од платформата и] го правите тоа за да создадете сопствен модел за вашите сопствени потреби“, рече лице, блиско до OpenAI.

OpenAI одби да коментира дополнително или да даде детали за своите докази. Неговите услови за користење велат дека не можете да „копирате“ ниту една од неговите услуги или „да го користите излезот за развој на модел кој се натпреварува со OpenAI“.

Објавувањето на DeepSeek на својот модел за расудување R1 ги изненади пазарите, како и инвеститорите и технолошките компании во Силиконската долина. Неговите модели постигнаа високи рангирања и споредливи резултати со водечките американски модели.

Акциите на Nvidia паднаа за 17 отсто во понеделникот, бришејќи 589 милијарди долари од нејзината пазарна вредност, поради стравувањата дека можеби нема да бидат потребни големи инвестиции во нејзиниот скап AI хардвер. Тие закрепнаа 9 проценти во вторникот заедно со другите технолошки акции.

OpenAI и неговиот партнер Microsoft истражуваа сметки за кои се веруваше дека се на DeepSeek a кои го користеле програмскиот интерфејс или API на OpenAI и го блокирале нивниот пристап поради сомневање дека ги прекршуваат условите за користење со дестилирање, додаде друго лице со директно знаење. Овие истраги првпат беа објавени од „Bloomberg“.

Microsoft одби да коментира, а OpenAI не одговори веднаш на барањето за коментар за овој детал. DeepSeek не одговори веднаш на барањето за коментар. Кина е затворена за Лунарната Нова Година.

Претходно, AI и крипто царот на претседателот Доналд Трамп, Дејвид Сакс рече дека е „можно“ да се случила кражба.

„Постои техника во вештачката интелигенција наречена дестилација… каде што еден модел учи од друг модел [и] на некој начин го цица знаењето од матичниот модел“, изјави Сакс за „Фокс њуз“ во вторникот.

„И има значајни докази дека она што го направи DeepSeek овде е извлечено знаење од моделот OpenAI, и мислам дека OpenAI не е многу среќен поради ова“, додаде Сакс, иако не даде докази.

DeepSeek рече дека користел само 2.048 Nvidia H800 графички картички и потрошил 5,6 милиони долари за да го обучи својот V3 модел со 671 милијарда параметри, мал дел од она што OpenAI и Google потрошиле за обука на модели со споредлива големина. Некои експерти рекоа дека моделот генерирал одговори кои укажуваат дека е обучен за резултатите од GPT-4 на OpenAI, што би ги прекршило неговите услови за користење.

Упатените во индустријата велат дека е вообичаена практика лабораториите за вештачка интелигенција во Кина и САД да ги користат резултатите од компаниите како OpenAI, кои инвестирале во ангажирање луѓе за да ги научат нивните модели како да произведат повеќе одговори со човечки звук. Ова е скапо и трудоинтензивно, а вообичаено е помалите играчи да ја нарачаат оваа работа, велат упатените.

„Многу е вообичаена практика за стартапи и академици да ги користат резултатите од комерцијалните LLM усогласени со човекот, како што е ChatGPT, за да обучат друг модел“, рече Ритвик Гупта, докторант по вештачка интелигенција на Универзитетот во Калифорнија, Беркли.

„Тоа значи дека го добивате овој чекор за човечки повратни информации бесплатно. Не ме чуди што наводно истото би го направил и DeepSeek. Ако го направиле тоа, точното прекинување на оваа практика може да биде тешко“, додаде тој.

Практиката ги истакнува тешкотиите за компаниите кои сакаат да ја заштитат својата техничка предност.

„Знаеме дека компаниите со седиште во [Кина] – и други – постојано се обидуваат да ги уништат моделите на водечките американски компании за вештачка интелигенција“, додава OpenAI во својата најнова изјава.

„Ние се ангажираме во контрамерки за заштита на нашата интелектуална сопственост, вклучително и внимателен процес за кои предностите треба да се вклучат во објавените модели, и веруваме дека е од клучно значење тесно да соработуваме со владата на САД за најдобро да ги заштитиме најспособните модели од обиди на противници и конкурентите да преземат американска технологија“.

OpenAI моментално се бори против наводите за прекршување на авторските права од весници и создавачи на содржини, вклучително и тужби од The New York Times и истакнати автори, кои ја обвинуваат компанијата дека ги обучува нивните модели на нивните написи и книги без дозвола.

DeepSeek обвинет за користење на модели во сопственост на OpenAI

Политика на сајтот