Најновиот модел на Google со вештачка интелигенција има многу работа пред себе. Како и сите други компании во трката за вештачка интелигенција, Google брзо ја интегрира вештачката интелигенција во речиси секој производ што го поседува, обидувајќи се да создаде алатки што другите сакаат да ги користат и ја поставува инфраструктурата за да го овозможи сето тоа без премногу трошоци. Во меѓувреме, Amazon, Microsoft, Anthropic и OpenAI инвестираат милијарди во решавањето на истите проблеми.
Ова може да објасни зошто Демис Хасабис, извршен директор на Google DeepMind и шеф на сите проекти за вештачка интелигенција во Google, е толку возбуден за моделот Gemini 2.0. Google го претстави Gemini 2.0, околу 10 месеци по лансирањето на верзијата 1.5. Иако моделот се уште е во експериментална фаза, Google објави помала верзија, 2.0 Flash. Според Хасабис, тоа веќе носи значителни промени, пишува Verge.
„Практично“, рече Хасабис, „моделот е подеднакво добар како и сегашниот Pro модел. Можете да го замислите како подобар за целото ниво со истата цена и ефикасност и брзина. Ние сме многу задоволни од тоа“. Покрај подобрувањето на постоечките способности, Gemini 2.0 носи и нови функции. Може природно да генерира звук и слики и има мултимодални способности што ја поставуваат основата за следниот голем чекор во вештачката интелигенција: агентите.
AI Agent, како што сите го нарекуваат, се однесува на системи со вештачка интелигенција кои можат самостојно да извршуваат задачи. Google веќе некое време демонстрира еден таков систем, Project Astra, визуелен систем кој може да препознава предмети, да помогне во навигацијата и да најде изгубени очила. Gemini 2.0 носи големи подобрувања за Astra, тврди Хасабис.
Google го воведува и Project Mariner, експериментална екстензија на Chrome која буквално може да го користи вашиот прелистувач за вас. Тука е и Jules, агент дизајниран за програмерите да ги пронаоѓаат и поправаат грешките во кодот, како и агентот Gemini 2.0 кој може да го анализира вашиот екран и да ви помогне да играте видео игри. Хасабис ја опишува оваа функција како „велигденско јајце“ што покажува што може да постигне мултимодалниот модел.
„Ние ја гледаме 2025 година како вистински почеток на ерата на агентите“, вели Хасабис, додавајќи дека ефикасноста и брзината се клучниот напредок во новиот модел. Иако индустријата се соочува со забавување на подобрувањето на моделите, Google продолжува да бележи напредок во обуката на нови модели.
Планот на Google за Gemini 2.0 е да го користи насекаде. Моделот ќе ги напојува функциите на вештачката интелигенција во пребарувањето на Google, што моментално го користат милијарда луѓе, а сега ќе биде уште покомплексен и пософистициран. Ќе биде интегриран во ботот и апликацијата Gemini, а подоцна ќе ги напојува функциите на вештачката интелигенција во Workspace и другите производи на Google. Целта е да се создаде универзален модел со мултимодални способности.
Како што започнува ерата на агентите, Хасабис предупредува на стари и нови предизвици. Старите проблеми вклучуваат перформанси и трошоци, додека новите вклучуваат безбедносни ризици што агентите можат да ги претставуваат кога дејствуваат автономно. Google истражува безбедносни мерки како што се тестирање во контролирани средини, но признава дека се потребни повеќе истражувања.
Иако Gemini 2.0 се уште е во експериментална фаза, корисниците веќе можат да го испробаат преку веб-апликацијата Gemini. На почетокот на следната година моделот ќе биде достапен на другите платформи на Gemini, во сите производи на Google и на целиот интернет.