Google je predstavil Gemini – je ta novost primerljiva z uveljavitvijo ChatGPT pred dobrim letom?

Google je bil nekaj časa zadržan glede javne dostopnosti umetne inteligence, a to ne pomeni, da je ne razvija. Le vedeli nismo vsega. Sedaj je nekaj malega razkril in to poimenoval z imenom Gemini.

Zgodovina umetne inteligence, vsaj njen čas, ko je v ljudski domeni in uporabi, zaznamujejo obdobja vzpona in »AI zime«, ko so nekateri že napovedali, da gre za zvezdo enodnevnico in zgolj pomp, ki bo zamrl. Google je v zadnjem letu najprej tiho opazoval podvig ChatGPT, potem razkril, da ne spi, saj so se začeli porajati dvomi, da je zamudil AI revolucijo. V resnici pa jo je ves čas razvijal, vmes splavil še svojo rešitev Bard in se zasidral nekje med bolj uveljavljene ponudnike.

Sedaj je uvedel še Gemini, ki je nov tip modela umetne inteligence. Zmore več, kot pisanje besedil in podobnega. Za to ima Google svoj Bard, ki deluje povsem v redu. Bard temelji na vsem, kar je Google diskretno razvijal še pred OpenAI, a o tem ni govoril javno. Uspeh ChatGPT, ki je bil delno nepričakovan, je prisilil Google, da tudi sam pride v javnost.

Gemini v 3 različicah, tudi v mobilnih telefonih

Gemini za zdaj deluje znotraj Barda, v angleškem jeziku. V celoti bo aktiviran za javnost v 2024, tedaj pa bo podpiral 170 jezikov, torej tudi slovenski jezik. Razvijalci aplikacij se bodo lahko z Gemini ukvarjali že od 13. decembra 2023 dalje, bo pa Gemini na voljo v (vsaj) 3 različicah: Gemini nano, Pro in Ultra. Gemini nano bo namenjen lokalnemu delovanju v primernih napravah, kot so recimo mobiteli. Prvi tak je Googlov Pixel 8. Gemini Pro je nekaj vmes, odlično bo služil korporacijam, že danes pa je integriran v Google Bard. Najmočnejši Gemini Ultra bo dostopen od 2024 dalje. Ker je zelo zmogljiv je v varnostnem preverjanju zunanjih strokovnjakov, na voljo pa bo najprej izbranim uporabnikom.

Gemini tudi vidi, sliši, ne samo bere

Gemini je »multimodalen« model, kar pomeni, da se lahko uči iz podatkov, ki so besedilo pa tudi kaj drugega, recimo zvok, video, fotografija. Če je ChatGPT zadovoljen s tistim, kar lahko posrka iz besedilnih zbirk (pa še ta je bila na začetku omejena na zastarelo zbirko besedil na Twitterju), je Gemini bolj radoveden. Rezultat je lahko impresiven in to impresivnost lahko razumemo, če vemo koliko več se lahko model nauči, če ga po domače »krmimo« tudi z videom, zvokom in fotkami. Plastično si to predstavljajte tako: imate film. Prva različica je zgolj izpis podnapisov iz filma. Imate samo to, nimate pa filma, videa, zvoka in vseh lepot, ki jih prinese multimedijska informacija. Druga različica je film z vsem tem. Katera vam bo pustila več podatkov? Gemini vidi, sliši in tudi bere.

OpenAI gre v enako smer, podrobnosti so še skrite

Seveda gredo v podobno smer razvoja, ki je vzporedna sedanji, še kje drugje. Domnevno tudi pri OpenAI, če smemo verjeti, da obstaja projekt s kodnim imenom Q, ki naj bi označevalo nekaj podobnega kot Gemini pri Googlu. Kar se je zgodilo sedaj je, da je Google končno tudi za javnost malce snel rokavice in pokazal, da ima v resnici na zalogi vse potrebno, da tudi pri umetni inteligenci prevzame primat, če bo le znal izbrati pravo smer in produkte oziroma usmeriti fokus v pravo smer.

Kdo nadzira AI? Modeli so v lasti korporacij, regulacije pa v resnici še ni.

Kje je pri vsem tem največji problem? V tem, da gre za lastniške modele, zato javnost seveda nima vpogleda v njihovo delovanje oziroma je ta omejen na zaznano in tisto, kar razkrijejo lastniki modelov, ki so vsi po vrsti na trgu in seveda marsikaj skrbno varujejo zase. Ob tem pa ta trg ni ustrezno reguliran na državni in meddržavni ravni, kar bi bilo nujno glede na to, da so modeli umetne inteligence globalno zastopani in bi morali njihovo delovanje ustrezno regulirati na globalni ravni, čim bolj celovito.

Za lepimi besedami se skriva globalni interes ZDA in Kitajske ter zaveznic

Ker se ti modeli vse bolj uporabljajo tudi v vojaške namene in v obveščevalnih okoljih, bo njihovo regulacijo nemogoče doseči, saj bi to okrnilo prednost posameznih držav na teh področjih. Da se to dogaja že sedaj nam indicirajo poskusi, predvsem ZDA, po omejevanju konkurence s Kitajske. To počne s omejevanjem izvoza najbolj zmogljivih procesorjev, ki so nujni za delovanje najbolj naprednih modelov umetne inteligence. Konkretno gre za družbo nVidia, ki okoli desetino prihodka ustvari z izvozom na Kitajsko, tja pa ne sme izvažati svojih najbolj zmogljivih procesorjev oziroma lahko izvaža posebne okrnjene različice, ki spoštujejo izvozne omejitve ZDA za opremo, ki se jo lahko uporabi v vojaške namene.

Druga oblika omejevanja je usmerjena v tržno delovanje podjetij, kot je recimo Huawei. Slednji je omejen večplastno. Zahodni dobavitelji imajo prepoved izvoza nekaterih tehnologij in programske kode, kar laična javnost še danes opaža pri manjku podpore Googla v mobilnikih Huawei. Glavni izziv pa je drugje. Huawei je, poleg nVidie, eden najmočnejših igralcev na področju razvoja rešitev umetne inteligence. Saj ne, da bo jo ZDA in NATO potrebovale, je pa fino, če se njen razvoj čim bolj ovira. Na koncu šteje kdo je boljši in prvi, račun pa bomo kot vedno plačali ljudje.