Golobove obljube in razpis: dva jezika iste platforme

Vir: Shutterstock
POSLUŠAJ ČLANEK

Politične izjave govorijo o nacionalni platformi umetne inteligence, tehnološki suverenosti, razvoju domačega ekosistema, nadzoru nad vedenjem modelov, testnih okoljih za podjetja in celo o tem, da bo država sooblikovala standarde, dobre prakse in tehnologije. Preverili smo, če trditve ustrezajo specifikaciji, ki je zapisana v razpisni dokumentaciji »Dostop in konfiguracija dostopov do platforme z vrhunskimi jezikovnimi modeli« in ali je res, kar pravi predsednik vlade – da bodo orodja umetne inteligence dostopna vsem.

Premier Robert Golob je ob razpisu napovedal, da bo država vsem prebivalcem omogočila brezplačen dostop do vseh orodij umetne inteligence in da gre za projekt prihodnosti, ki bo okrepil ustvarjanje znanja ter zagotovil varen in suveren dostop do modelov, ki bodo delovali znotraj evropskih pravil. Izjave dajejo vtis, da Slovenija vzpostavlja novo, doma razvito platformo, namenjeno celotni populaciji, z lastnimi modeli, nadzorom nad podatkovnimi tokovi in vplivom na vedenje umetne inteligence.

Že videno: Golob nekaj govori, drugo dela

Toda razpisna dokumentacija predvideva nekaj drugega. Predmet naročila ni nacionalna platforma za državljane, temveč interni dostop oz. licenca do že obstoječih komercialnih modelov. Dostop bi bil omogočen 900 tisoč uporabnikom – verjetno javnega sektorja. Da storitev ni namenjena fizičnim osebam oz. »vsem«, je namreč razvidno tudi iz tega, da so pri razpisu izrecno izključili merila dostopnosti za invalide (v razdelku merila dostopnosti piše: uporaba meril dostopnosti za invalide v tehničnih specifikacijah: Pogoji dostopnosti za invalidne osebe niso vključeni, ker predmet javnega naročila ni namenjen temu, da bi ga uporabljale fizične osebe).

Predmet naročila ni nacionalna platforma za državljane, temveč interni dostop oz. licenca do že obstoječih komercialnih modelov. 

Razpisna dokumentacija tudi ne vključuje razvoja novih modelov, ne predvideva lokalne infrastrukture in ne omogoča oblikovanja lastnih tehničnih pravil delovanja umetne inteligence. Med tem, kar razpis dejansko kupuje, in tem, kar premier predstavlja kot prebojni nacionalni projekt, zeva precejšnja razlika. Golobova politična vizija v dokumentaciji nima opore, iz »Okvirne tehnične specifikacije« se razbere standardno poslovno storitev, kakršno na trgu ponujajo veliki globalni ponudniki. Po domače povedano – kupujemo dostop do najboljših komercialnih modelov, kot je npr. ChatGPT (platforma naj bi sicer vsebovala več jezikovnih modelov, ki so že na trgu), z visokim številom uporabnikov pa si pri tem verjetno obetamo popust.

Med tem, kar razpis dejansko kupuje, in tem, kar premier predstavlja kot prebojni nacionalni projekt, zeva precejšnja razlika. 

Spomnimo, Golob je novembra dejal, da bo vlada vsem prebivalcem Slovenije omogočila brezplačen dostop do vseh orodij umetne inteligence. Poudaril je, da gre za pomemben projekt, ki je usmerjen v prihodnost in kreacijo novih znanj in da si Slovenija želi biti med prvimi – kot je dejal, zaenkrat še nobena država ni podpisala takšne pogodbe. Izpostavil je mlade, ki bodo z dostopom do najmodernejših orodij še hitreje razvijali svoje podjetniške ideje. Kar se cene tiče, pa je dejal, da je zaenkrat za licenco predvidenih deset milijonov evrov. Pri tem je po vsej verjetnosti ciljal na obdobje enega leta, kolikor znaša čas trajanja naročila, ki se ga sicer lahko še trikrat podaljša. Razpis se je zaključil te dni, rezultati še niso znani  – v prvi fazi bodo naredili ožji izbor ponudnikov, sledila bodo pogajanja. Šele nato sledi končna izbira.

Vir: Shutterstock

»Univerzalen, brezplačen in varen dostop do generativne umetne inteligence vidim kot strateško naložbo v človeški kapital in inovacijski potencial države,« je za Siol povedal Marko Bajec z ljubljanske Fakultete za računalništvo in informatiko, ki naj bi bil tudi eden izmed avtorjev dokumenta Okvirne tehnične specifikacije – česar v intervjuju za Siol sicer ni omenil. Ali podatek o soavtorstvu drži, smo med drugim vprašali ministrstvo, odgovore še čakamo.

Kot je dejal, je za majhno državo še posebej pomembno, da zniža vstopne stroške in čim širšemu krogu omogoči eksperimentiranje, učenje in razvoj lastnih rešitev, ne da bi bili takoj odvisni od globalnih komercialnih ponudnikov. »Zgodnji pristop omogoča, da nismo zgolj pozni uporabniki tujih rešitev, ampak sooblikovalci standardov, dobrih praks in celo tehnologij,« je dejal in dodal, da če nekomu omogočimo široko dostopna in varna orodja, lahko postanemo kreatorji in ne samo pasivni uporabniki. V kontekstu suverene nacionalne platforme je poleg pomembne vloge upravljanja in varstva podatkov opozoril tudi na to, da se je treba izogibati »lock-in« odvisnosti od enega ponudnika – kar pomeni modularno arhitekturo, uporabo odprtih standardov in možnost zamenjave komponent. Če ponovno preverimo specifikacije, bo platforma v praksi centralizirana in nadzorovana, s strogo določenimi SLA-ji, kapacitetami in uporabniškimi računi.

To pomeni, da bo najverjetneje v prvi fazi izvajalec (komercialna platforma) le eden, hkrati pa je to precej drugačno od koncepta široko dostopne platforme za eksperimentiranje.

Razpis ne predvideva odprtih standardov ali modularne arhitekture, ki bi omogočala enostavno menjavo ponudnika, tako je praktično zagotovljen prav vendor lock-in, ki bi se mu Bajec bojda rad izognil. Ideja o široko dostopni, »univerzalni« platformi, kjer bi se Slovenija izognila odvisnosti od globalnih komercialnih rešitev, se tako v specifikacijah ne odraža.

Grobelnik še ne ve, kje bodo prišli skupaj s ponudniki – omejujejo jih sredstva

Med pripravljavci razpisa je tudi strokovnjak za umetno inteligenco Marko Grobelnik z Instituta Jožef Stefan. »Razlika je tako velika, kot bi se na dirko podali s povprečnim mestnim avtomobilom namesto z vrhunskim dirkalnikom. Če želimo tekmovati, potrebujemo najboljšo opremo,« je po navedbah MMC-ja opisal razliko med brezplačnimi dostopi in vrhunskimi storitvami ter pojasnil, da bistvo platforme zato ni ustvarjanje novega modela, temveč dogovor države z največjimi ponudniki (npr. ChatGPT, Google Gemini, Antrophic Claude), ki bi državljanom, podjetjem in ustanovam v Sloveniji omogočili dostop do najzmogljivejših modelov – po bistveno nižjih cenah.

Vir: Shutterstock

Potrdil je, da je zaenkrat predvideno, da bo platformo zagotavljal en sam ponudnik s suverenim oblakom v Evropi. Podatkovni centri in varnostni standardi bodo torej evropski, kar se tiče modelov, pa po Grobelnikovi oceni Evropa zaostaja. »Želimo le olajšati dostop državljanov, podjetij, šol in raziskovalnih ustanov do najboljše tehnologije. Kaj z njo počnejo, ni več stvar razpisa, niti ne bi bilo primerno, da bi država to regulirala in opazovala,« je komentiral vprašanja, ki se nanašajo na morebitne zlorabe platforme. Ocenil je še, da bo 10 milijonov absolutno premalo za vse, kar bi želeli ponuditi ljudem.

Finančna specifikacija ni javno dostopna (ali pa niti še ni narejena), prav tako ni znano, ali je bila vnaprej opravljena kakršna koli analiza stroškov, analiza obsega integracij ali upravljanja obstoječih sistemov – koliko sistemov bi bilo treba prilagoditi ali nadomestiti, kakšne dodatne vire in vzdrževanje bi to zahtevalo ter ali se projekt v takšnem obsegu sploh finančno splača. A vsekakor drži – če bi želeli dirkalnik, bi rabili več deset milijonov za trening vsake različice modela, lastno superračunalniško infrastrukturo in še kaj. Pa tudi v našem primeru bo v naslednjih fazah 10 milijonov letno premalo, treba bo plačevati še integracije v obstoječe sisteme, prilagoditve uporabniških vmesnikov, varnostne nastavitve in vse druge storitve, ki jih specifikacije zahtevajo za nemoteno delovanje platforme.

10 milijonov letno bo premalo, treba bo plačevati še integracije v obstoječe sisteme, prilagoditve uporabniških vmesnikov, varnostne nastavitve in vse druge storitve.

Pokriti bo treba tudi dejanske potrebe vseh predvidenih uporabnikov, vzdrževati razpoložljivost, posodabljati modele in zagotavljati skladnost z varnostnimi standardi. Dodatno je treba upoštevati, da v prvem letu platforma še ne bo imela vseh predvidenih uporabnikov, iz dokumentacije je razvidno, da se bo aktivacija računov odvijala postopoma. To pomeni, da se bodo stroški z rastjo števila uporabnikov postopoma povečevali.

Vir: Shutterstock

Generativna umetna inteligenca v vsako vas

Golobova obljuba, da bo umetna inteligenca prišla v vsak dom, je zmotila Inštitut Danes je nov dan, ki je skupaj z 71 strokovnjaki in organizacijami v odprtem pismu izrazil nasprotovanje javnemu naročilu tujih orodij umetne inteligence. Podpisniki menijo, da nakup ogroža digitalno suverenost Slovenije, varnost uporabnikov in nasprotuje nacionalnim ter evropskim strateškim usmeritvam.

Poudarili so, da v Sloveniji intenzivno razvijamo svoje velike jezikovne modele. Zato se sprašujejo, zakaj država kupuje pri tujih tehnoloških korporacijah in sredstev ne usmeri v razvoj javne odprtokodne slovenske generativne umetne inteligence, kar zasleduje tudi NpUI 2030. »Zaskrbljeni smo ob dejstvu, da v procesu oblikovanja javnega naročila ni bilo opravljeno posvetovanje s strokovnimi in splošnimi javnostmi,« so zapisali in med drugim opozorili na spoštovanje avtorskih, pa tudi delavskih pravic. K ponovnem premisleku je Goloba pozvala tudi nekdanja ministrica za digitalno preobrazbo Emilija Stojmenova Duh. Na seznamu najdemo še Ano Kučan, Sonjo Lokar in Janeza Janšo – umetnika.

»Državni veliki jezikovni modeli omogočajo oblasti, da vpliva na to, kako bodi ti modeli ljudem odgovarjali in daje državi vpogled v to, kaj in kdo bo umetno inteligenco spraševal,« je v svojem  blogu pisal nekdanji minister in profesor Žiga Turk, ki se mu zdi sumljivo, da država ponuja infrastrukturo, ki pomaga ljudem misliti. »Oblast se hvali, da bodo podatki ostali v EU, da tista domača naloga, pri kateri hočete, da vam AI pomaga, ne bo naložena nekam v hudobne in neoliberalne ZDA. Ne, Slovenci že ne bomo dovolili, da bi se svet od nas učil. Ponavljam, manj me skrbi, da bi nekdo v ZDA zlorabil moje podatke kot pa, da ima možnost za to nekdo iz Slovenije,« je zatrdil.

Med njegovimi kritičnimi pomisleki najdemo navedbo, da dokumentacija predvideva sistem, ki vključuje SI-PASS in druge državne sisteme za prijavo, kar omogoča pregled nad tem, kdo sprašuje, kaj, kako in kdaj. V dokumentaciji je namreč omenjena integracija z IAM/SSO rešitvami, kar pomeni, da bo uporabnik za dostop do platforme identificiran prek državnega sistema. V specifikaciji je sicer zahtevana možnost nastavitve, da se podatki ne hranijo – a če bo nastavljeno drugače, bo dostopna tudi vsebina interakcij. Če bo nastavitev res taka, da se bo vsebina brisala skoraj sproti, pa bo platforma po oceni mnogih strokovnjakov skoraj neuporabna. Poleg tega Turk opozarja, da imata znanost in šolstvo povsem drugačne potrebe kot javna uprava, zdravstvo spet tretje in tako naprej. Ni realno pričakovati, da bi lahko bila ista platforma najboljša za vse in vsakogar. »Ni razloga, da bi država izdelovala umetno inteligenco za celotno populacijo,« je ocenil in z njim se strinja še marsikateri poznavalec tega področja.

Turk nenazadnje opozarja tudi na zahtevo razpisa, da mora platforma omogočati upravljanje sistemskih promptov (ukazov) na ravni organizacij ali skupin uporabnikov. To pomeni, da model lahko odgovarja z nastavljenim tonom ali poudarki. Ta metoda reguliranja tona sicer ni tako zanesljiva kot bi bil »fine-tuning« oz. treniranje modela, ki pa ni predvideno.

Smiselno za javno upravo – a to ni zgodba, ki jo prodaja Golob

Če sklenemo – s samimi velikimi jezikovnimi modeli ni prav nič narobe. Napačna je zavajajoča prezentacija, kaj sploh kupujemo, komu bo zares namenjeno in v kakšen namen. Četudi so nameni dobri, še ne pomeni, da bodo dobri tudi rezultati. »Namesto navadnega izvijača imamo gedore. Zdaj bomo vsem kupili gedore, ne vprašamo pa se, ali vsak to sploh rabi,« je komentiral eden izmed poznavalcev tega področja, ki ga princip spominja na usmerjeno izobraževanje v socialističnem sistemu. »Ni mi jasno, zakaj bi posamezniku država kupovala to orodje,« je pripomnil in dejal, da bi bil nakup za javno upravo veliko bolj razumljiv in logičen – a to pač ni zgodba, ki jo predsednik vlade prodaja javnosti.

»Ni mi jasno, zakaj bi posamezniku država kupovala to orodje.«

»Grobelnik je bil pri svojih izjavah veliko bolj iskren,« je dejal in pripomnil, da avtorji specifikacij seveda dobro vedo, kaj so napisali. V specifikacijah tako beremo, kaj so hoteli doseči tehnično izobraženi ljudje – beremo namen. Kaj bo rezultat, pa je lahko nekaj povsem drugega – način uporabe bodo določili tisti, ki imajo moč. In v mandatu te vlade smo večkrat videli, v kakšni meri se upošteva stroko. Sogovornik je dejal, da je zanj eksplicitna zahteva vstavljanja sistemskih promptov vsekakor »red flag«. Za to namreč ni nobene potrebe, saj so pripadajoči modeli že vključeni. Prav tako ga čudi, da je Bajec ob hvalospevu naročila zamolčal medijem svojo vlogo pri pripravi tehnične specifikacije. Naročilo pa je narejeno le za eno leto –  kaj potem naprej?

Bajec je ob hvalospevu naročila zamolčal medijem svojo vlogo pri pripravi tehnične specifikacije.

Orodje z velikim potencialom, uspešnost bo odvisna od tega, kako ga bo znala izkoristiti

Dirkalnik namiguje na ekstremno zmogljivost, optimizacijo do zadnjega vijaka, nastavitev na maksimalno hitrost. A če pogledamo dokumentacijo – ne kupujemo formule ena, ampak prej vozovnico za komercialno limuzino z močnejšim motorjem in dodatnimi opcijami. Kupujemo zmogljivo in nadzorovano orodje, ki ga bo treba premišljeno uporabljati in dopolnjevati z integracijami ter administrativnimi procesi. Tako je Grobelnikovo primerjavo ocenil ChatGPT, ki je med omejitvami naročila omenil finančno negotovost, tveganje vendor lock-in-a in odvisnost od zunanjega ponudnika – čeprav bo infrastruktura v EGP, je nadzor nad razvojem modelov ali njihovimi prihodnjimi spremembami omejen.

Vir: Shutterstock

Ko smo prosili še za pozitivne plati, je ChatGPT ocenil, da bo država dobila varno in nadzorovano platformo, ki omogoča dostop do vrhunskih komercialnih LLM, z jasnim upravljanjem uporabnikov, monitoringom, integracijskimi orodji in podporo za multimodalne funkcionalnosti. Platforma tehnično omogoča, da bi podjetja ali raziskovalci lahko eksperimentirali, ali bodo to dejansko lahko storili, pa je odvisno od politike dostopa, upravljanja kapacitet, kvot in pogodbene konfiguracije, ki še niso znani. Torej teoretično zveni privlačno, realnost pa bo odvisna od implementacije in dogovorov med državo in ponudnikom, je napovedal.

Kot je ocenil Gemini, pa projekt uspešno rešuje kratkoročne probleme varnosti in profesionalne rabe v javnem sektorju. Vendar pa ni strateška naložba v človeški kapital in inovacijski potencial države, kot je obljubljeno. Po tonu sodeč ChatGPT in Gemini nista najbolj naklonjena aktualni vladi, morda zato potrebujemo naprednejše modele z možnostjo upravljanja sistemskih promptov?

Po tonu sodeč ChatGPT in Gemini nista najbolj naklonjena aktualni vladi, morda zato potrebujemo naprednejše modele z možnostjo upravljanja sistemskih promptov?
Izbrano za naročnike
Še niste naročnik Domovine? Obiščite našo naročniško stran
Naroči se Doniraj Vse novice Za naročnike