Samoučeča umetna inteligenca AlphaGo je v igri GO kot za šalo opravila z vsemi najboljšimi predstavniki človeštva

V svojem delu Štoparski vodnik po galaksiji si je Douglas Adams zamislil računalnik Globoka Misel. Namen računalnika je bil, da odgovori na dokončno vprašanje o življenju, vesolju in sploh vsem. Po sedmih milijonih letih premlevanja je dal odgovor: 42. Ta komični zaplet zelo dobro ilustrira enega od problemov umetne inteligence: lahko nam da odgovore, ki jih ne pričakujemo, ali jih celo ne razumemo. Saj zato smo jo pravzaprav tudi razvili – da bo boljša od nas, ljudi!

Zadnjič smo med drugim razmišljali o tem, kaj bo, ko bo umetna inteligenca specializirana za vožnjo avtomobilov postala boljša od voznikov. (Pravzaprav je že, ampak iz praktičnih razlogov bomo še nekaj časa morali sedati za volan, ga vrteti – ali pa vsaj držati roko na njem.) Kaj bo, ko bomo razvili umetne inteligence, ki bodo boljše od zdravnikov, inženirjev gradbeništva, inženirjev računalništva, učiteljev, vzgojiteljic in umetnikov? Kaj bo, ko bomo razvili umetno inteligenco, ki bo boljša od ljudi sploh?

Ker se ljudje od nekdaj radi igramo Boga, lahko odgovor na zadnje vprašanje verjetno najdemo v Njegovi knjigi v zgodbi o babilonskem stolpu, ampak preden zabredemo pregloboko v filozofske in teološke vode, raje definirajmo “umetno inteligenco”.

No, noge si bomo hočeš nočeš morali zmočiti, saj inteligence ni moč preprosto definirati. Tej zagati se bomo izognili tako, da bomo inteligenco definiral kot lastnost inteligentnega bitja, umetno inteligenco pa kot stroj, ki izkazuje inteligenco. Prav veliko s to definicijo nismo dosegli, stvari pa se bodo malo zjasnile, če umetno inteligenco razdelimo na tri stopnje: šibka, močna in superinteligenca. Šibka umetna inteligenca je specializirana, npr. za vožnjo avtomobila ali diagnosticiranje kožnega raka. Močna umetna inteligenca je “vsaj tako inteligentna kot tipičen človek”, umetna superinteligenca pa daleč prekaša najbistrejše, najbolj nadarjene in najmodrejše ljudi.

Če nam bo uspelo v prihodnosti razviti močno umetno inteligenco, se bo lahko seveda sama razvila v umetno superinteligenco. Pustimo zadnji dve za naslednjič in si poglejmo primer šibke umetne inteligence, ki nam bo pomagala dodatno osvetliti nekatere izzive, ki jih prinaša razvoj umetne inteligence.

DeepMind je okrog leta 2014 razvil umetno inteligenco AlphaGo, ki se je naučila igrati igro go s strojnim učenjem – z “opazovanjem” potekov iger, ki so jih igrali ljudje.

Oktobra 2015 je AlphaGo Fan (izboljšana različica AlphaGo) premagala profesionalnega igralca goja Fana Huia.

Marca 2016 je naslednja različica, AlphaGo Lee, s 4:1 premagala Leeja Sedola, enega najboljših igralcev goja na svetu.

Maja 2017 je AlphaGo Master s 60:0 premagala več profesionalnih igralcev.

Oktobra 2017 so razvili AlphaGo Zero, ki se je naučila igranja goja samo z uporabo pravil in z igranjem iger proti sami sebi – brez “opazovanja” ljudi. Po treh dneh treninga je bila boljša od AlphaGo Lee – premagala jo je s 100:0. Po 21 dneh je dosegla nivo AlphaGo Master ter jo po 40 dneh premagala z 89:11.

Decembra 2017 so umetno inteligenco AlphaGo Zero generalizirali tako, da je v 24 urah dosegla nadčloveški nivo igranja v igrah šaha, shogija in goja. Poimenovali so jo AlphaZero. AlphaZero z enim dnevom treninga je AlphaGo Zero s tremi dnevi treninga premagala s 60:40.

Kar je pri tem razvoju še dodatno fascinantno, je dejstvo, da so uspeli v DeepMindu hkrati z dvigom učinkovitosti umetne inteligence tudi bistveno znižati njeno porabo energije za učenje.

Izzivi

Umetna inteligenca lahko hitro dohiti in prehiti človeka.

Kaj pa zdaj, ko je AlphaZero najboljši igralec goja na svetu? Je go sploh še smiselno igrati?

AlphaZero ima za cilj zmagati v igri. To za svet nima kakšnih hujših posledic. Lahko pa si predstavljamo umetno inteligenco, ki bi s tem, da bi dosegla svoj cilj, povzročila nepredvidene neželene posledice, lahko celo človeške žrtve. Izkaže se, da je zelo težko postaviti pravila, ki bi ji to preprečevala. Že pri zelo preprosti igri skrivalnic, ki so jo razvili pri OpenAI, je umetna inteligenca izkoristila dve nenamerni “luknji” v pravilih in ju izkoristila za tri nepredvidene načine igranja.

Avtor članka je Klemen Ban, sodelujoči v natečaju za kolumnista Domovine

13 KOMENTARJI

  1. Ko bo umetna inteligenca prehitela človeka, bomo na milost in nemilost prepuščeni njej.
    Potem se bodo lahko zgodili vsi tisti črni scenariji, ki jih napovedujejo pisci znanstvene fantastike, namreč uničenje človeštva.
    V benevolentno, altruistično in servilno umetno inteligenco verjamejo samo ljudje kot je Ray Kurzweil, ki bi rad igral boga na zemlji z njeno pomočjo.

  2. Igrati se boga in ustvariti novega, ki bo “starega” v nepredvidljivi in nepredstavljivi meri (tudi nori?) presegal, je precej samodestruktivno ravnanje. Res je, da to ne bi bilo prvič (zadnje doslej je bila atomska bomba, kjer smo še vedno na nezavarovanem robu prepada!) lahko pa, da zadnjič. Štafeto razuma delegirati drugemu – tako rekoč pod geslom “novi obrazi!” Sledil bo naš izbris, ker bomo novemu bogu nerazumen strošek. Hecno, pravega Boga nočemo, sami pa bi se takoj predali v roke novemu, ki nas bo v vsem (?) neobvladljivo presegal. Ne pomeni to, da smo slab gospodar? Nesposobni zadržati svoj razum? Zemlja nam je dana v “obdelovanje in varovanje” mi bi pa vse to nerazumno velikodušnk podarili neznanemu tretjemu? Moj oče se obrača v grobu in ječi: “Adijo pamet!” Kadar Bog kaznuje, mu najprej vzame razum, a ne?

  3. Prijeten članek za branje o odličnih napredkih na področju računalništva, ki je trenutno zelo popularno. Manjka mi le nekoliko bolj konkretna definicija in razlaga inteligence programov, pomanjkljivost katere se avtor sicer zaveda, vendar je za laika vseeno nujno potrebna.

    Trenutna umetna inteligenca je od resnične inteligence zelo daleč in je včasih kar nekoliko nerodno uporabiti besedo “inteligenca” za program, ki dobro odigra partijo goja ali šaha. Obe igri sta izrazito matematični, lahko izračunljivi in z natančno določenimi pravili. Tak problem je kot nalašč za spisati program, ki ga bo efektivno rešil. Dobro se je zavedati, da to ni nekaj novega – šahovski programi so prisotni že vrsto let npr. spomnim se, da smo v mojem otroštvu doma imeli šahovsko igro Fritz, kjer se je dalo nastaviti zahtevnost programa. Pa temu nikoli ne bi rekel inteligenca. Vprašamo se lahko že, kako določamo inteligenco živim bitjem. Zakaj rečemo, da so nekatere živali inteligentnejše? Primer so lahko delfini, ki so se sposobni zabavati in igrati, ali pa opice, ki uporabljajo orodje. Pri živalih in ljudeh je torej inteligenca pogojena s tem, da se zavedamo samega sebe in okolice ter se znamo v njo umestiti, jo raziskovati, uporabiti in biti v odnosu z drugimi. Ravno zavest in zavedanje samega sebe sta največji prepreki pri ustvarjanju dejanske inteligence. Od raziskave obojega smo še izredno daleč, do takrat pa so to programi, ki zmorejo obdelati ogromno količino podatkov pod določenimi pravili in pogoji.

    Seveda imajo vsi programi lahko napake in posledice le-teh so odvisne od njihove kritičnosti v naši infrastrukturi (že sedaj imajo avti veliko programskih komponent, ki nadzirajo vožnjo). Ampak smo še vedno zelo daleč od nevarnosti, da bi nam zavladal Skynet. Nenazadnje tudi zmogljivost superračunalnikov še ni na nivoju zmogljivosti (kaj šele ucinkovitosti) človeških možganov.

    Za zaključek še misel glede avtonomnih vozil. Močno dvomim, da bomo resnično avtonomen promet doživeli še v tem stoletju. Poleg vprašanja nosilca odgovornosti, ki je zaenkrat še vedno voznik, so tudi povsem nerešljiva vprašanja. Kako naj ravna avto, če pride do situacije, ko je levo stena, desno na cestišču pa otrok? Ali naj povozi otroka ali naj se v stilu kamikaze zaleti v steno? Kaj če je namesto otroka odrasla oseba, starostnik, skupina ljudi, …? Tovrstnih vprašanj je preveč, da bi lahko našim avtomobilom podali odgovore.

  4. Obe igri sta izrazito matematični, lahko izračunljivi in z natančno določenimi pravili.
    >>>>
    Zelo zelo se motiš. Saj ravno to je zanimivo: možnosti pri igri go je toliko (menda več kot je atomov v vesolju), da niti najbolj zmogljivi superračunalniki ne morejo zaporedno preveriti vseh možnosti in potem izbrati najboljšo potezo. Računalnik mora izbrati potezo, za katero domneva, da je dobra, podobno kot človek. In vendar je računalnik premagal najboljše igralce goja. Se pravi, da ne zgolj mehanično “računa”, temveč misli na podoben način kot človek.
    Kar zadeva zavesti, pa znanost nima teorije zavesti. Nihče ne ve, kaj zavest sploh je. Zato ne moremo vnaprej reči, da umetna inteligenca ne bo imela lastnosti zavesti. Da zavest obstaja, pa je dejstvo. Če jo je narava ustvarila z evolucijo, je to mogoče ponoviti.
    Nekateri pravijo, da s tem, ko so računalniški programerji naredili programe, ki se sami nadgrajujejo, tako da nihče več ne ve, kako sploh delujejo, so pravzaprav ustvarili avtonomno umetno inteligenco. Ta se razvija sama in to s hitrostjo, ki ji nihče ne more slediti.
    https://www.youtube.com/watch?v=mhutZM8Hmt8

    • Moram priznati, da me je vaša replika kar nekoliko pogrela. Pa ne zaradi tikanja, čeravno bi bilo dobro še posebej na internetu ohranjati neko osnovno omiko do tujcev. Zmotilo me je predvsem, kako mi pravite, da se motim, a hkrati ne navedete nobenega konkretnega argumenta.
      Ali mi znate razložiti osnovni koncept delovanja nevronskih mrež? Predvidevam, da ne, sicer takega odgovora glede goja ne bi podali. Nevronske mreže simulirajo delovanje človeških možganov na način, da pošiljajo signale med “nevroni”, ki se prižgejo ali ne. Ob prenosu informacije uporabijo t.i. aktivacijsko funkcijo in uteži, ki na koncu določijo vrednost na posameznem nevronu. Ta algoritem se ponavlja do zadnje plasti, kjer se preveri rezultat z željenim. Zatem se pošlje signal o rezultatu nazaj po mreži in pri tem popravlja vrednosti uteži glede na točnost rezultata (večja napaka pomeni večji popravek na utežeh). Umetna inteligenca ta postopek ponavlja in ob tem uporablja ogromno količino podatkov, da dobi statistično čim boljši približek pravilnemu odgovoru. Pri AlphaZero so k temu dodali še Monte Carlo Tree Search (MCTS), ki poišče drevo potez, na katero naj se algoritem osredotoči. Obe komponenti skupaj dopolnjujeta druga drugo in si izboljšujeta uteži, s katerimi se izračuna rezultate. V kolikor MCTS za neko drevo da prenizko ali previsoko oceno pomembnosti, mu jo lahko tudi ljudje prilagodijo (povejo pravilen rezultat) in s tem celoten algoritem izboljšajo.
      Kar ste rekli, da se “zelo zelo motim”, je ravno obratno – zelo zelo imam prav. Igranje AlphaZero morda deluje kot intuitivno, ampak je v resnici v ozadju statistika, ki pove verjetnost za najboljšo potezo.

      Zavest je dovolj definirana, da vemo, da je umetna inteligenca nima. Vsaj zaenkrat še ne – vselej dopuščam možnost, da jo bo nekoč imela, čeravno se mi zdi to nepredstavljivo.

      Posnetek, ki ste ga poslali, je daleč od šokantnega. Brez izjeme so vsi programi delovali na način, kot je bilo zamišljeno – delali so to, za kar so bili ustvarjeni. Tudi sam sem programer in povečini vem, kaj bo moja koda ob določenem vnosu vrnila kot izpis. Vendar se kdaj zmotim, kar pripelje do napake (hrošča, angl. bug). Pri čemer je pomembno poudariti, da zaradi tega program, ki npr. izračuna vsoto, ob napaki ne bo šel napadati jedrskega reaktorja v Krškem. Podobno je s primeri iz posnetka – vsi programi so delali, za kar so bili ustvarjeni in se od tega niso odklonili. V kolikor bi npr. program za avtonomno vožnjo sam pričel pogovor z voznikom, pa za to ni bil sprogramiran, bi morali to intenzivno raziskati, saj bi tak primer nakazal na možnost razvoja dejanske inteligence in zavesti. Do takrat pa predlagam, da za svoj vir informacij ne uporabljate posnetke tipa Top 10, katerih namen je zgolj (povsem legitimen) zaslužek njihovega avtorja. Težava tovrstnih posnetkov je lepo opisana v enem izmed komentarjev: “This video twisted some of the stories slightly to fit the description of the title.”

Komentiraj

Prosimo, vnesite komentar
Prosimo, vnesite svoje ime