Vuonna 1956, vuoden mittaisen Lontoon-matkansa aikana ja parikymppisenä, matemaatikko ja teoreettinen biologi Jack D. Cowan vieraili Wilfred Taylorin ja hänen oudon uuden "oppimiskoneSaapuessaan paikalle hän oli hämmentynyt edessään olevasta ”valtavasta laitepankista”. Cowan saattoi vain seistä vieressä ja katsella ”koneen tekevän juttujaan”. Se näytti suorittavan ”assosiatiivista muistijärjestelmää” – se näytti pystyvän oppimaan löytämään yhteyksiä ja hakemaan dataa.
Se on saattanut näyttää kömpelöiltä piirilevyiltä, jotka on juotettu yhteen käsin johtojen ja laatikoiden massaksi, mutta Cowan todisti neuroverkon varhaista analogista muotoa – edeltäjää nykyajan edistyneimmälle tekoälylle, mukaan lukien paljon puhuttu ChatGPT ja sen kyky tuottaa kirjallista sisältöä lähes minkä tahansa komennon perusteella. ChatGPT:n taustalla oleva teknologia on neuroverkko.
Kun Cowan ja Taylor seisoivat ja katselivat koneen työskentelyä, heillä ei oikeastaan ollut aavistustakaan, miten se onnistui suorittamaan tehtävänsä. Vastaus Taylorin mysteeriseen koneaivoihin löytyy jostain sen "analogisista neuroneista", sen koneen muistin luomista assosiaatioista ja ennen kaikkea siitä, että sen automaattista toimintaa ei voitu täysin selittää. Kesti vuosikymmeniä ennen kuin nämä järjestelmät löysivät tarkoituksensa ja tuo voima vapautui.
Termi neuroverkko kattaa laajan kirjon järjestelmiä, mutta keskeisesti IBM: n mukaanNämä ”hermoverkot – jotka tunnetaan myös keinotekoisina neuroverkoina (ANN) tai simuloituina neuroverkoina (SNN) – ovat koneoppimisen osajoukko ja syväoppimisalgoritmien ytimessä”. Ratkaisevasti itse termi sekä niiden muoto ja ”rakenne ovat saaneet inspiraationsa ihmisaivoista ja jäljittelevät tapaa, jolla biologiset neuronit viestivät toisilleen”.
Alkuvaiheessa niiden arvosta saattoi olla vielä jonkin verran epäilyksiä, mutta vuosien kuluessa tekoälyn muoti on kääntynyt vahvasti neuroverkkojen suuntaan. Nykyään niitä pidetään usein tekoälyn tulevaisuutena. Niillä on suuri merkitys meille ja sille, mitä ihmisyys tarkoittaa. Olemme kuulleet näiden huolenaiheiden kaikuja viime aikoina kehotuksilla keskeyttää uudet tekoälykehitykset kuudeksi kuukaudeksi, jotta voidaan varmistaa luottamus niiden vaikutuksiin.
Olisi varmasti virhe sivuuttaa neuroverkko pelkästään kiiltävien, huomiota herättävien uusien laitteiden kysymyksenä. Ne ovat jo vakiinnuttaneet asemansa elämässämme. Jotkut ovat tehokkaita käytännöllisyydessään. Jo vuonna 1989 Yann LeCunin johtama tiimi AT&T Bell Laboratoriesissa käytti takaisinlevitystekniikoita järjestelmän kouluttamiseen tunnistaa käsin kirjoitetut postinumerot. Viimeisin Microsoftin ilmoitus Se, että Bing-haut tulevat olemaan tekoälyn ohjaamia ja siten "verkon rinnakkaisohjaajasi", havainnollistaa, kuinka löytämämme asiat ja niiden ymmärtäminen tulevat yhä enemmän olemaan tämän tyyppisen automaation tuotetta.
Laajan datan hyödyntäminen kuvioiden löytämiseksi Tekoälyä voidaan samalla tavalla kouluttaa esimerkiksi kuvantunnistukseen nopeasti – minkä seurauksena ne sisällytetään kasvotesimerkiksi. Tämä kyky tunnistaa malleja on johtanut moniin muihin sovelluksiin, kuten osakemarkkinoiden ennustaminen.
Neuroverkot muuttavat myös tapaamme tulkita ja kommunikoida. Kehittäjänä on mielenkiintoisen otsikon mukainen Google Brain Team, Google Translate on toinen merkittävä neuroverkon sovellus.
Et haluaisi pelata shakkia tai shogiakaan sellaisen kanssa. Heidän sääntöjen tuntemuksensa ja strategioiden sekä kaikkien tallennettujen siirtojensa muistaminen tarkoittaa, että he ovat poikkeuksellisen hyviä peleissä (vaikka ChatGPT näyttääkin... kamppailu Wordlen kanssa). Ihmisgo-pelaajia (Go on tunnetusti hankala strategiapeli) ja shakkisuurmestareita vaivaavat järjestelmät ovat tehty neuroverkoista.
Mutta niiden ulottuvuus ulottuu paljon näitä tapauksia pidemmälle ja laajenee jatkuvasti. Patenttihaku, joka rajoittuu vain täsmälleen mainintoihin ilmaisusta "neuroverkot", tuottaa 135 828 tulosta. Tämän nopean ja jatkuvan laajentumisen myötä mahdollisuutemme selittää tekoälyn vaikutus täysin saattavat pienentyä entisestään. Näitä kysymyksiä olen tarkastellut tutkimuksessani. ja uusi kirjani algoritmisesta ajattelusta.
Salaperäiset "tietämättömyyden" kerrokset
Neuroverkkojen historian tarkastelu kertoo meille jotakin tärkeää automatisoiduista päätöksistä, jotka määrittelevät nykyhetkeämme tai joilla on mahdollisesti syvällisempi vaikutus tulevaisuudessa. Niiden läsnäolo kertoo meille myös, että todennäköisesti ymmärrämme tekoälyn päätöksiä ja vaikutuksia ajan myötä vieläkin vähemmän. Nämä järjestelmät eivät ole pelkkiä mustia laatikoita, ne eivät ole vain järjestelmän piilotettuja osia, joita ei voida nähdä tai ymmärtää.
Se on jotain erilaista, jotakin, joka juontaa juurensa näiden järjestelmien tavoitteisiin ja suunnitteluun. Selittämättömän tavoittelu on pitkään jatkunut. Mitä läpinäkymättömämpi, sitä autenttisemmaksi ja kehittyneemmäksi järjestelmää pidetään. Kyse ei ole vain järjestelmien monimutkaistumisesta tai immateriaalioikeuksien valvonnan rajoittamasta pääsystä niihin (vaikka nämä ovatkin osa sitä). Pikemminkin kyse on siitä, että niitä ohjaavalla eetoksella on erityinen ja sisäänrakennettu kiinnostus "tietämättömyyteen". Mysteeri on jopa koodattu itse neuroverkon muotoon ja diskurssiin. Niillä on syvälle kasautuneita kerroksia – tästä johtuu termi syväoppiminen – ja näiden syvyyksien sisällä ovat vieläkin salaperäisemmältä kuulostavat "piilokerrokset". Näiden järjestelmien mysteerit ovat syvällä pinnan alla.
On hyvät mahdollisuudet, että mitä suurempi tekoälyn vaikutus elämäämme on, sitä vähemmän ymmärrämme, miten tai miksi. Nykyään on voimakas paine selitettävissä olevalle tekoälylle. Haluamme tietää, miten se toimii ja miten se johtaa päätöksiin ja tuloksiin. EU on niin huolissaan mahdollisesti "hyväksymättömistä riskeistä" ja jopa "vaarallisista" sovelluksista, että se parhaillaan edistää sitä. uusi tekoälylaki tarkoituksena on asettaa ”maailmanlaajuinen standardi” ”turvallisen, luotettavan ja eettisen tekoälyn kehittämiselle”.
Nuo uudet lait perustuvat selitettävyyden tarpeeseen, vaatien, että ”Korkean riskin tekoälyjärjestelmien osalta korkealaatuisen datan, dokumentaation ja jäljitettävyyden, läpinäkyvyyden, ihmisen suorittaman valvonnan, tarkkuuden ja kestävyyden vaatimukset ovat ehdottoman välttämättömiä tekoälyn perusoikeuksille ja turvallisuudelle aiheuttamien riskien lieventämiseksi.” Tämä ei koske pelkästään itseohjautuvia autoja (vaikka turvallisuuden varmistavat järjestelmät kuuluvat EU:n korkean riskin tekoälyn luokkaan), vaan huolta herättää myös se, että tulevaisuudessa syntyy järjestelmiä, joilla on vaikutuksia ihmisoikeuksiin.
Tämä on osa laajempia vaatimuksia tekoälyn läpinäkyvyydestä, jotta sen toimintaa voidaan tarkistaa, auditoida ja arvioida. Toinen esimerkki olisi Royal Societyn selitettävää tekoälyä koskeva poliittinen tiedote jossa he huomauttavat, että ”maailmanlaajuisissa poliittisissa keskusteluissa nähdään yhä useammin vaatimuksia jonkinlaisesta tekoälyn selitettävyydestä osana pyrkimyksiä sisällyttää eettiset periaatteet tekoälypohjaisten järjestelmien suunnitteluun ja käyttöönottoon”.
Mutta neuroverkkojen tarina kertoo meille, että todennäköisesti tulevaisuudessa etäännymme tästä tavoitteesta pikemminkin kuin lähemmäksi sitä.
Ihmisaivojen inspiroima
Nämä neuroverkot saattavat olla monimutkaisia järjestelmiä, mutta niillä on joitakin ydinperiaatteita. Ihmisaivoista inspiroituneina ne pyrkivät kopioimaan tai simuloimaan biologisen ja inhimillisen ajattelun muotoja. Rakenteeltaan ja suunnittelultaan ne ovat, kuten IBM selittää myös, joka koostuu ”solmukerroksista, jotka sisältävät syötekerroksen, yhden tai useamman piilokerroksen ja tulostekerroksen”. Tämän sisällä ”jokainen solmu tai keinotekoinen neuroni on yhteydessä toiseen”. Koska ne tarvitsevat syötteitä ja tietoa tulosteiden luomiseen, ne ”luottavat harjoitusdataan oppiakseen ja parantaakseen tarkkuuttaan ajan myötä”. Nämä tekniset yksityiskohdat ovat tärkeitä, mutta yhtä tärkeä on myös halu mallintaa näitä järjestelmiä ihmisaivojen monimutkaisuuden perusteella.
Näiden järjestelmien taustalla olevien tavoitteiden ymmärtäminen on olennaista, jotta voidaan ymmärtää, mitä nämä tekniset yksityiskohdat ovat käytännössä merkinneet. 1993 haastatteluneuroverkkotutkija Teuvo Kohonen totesi, että ”itseorganisoituva” järjestelmä ”on unelmani”, joka toimii ”jotain samalla tavalla kuin hermostomme tekee vaistonvaraisesti”. Esimerkkinä Kohonen kuvaili, kuinka ”itseorganisoituvaa” järjestelmää, joka valvoo ja hallitsee itseään, ”voitaisiin käyttää minkä tahansa koneen valvontapaneelina… jokaisessa lentokoneessa, suihkukoneessa tai jokaisessa ydinvoimalassa tai jokaisessa autossa”. Tämä, hän ajatteli, tarkoittaisi sitä, että tulevaisuudessa ”voisi nähdä heti, missä kunnossa järjestelmä on”.
Yleisenä tavoitteena oli luoda järjestelmä, joka kykenee sopeutumaan ympäristöönsä. Se olisi välitön ja autonominen, toimien hermoston tyyliin. Se oli unelma, saada järjestelmiä, jotka pystyisivät toimimaan itsestään ilman juurikaan ihmisen puuttumista asiaan. Aivojen, hermoston ja todellisen maailman monimutkaisuus ja tuntemattomat tekijät tulisivat pian ohjaamaan neuroverkkojen kehitystä ja suunnittelua.
"Jotain hämärää siinä on"
Mutta palataanpa vuoteen 1956 ja tuohon outoon oppimiskoneeseen, ja Cowanin huomio kiinnittyi välittömästi Taylorin käytännönläheiseen lähestymistapaan sen rakentamisessa. Hän oli selvästi hikoillut osien kokoamisessa. Taylor, Cowan havaitsi haastattelussa omasta osuudestaan näiden järjestelmien tarinaan liittyen, hän "ei tehnyt sitä teorian perusteella, eikä hän tehnyt sitä tietokoneella". Sen sijaan hän työkalut kädessään "itse asiassa rakensi laitteiston". Se oli materiaalinen asia, osien yhdistelmä, ehkä jopa härveli. Ja se "tehtiin kaikki analogisilla piireillä", ja Taylorilta kesti Cowanin mukaan "useita vuosia rakentaa ja leikitellä sillä". Yrityksen ja erehdyksen kautta tehty tapaus.
Cowan halusi ymmärrettävästi päästä käsiksi näkemäänsä. Hän yritti saada Taylorin selittämään hänelle tätä oppimiskonetta. Selvennyksiä ei tullut. Cowan ei saanut Tayloria kuvailemaan, miten se toimi. Analogiset neuronit pysyivät mysteerinä. Yllättävämpi ongelma Cowanin mielestä oli se, että Taylor "ei itsekään oikein ymmärtänyt, mitä oli tekeillä". Kyseessä ei ollut vain hetkellinen kommunikaatiokatkos kahden eri erikoisalojen tiedemiehen välillä, se oli enemmän kuin sitä.
Vuonna haastattelu 1990-luvun puolivälistäMuistellen Taylorin konetta Cowan paljasti, että ”tähän päivään mennessä julkaistuissa artikkeleissa ei voida aivan ymmärtää, miten se toimii”. Tämä johtopäätös viittaa siihen, miten tuntematon on syvästi upotettu neuroverkkoihin. Näiden neurojärjestelmien selittämättömyys on ollut läsnä jo lähes seitsemän vuosikymmentä sitten perus- ja kehitysvaiheista lähtien.
Tämä mysteeri on edelleen olemassa, ja sitä löytyy tekoälyn kehittyvistä muodoista. Taylorin koneen tekemien assosiaatioiden toiminnan käsittämättömyys sai Cowanin miettimään, oliko siinä "jotain hämärää".
Pitkät ja takkuiset juuret
Cowan viittasi lyhyeen tapaamiseensa Taylorin luona, kun häneltä kysyttiin hänen oman työnsä vastaanotosta joitakin vuosia myöhemmin. 1960-luvulla ihmiset olivat Cowanin mukaan "hieman hitaita ymmärtämään analogisen neuroverkon ideaa". Tämä tapahtui siitä huolimatta, Cowan muistelee, että Taylorin 1950-luvun työ "assosiatiivisen muistin" parissa perustui "analogisiin neuroneihin". Nobel-palkittu neurojärjestelmien asiantuntija, Leon N. Cooper, päätteli että aivomallin soveltamiseen liittyvää kehitystä 1960-luvulla pidettiin "yhtenä syvimmistä mysteereistä". Tämän epävarmuuden vuoksi neuroverkon saavutuksiin suhtauduttiin skeptisesti. Mutta asiat alkoivat hitaasti muuttua.
Noin 30 vuotta sitten neurotieteilijä Walter J. Freeman, joka yllättyi ”huomattava”neuroverkkojen sovellusten kirjosta” kommentoi jo sitä, ettei hän pitänyt niitä ”pohjimmiltaan uudentyyppisinä koneina”. Ne olivat hidas prosessi, jossa teknologia syntyi ensin ja sille löydettiin myöhemmin sovelluksia. Tämä vei aikaa. Itse asiassa neuroverkkoteknologian juurien löytämiseksi saatamme mennä jopa pidemmälle kuin Cowanin vierailu Taylorin salaperäisen koneen luona.
Neuroverkkojen tutkija James Anderson ja tiedetoimittaja Edward Rosenfeld ovat huomanneet että neuroverkkojen tausta ulottuu 1940-luvulle ja joihinkin varhaisiin yrityksiin, kuten he kuvailevat, ”ymmärtää ihmisen hermostoa ja rakentaa keinotekoisia järjestelmiä, jotka toimivat samalla tavalla kuin me, ainakin vähän”. Ja niin 1940-luvulla ihmisen hermoston mysteereistä tuli myös laskennallisen ajattelun ja tekoälyn mysteerejä.
Yhteenvetona tästä pitkästä tarinasta, tietojenkäsittelytieteen kirjoittaja Larry Hardesty on huomauttanut että syväoppiminen neuroverkkojen muodossa ”on käynyt muodissa ja mennyt pois muodista yli 70 vuoden ajan”. Tarkemmin sanottuna, hän lisää, ”nämä neuroverkot ehdottivat ensimmäisen kerran vuonna 1944 Warren McCulloch ja Walter Pitts, kaksi Chicagon yliopiston tutkijaa, jotka muuttivat MIT:hen vuonna 1952 perustajajäseninä niin sanotussa ensimmäisessä kognitiotieteen laitoksessa”.
Muualla, 1943 on joskus annettu päivämäärä teknologian ensimmäiseksi vuodeksi. Joka tapauksessa noin 70 vuoden ajan kertomukset viittaavat siihen, että neuroverkot ovat liikkuneet muodissa ja pois, usein laiminlyötyinä, mutta sitten joskus ottaneet jalansijaa ja siirtyneet valtavirtaisempiin sovelluksiin ja keskusteluihin. Epävarmuus jatkui. Nämä varhaiset kehittäjät kuvailevat usein tutkimuksensa tärkeyden unohdetuksi, kunnes se löysi tarkoituksensa, usein vuosia ja joskus vuosikymmeniä myöhemmin.
1960-luvulta 1970-luvun lopulle siirryttäessä voimme löytää lisää tarinoita näiden järjestelmien tuntemattomista ominaisuuksista. Jopa silloin, kolmen vuosikymmenen jälkeen, neuroverkoilla ei ollut vieläkään tarkoituksen tuntua. David Rumelhart, jolla oli tausta psykologiassa ja joka oli mukana kirjoittamassa vuonna 1986 julkaistua kirjasarjaa, joka myöhemmin kiinnitti huomion jälleen neuroverkkoihin, huomasi olevansa mukana neuroverkkojen kehittämisessä. kollegansa Jay McClellandin kanssa.
Kollegoiden lisäksi he olivat myös äskettäin tavanneet toisensa Minnesotassa pidetyssä konferenssissa, jossa Rumelhartin puhe "tarinoiden ymmärtämisestä" oli herättänyt keskustelua edustajien keskuudessa.
Konferenssin jälkeen McClelland palasi ajatuksen kanssa siitä, miten kehittää neuroverkko, joka voisi yhdistää malleja ollakseen vuorovaikutteisempia. Tärkeintä tässä on Rumelhartin muistelu "tuntikausien tietokoneella näpräämisestä".
Istuimme alas ja teimme kaiken tämän tietokoneella ja rakensimme näitä tietokonemalleja, emmekä yksinkertaisesti ymmärtäneet niitä. Emme ymmärtäneet, miksi ne toimivat tai miksi ne eivät toimineet, tai mikä niissä oli kriittistä.
Taylorin tavoin Rumelhart huomasi näpräävänsä järjestelmää. Hekin loivat toimivan neuroverkon, ja mikä ratkaisevaa, he eivät myöskään olleet varmoja siitä, miten tai miksi se toimi niin kuin toimi, näennäisesti oppien datasta ja löytäen yhteyksiä.
Aivojen matkiminen - kerros kerrokselta
Olet ehkä jo huomannut, että neuroverkkojen alkuperästä keskusteltaessa aivojen kuva ja niiden herättämä monimutkaisuus ovat aina lähellä toisiaan. Ihmisaivot toimivat eräänlaisena mallina näille järjestelmille. Erityisesti alkuvaiheessa aivoista – jotka ovat edelleen yksi suurista tuntemattomista – tuli malli sille, miten neuroverkko saattaisi toimia.
Nämä kokeelliset uudet järjestelmät mallinnettiin jostakin, jonka toiminta itsessään oli suurelta osin tuntematonta. Neurotietokoneinsinööri Carver Mead on puhunut paljastavasti "kognitiivisen jäävuoren" käsitteestä, jota hän oli pitänyt erityisen houkuttelevana. Se on vain tietoisuuden jäävuoren huippu, josta olemme tietoisia ja joka on näkyvissä. Lopun mittakaava ja muoto pysyvät pinnan alla tuntemattomina.
Vuonna 1998, James Anderson, joka oli työskennellyt jonkin aikaa neuroverkkojen parissa, totesi, että aivojen tutkimuksessa "suurin löytömme näyttää olevan tietoisuus siitä, ettemme todellakaan tiedä, mitä tapahtuu".
Yksityiskohtaisessa selvityksessä Financial Times vuonna 2018Teknologiatoimittaja Richard Waters huomautti, kuinka neuroverkot ”on mallinnettu ihmisaivojen toimintaa koskevan teorian mukaan, jossa ne välittävät dataa keinotekoisten neuronien kerrosten läpi, kunnes tunnistettava kuvio syntyy”. Watersin mukaan tämä luo kerrannaisvaikutuksen, sillä ”toisin kuin perinteisessä ohjelmistossa käytetyissä logiikkapiireissä, tätä prosessia ei voida seurata sen selvittämiseksi, miksi tietokone päätyy tiettyyn vastaukseen”. Watersin johtopäätös on, että näitä tuloksia ei voida erottaa toisistaan. Tämän tyyppisen aivomallin soveltaminen, jossa data viedään useiden kerrosten läpi, tarkoittaa, että vastausta ei voida helposti jäljittää. Useiden kerrosten muodostaminen on hyvä osa syytä tähän.
Hardesty havaitsi myös, että nämä järjestelmät on "mallinnettu löyhästi ihmisaivojen mukaan". Tämä tuo mukanaan halun rakentaa yhä enemmän prosessointikompleksisuutta, jotta ne yrittäisivät vastata aivojen toimintaa. Tämän tavoitteen tuloksena on neuroverkko, joka "koostuu tuhansista tai jopa miljoonista yksinkertaisista prosessointisolmuista, jotka ovat tiheästi yhteydessä toisiinsa". Data liikkuu näiden solmujen läpi vain yhteen suuntaan. Hardesty havaitsi, että "yksittäinen solmu voi olla yhteydessä useisiin solmuihin sen alapuolella olevassa kerroksessa, josta se vastaanottaa dataa, ja useisiin solmuihin sen yläpuolella olevassa kerroksessa, johon se lähettää dataa".
Ihmisaivojen mallit olivat osa sitä, miten näitä neuroverkkoja ideoitiin ja suunniteltiin alusta alkaen. Tämä on erityisen mielenkiintoista, kun otetaan huomioon, että aivot itsessään olivat aikansa mysteeri (ja monella tapaa ovat sitä edelleen).
Sopeutuminen on koko pelin ydin
Tiedemiehet, kuten Mead ja Kohonen, halusivat luoda järjestelmän, joka kykenisi aidosti sopeutumaan vallitsevaan maailmaan. Se vastaisi sen olosuhteisiin. Mead oli selvä siitä, että neuroverkkojen arvo piilee siinä, että ne voisivat helpottaa tällaista sopeutumista. Tuolloin, pohtien tätä tavoitetta, Sima lisätty että sopeutumisen tuottaminen ”on koko peli”. Tätä sopeutumista tarvitaan, hän ajatteli, ”todellisen maailman luonteen vuoksi”, joka hänen mielestään on ”liian vaihteleva tehdäkseen mitään absoluuttista”.
Tämä ongelma oli otettava huomioon erityisesti siksi, että hän ajatteli, että "hermosto on keksinyt tämän jo kauan sitten". Nämä innovaattorit eivät ainoastaan työskennelleet aivojen ja niiden tuntemattomien kuvien kanssa, vaan he yhdistivät tämän näkemykseen "todellisesta maailmasta" ja sen mukanaan tuomista epävarmuuksista, tuntemattomista asioista ja vaihtelusta. Meadin mielestä järjestelmien oli kyettävä reagoimaan ja sopeutumaan olosuhteisiin. ilman ohje.
Samoihin aikoihin 1990-luvulla Stephen Grossberg – kognitiivisten järjestelmien asiantuntija, joka työskentelee matematiikan, psykologian ja biolääketieteen tekniikan aloilla – väitti myös sitä Sopeutumisen tulisi olla tärkeä askel pitkällä aikavälillä. Grossberg ajatteli neuroverkkomallinnuksen parissa työskennellessään, että kyse on "siitä, miten biologiset mittaus- ja ohjausjärjestelmät on suunniteltu sopeutumaan nopeasti ja vakaasti reaaliajassa nopeasti vaihtelevaan maailmaan". Kuten näimme aiemmin Kohosen "unelmasta" "itseorganisoituvasta" järjestelmästä, "todellisen maailman" käsite muodostaa kontekstin, jossa vasteet ja sopeutuminen koodataan näihin järjestelmiin. Se, miten tämä todellinen maailma ymmärretään ja kuvitellaan, epäilemättä muokkaa sitä, miten nämä järjestelmät on suunniteltu sopeutumaan.
Piilotetut kerrokset
Kerrosten moninkertaistuessa syväoppiminen ulottui uusiin syvyyksiin. Neuroverkkoa koulutetaan harjoitusdatan avulla, joka Hardesty selitti, ”syötetään alimpaan kerrokseen – syöttökerrokseen – ja se kulkee seuraavien kerrosten läpi, kertoutuu ja summautuu yhteen monimutkaisilla tavoilla, kunnes se lopulta saapuu radikaalisti muuttuneena tulostuskerrokseen”. Mitä enemmän kerroksia, sitä suurempi muutos ja sitä suurempi etäisyys syötteestä lähtöön. Grafiikkasuorittimien (GPU) kehitys esimerkiksi peleissä mahdollisti 1960-luvun yksikerroksisten verkkojen ja 1980-luvun kaksi- tai kolmikerroksisten verkkojen kehittymisen nykypäivän kymmen-, viisitoista- tai jopa 50-kerroksisiksi verkoiksi”.
Neuroverkot syvenevät. Itse asiassa juuri tämä kerrosten lisääminen on Hardestyn mukaan se, mihin "syväoppiminen viittaa". Hän ehdottaa, että tällä on merkitystä, koska "tällä hetkellä syväoppiminen on vastuussa parhaiten toimivista järjestelmistä lähes kaikilla tekoälytutkimuksen alueilla".
Mutta mysteeri syvenee entisestään. Neuroverkkojen kerrosten kasautumisen myötä niiden monimutkaisuus on kasvanut. Se on myös johtanut niin sanottujen "piilokerrosten" kasvuun näiden syvyyksien sisällä. Keskustelu neuroverkon piilokerrosten optimaalisesta määrästä on edelleen käynnissä. Mediateoreetikko Beatrice Fazi on kirjoittanut että ”syvän neuroverkon toimintatavan vuoksi, joka perustuu piilotettuihin hermokerroksiin, jotka sijaitsevat ensimmäisen neuronikerroksen (syöttökerros) ja viimeisen kerroksen (lähtökerros) välissä, syväoppimistekniikat ovat usein läpinäkymättömiä tai lukukelvottomia jopa ohjelmoijille, jotka alun perin asettivat ne”.
Kerrosten lisääntyessä (mukaan lukien piilossa olevat kerrokset) niistä tulee entistä vaikeampia selittää – jopa, kuten jälleen kerran käy ilmi, niiden luojille. Samansuuntaisen näkökulman esittää merkittävä ja monitieteinen uuden median ajattelija Katherine Hayles myös huomautti että "sillä, kuinka paljon voimme tietää järjestelmästä, on rajansa, mikä on olennaista neuroverkon ja syväoppimisalgoritmien 'piilotetulle kerrokselle'".
Selittämättömän perässä
Yhdessä nämä pitkät kehityskulut ovat osa sitä, mitä teknologiasosiologi Taina Bucher on kutsunut sitä ”tuntemattoman problematiikaksi”. Laajentaessaan vaikutusvaltaista tieteellisen tiedon tutkimustaan tekoälyn alalle, Harry Collins on huomauttanut siitä Neuroverkkojen tavoitteena on, että ne voi aluksi tuottaa ihminen, mutta ”kerran kirjoitettuna ohjelma elää omaa elämäänsä; ilman valtavaa vaivaa ohjelman toimintatapa voi jäädä mysteeriksi”. Tässä on kaikuja niistä pitkäaikaisista unelmista itseorganisoituvasta järjestelmästä.
Lisäisin tähän, että tuntematonta ja ehkä jopa tietämätöntä on pidetty näiden järjestelmien perustavanlaatuisena osana niiden varhaisimmista vaiheista lähtien. On hyvät mahdollisuudet, että mitä suurempi tekoälyn vaikutus elämäämme on, sitä vähemmän ymmärrämme, miten tai miksi.
Mutta se ei nykyään miellytä monia. Haluamme tietää, miten tekoäly toimii ja miten se johtaa meihin vaikuttaviin päätöksiin ja tuloksiin. Tekoälyn kehityksen muovatessa edelleen tietämystämme ja ymmärrystämme maailmasta, siitä, mitä löydämme, miten meitä kohdellaan, miten opimme, kulutamme ja olemme vuorovaikutuksessa, tämä ymmärryksen halu kasvaa. Kun on kyse selitettävän ja läpinäkyvän tekoälyn osalta, neuroverkkojen tarina kertoo meille, että todennäköisesti etäännymme tästä tavoitteesta tulevaisuudessa sen sijaan, että pääsisimme lähemmäksi sitä.
David BeerSosiologian professori, Yorkin yliopisto
Tämä artikkeli julkaistaan uudelleen Conversation Creative Commons -lisenssin alla. Lue alkuperäinen artikkeli.






