Shutterstock/Valentyn640

Vuonna 1956 matemaatikko ja teoreettinen biologi Jack D. Cowan vieraili Wilfred Taylorin ja hänen oudon uuden "oppimiskone”. Saapuessaan hän oli hämmentynyt "valtavasta laitepankista", joka häntä kohtasi. Cowan saattoi vain seistä sivussa ja katsoa "koneen tekevän asiansa". Asia, jonka se näytti tekevän, oli "assosiatiivisen muistimallin" suorittaminen – se näytti voivan oppia löytämään yhteyksiä ja hakemaan tietoja.

Se saattoi näyttää kömpelöiltä piirilohkoilta, jotka oli juotettu käsin yhteen johtojen ja laatikoiden massaksi, mutta Cowanin näkemys oli hermoverkon varhainen analoginen muoto – edeltäjä nykypäivän edistyneimmälle tekoälylle, mukaan lukien paljon keskusteltu ChatGPT kyky tuottaa kirjallista sisältöä vastauksena melkein mihin tahansa komentoon. ChatGPT:n taustalla oleva tekniikka on hermoverkko.

Kun Cowan ja Taylor seisoivat ja katselivat koneen toimintaa, heillä ei todellakaan ollut aavistustakaan tarkalleen, kuinka se onnistui suorittamaan tämän tehtävän. Vastaus Taylorin mysteerikoneen aivoihin löytyy jostain sen "analogisista neuroneista", sen konemuistin muodostamista assosiaatioista ja mikä tärkeintä, siitä, että sen automatisoitua toimintaa ei oikeastaan ​​pystytty täysin selittämään. Kestäisi vuosikymmeniä, ennen kuin nämä järjestelmät löytävät tarkoituksensa ja että teho vapautuu.

Termi hermoverkko sisältää laajan valikoiman järjestelmiä, mutta kuitenkin keskitetysti, IBM: n mukaan, nämä "hermoverkot – tunnetaan myös nimellä keinotekoiset hermoverkot (ANN) tai simuloidut hermoverkot (SNN) - ovat koneoppimisen osajoukko ja ovat syvän oppimisalgoritmien ytimessä. Ratkaisevaa on, että itse termi ja niiden muoto ja rakenne ovat inspiroineet ihmisen aivoista, ja ne jäljittelevät tapaa, jolla biologiset neuronit viestivät toisilleen.

Niiden arvosta on saattanut jäädä epäilyksiä alkuvaiheessa, mutta vuosien kuluessa tekoälyt ovat kääntyneet voimakkaasti kohti neuroverkkoja. Niiden ymmärretään nykyään usein olevan tekoälyn tulevaisuus. Niillä on suuri merkitys meihin ja siihen, mitä tarkoittaa olla ihminen. Olemme kuulleet näistä huolenaiheista viime aikoina kehotuksella keskeyttämään uudet tekoälykehitykset kuudeksi kuukaudeksi, jotta varmistetaan luottamus niiden vaikutuksiin.


sisäinen tilausgrafiikka


Olisi varmasti virhe hylätä hermoverkko, koska se koskee vain kiiltäviä, katseenvangitsevia uusia vempaimia. Ne ovat jo vakiintuneet elämäämme. Jotkut ovat vahvoja käytännöllisyydessään. Jo vuonna 1989 Yann LeCunin johtama ryhmä AT&T Bell Laboratoriesissa käytti takaisin leviämistekniikoita kouluttaakseen järjestelmän tunnistaa käsinkirjoitetut postinumerot. Viimeisin Microsoftin ilmoitus se, että Bing-haut tulevat olemaan tekoälyn tehostamia, mikä tekee siitä "verkon kopilotti", havainnollistaa, kuinka löytämämme asiat ja kuinka ymmärrämme ne, ovat yhä useammin tämän tyyppisen automaation tuotetta.

Valtavien tietojen hyödyntäminen kuvioiden löytämiseksi. Tekoälyä voidaan samalla tavalla kouluttaa suorittamaan esimerkiksi kuvien nopea tunnistaminen – jolloin ne sisällytetään kasvot, esimerkiksi. Tämä kyky tunnistaa kuvioita on johtanut moniin muihin sovelluksiin, kuten osakemarkkinoiden ennustaminen.

Neuroverkot muuttavat myös tapaamme tulkita ja kommunikoida. Mielenkiintoisen otsikon kehittämä Google Brain Team, Google Translate on toinen näkyvä hermoverkon sovellus.

Et myöskään halua pelata shakkia tai shogia yhdelläkään. Heidän sääntökäsityksensä ja strategioiden ja kaikkien tallennettujen liikkeiden muistaminen tarkoittaa, että he ovat poikkeuksellisen hyviä peleissä (vaikka ChatGPT näyttää taistella Wordlen kanssa). Ihmisten Go-pelaajia (Go on tunnetusti hankala strategialautapeli) ja shakin suurmestareita huolestuttavat järjestelmät ovat tehty neuroverkoista.

Mutta niiden ulottuvuus ulottuu paljon näitä tapauksia pidemmälle ja laajenee edelleen. Patenttihaku, joka rajoittuu vain mainitsemaan tarkka ilmaus "hermoverkot", tuottaa 135,828 XNUMX tulosta. Tämän nopean ja jatkuvan laajentumisen myötä mahdollisuudet, että pystymme selittämään tekoälyn vaikutuksen täysin, voivat heiketä entisestään. Nämä ovat kysymyksiä, joita olen tutkinut tutkimuksessani ja uusi kirjani algoritmisesta ajattelusta.

Salaperäiset "tietämättömyyden" kerrokset

Neuroverkkojen historian tarkastelu kertoo meille jotain tärkeää automatisoiduista päätöksistä, jotka määrittävät nykyisyytemme tai niistä, joilla on mahdollisesti syvällisempi vaikutus tulevaisuudessa. Heidän läsnäolonsa kertoo myös, että ymmärrämme tekoälyn päätökset ja vaikutukset ajan myötä vieläkin vähemmän. Nämä järjestelmät eivät ole vain mustia laatikoita, ne eivät ole vain piilotettuja osia järjestelmästä, joita ei voi nähdä tai ymmärtää.

Se on jotain erilaista, mikä perustuu itse näiden järjestelmien tavoitteisiin ja suunnitteluun. Pitkään jatkunut selittämättömän tavoittelu. Mitä läpinäkymättömämpi, sitä autenttisempi ja edistyneempi järjestelmän ajatellaan olevan. Kyse ei ole vain järjestelmien monimutkaisemisesta tai pääsyä rajoittavista teollis- ja tekijänoikeuksien hallinnasta (vaikka ne ovatkin osa sitä). Sen sijaan sanotaan, että heitä ohjaavalla eetolla on erityinen ja juurtunut kiinnostus "tietämättömyyteen". Mysteeri on jopa koodattu hermoverkon muotoon ja diskurssiin. Niissä on syvälle kasattuja kerroksia – tästä johtuu ilmaus syväoppiminen – ja noissa syvyyksissä on vielä salaperäisemmiltä kuulostavia "piilotettuja kerroksia". Näiden järjestelmien mysteerit ovat syvällä pinnan alla.

On hyvä mahdollisuus, että mitä suurempi tekoälyn vaikutus elämäämme on, sitä vähemmän ymmärrämme miten tai miksi. Nykyään tekoälylle on voimakas paine, joka on selitettävissä. Haluamme tietää, miten se toimii ja miten se tekee päätöksiä ja tuloksia. EU on niin huolissaan mahdollisesti "kelvottomista riskeistä" ja jopa "vaarallisista" sovelluksista, että se etenee parhaillaan uusi tekoälylaki tarkoituksena on asettaa "maailmanlaajuinen standardi" "turvallisen, luotettavan ja eettisen tekoälyn kehittämiselle".

Nämä uudet lait perustuvat selitettävyyden tarpeeseen, vaativat sitä "korkean riskin tekoälyjärjestelmissä korkealaatuisten tietojen, dokumentoinnin ja jäljitettävyyden, avoimuuden, inhimillisen valvonnan, tarkkuuden ja vankuuden vaatimukset ovat ehdottoman välttämättömiä tekoälyn perusoikeuksille ja turvallisuudelle aiheutuvien riskien vähentämiseksi." Tämä ei koske vain asioita, kuten itseohjautuvia autoja (vaikka turvallisuuden takaavat järjestelmät kuuluvat EU:n korkean riskin tekoälyn luokkaan), on myös huoli siitä, että tulevaisuudessa ilmaantuu järjestelmiä, joilla on vaikutuksia ihmisoikeuksiin.

Tämä on osa laajempia vaatimuksia tekoälyn avoimuudesta, jotta sen toimintaa voidaan tarkastaa, auditoida ja arvioida. Toinen esimerkki olisi Royal Societyn Selitettävää tekoälyä koskeva toimintaohje jossa he huomauttavat, että "poliittisissa keskusteluissa eri puolilla maailmaa nähdään yhä enemmän vaatimuksia jonkinlaisesta tekoälyn selittävyydestä osana pyrkimyksiä sisällyttää eettiset periaatteet tekoälyä tukevien järjestelmien suunnitteluun ja käyttöönottoon".

Mutta hermoverkkojen tarina kertoo meille, että tulemme todennäköisesti kauemmaksi tästä tavoitteesta tulevaisuudessa, emmekä lähempänä sitä.

Ihmisaivojen inspiroima

Nämä neuroverkot voivat olla monimutkaisia ​​järjestelmiä, mutta niillä on joitain ydinperiaatteita. Ihmisaivojen inspiroimana he pyrkivät kopioimaan tai simuloimaan biologisen ja ihmisen ajattelun muotoja. Rakenteeltaan ja muotoilultaan ne ovat mm IBM myös selittää, joka koostuu "solmukerroksista, jotka sisältävät syöttökerroksen, yhden tai useamman piilotetun kerroksen ja tulostuskerroksen". Tässä "jokainen solmu tai keinotekoinen neuroni muodostaa yhteyden toiseen". Koska ne vaativat syötteitä ja tietoja tulosten luomiseen, ne "luottavat koulutustietoihin oppiakseen ja parantaakseen tarkkuuttaan ajan myötä". Näillä teknisillä yksityiskohdilla on merkitystä, mutta niin on myös halu mallintaa näitä järjestelmiä ihmisaivojen monimutkaisuuden perusteella.

Näiden järjestelmien taustalla olevan kunnianhimoisen tavoitteen ymmärtäminen on elintärkeää, jotta ymmärretään, mitä nämä tekniset yksityiskohdat ovat tulleet tarkoittamaan käytännössä. Jonkin sisällä 1993 haastattelu, hermoverkkotutkija Teuvo Kohonen totesi, että "itseorganisoituva" järjestelmä "on unelmani", joka toimii "jotain sen kaltaista, mitä hermostomme tekee vaistomaisesti". Esimerkkinä Kohonen kuvasi, kuinka "itseorganisoituvaa" järjestelmää, itseään valvovaa ja hallitsevaa järjestelmää "voidaan käyttää minkä tahansa koneen valvontapaneelina … jokaisessa lentokoneessa, suihkukoneessa tai jokaisessa ydinvoimalassa tai jokaisessa auto". Tämä tarkoittaisi hänen mielestään sitä, että tulevaisuudessa "näet heti, missä kunnossa järjestelmä on".

Yleistavoitteena oli saada järjestelmä, joka pystyy mukautumaan ympäristöönsä. Se olisi välitön ja autonominen, toimien hermoston tyyliin. Se oli unelma saada järjestelmiä, jotka selviäisivät itsestään ilman paljon ihmisen väliintuloa. Aivojen, hermoston ja todellisen maailman monimutkaisuus ja tuntemattomuus tulevat pian vaikuttamaan hermoverkkojen kehitykseen ja suunnitteluun.

"Jotain hämärää siinä"

Mutta palatakseni vuoteen 1956 ja tuohon outoon oppimiskoneeseen, Cowanin huomio kiinnitti välittömästi Taylorin käyttämä käytännönläheinen lähestymistapa sitä rakentaessaan. Hän oli selvästi hikoillut palasten ja osien kokoonpanosta. Taylor, Cowan huomautti haastattelussa omalta osaltaan näiden järjestelmien tarinassa, "ei tehnyt sitä teorian perusteella, eikä hän tehnyt sitä tietokoneella". Sen sijaan työkalut käsissään hän "todellisuudessa rakensi laitteiston". Se oli aineellinen asia, osien yhdistelmä, ehkä jopa juoni. Ja se oli "kaikki tehty analogisilla piireillä" ottaen Taylor, Cowan huomauttaa, "useita vuosia sen rakentamiseen ja sen kanssa pelaamiseen". Yrityksen ja erehdyksen tapaus.

Ymmärrettävästi Cowan halusi päästä käsiksi näkemäänsä. Hän yritti saada Taylorin selittämään hänelle tämän oppimiskoneen. Selvennykset eivät tulleet. Cowan ei saanut Tayloria kuvailemaan hänelle, kuinka asia toimi. Analogiset neuronit jäivät mysteeriksi. Yllättävämpi ongelma Cowanin mielestä oli, että Taylor "ei oikein ymmärtänyt itse, mitä oli tekeillä". Tämä ei ollut vain hetkellinen häiriö kahden eri erikoisalojen tutkijan välisessä kommunikaatiossa, se oli enemmän.

Vuonna haastattelu 1990-luvun puolivälistäajatellen Taylorin konetta, Cowan paljasti, että "tähän päivään mennessä julkaistuissa papereissa ei voi täysin ymmärtää, miten se toimii". Tämä johtopäätös viittaa siihen, kuinka tuntematon on upotettu syvälle hermoverkkoihin. Näiden hermojärjestelmien selittämättömyys on ollut läsnä jopa perus- ja kehitysvaiheista lähtien, jotka ulottuvat lähes seitsemän vuosikymmenen taakse.

Tämä mysteeri on edelleen olemassa, ja se löytyy kehittyvistä tekoälyn muodoista. Taylorin koneen muodostamien assosiaatioiden toiminnan käsittämättömyys sai Cowanin miettimään, oliko siinä "jotain hämärää".

Pitkät ja takkuiset juuret

Cowan viittasi lyhyeen vierailuunsa Taylorin kanssa, kun häneltä kysyttiin hänen oman teoksensa vastaanotosta joitain vuosia myöhemmin. Cowan pohtii, että 1960-luvulla ihmiset olivat "hieman hitaita näkemään analogisen hermoverkon pointin". Tämä tapahtui siitä huolimatta, Cowan muistelee, että Taylorin 1950-luvun työ "assosiatiivisesta muistista" perustui "analogisiin neuroniin". Nobel-palkittu hermojärjestelmien asiantuntija, Leon N. Cooper päätti että aivomallin soveltamiseen liittyvää kehitystä 1960-luvulla pidettiin "syvien mysteerien joukossa". Tästä epävarmuudesta johtuen säilyi skeptisyys sen suhteen, mitä hermoverkko voisi saavuttaa. Mutta asiat alkoivat pikkuhiljaa muuttua.

Noin 30 vuotta sitten neurotieteilijä Walter J. Freeman, joka yllättyi "huomattava” hermoverkkoille löydetty valikoima sovelluksia, kommentoi jo sitä, ettei hän nähnyt niitä ”persoonallisen uudenlaisena koneena”. Ne olivat hidasta polttamista, ja tekniikka tuli ensin ja sitten siihen löydettiin myöhempiä sovelluksia. Tämä vei aikaa. Löytääksemme hermoverkkoteknologian juuret saatamme mennä jopa pidemmälle kuin Cowanin vierailu Taylorin salaperäiseen koneeseen.

Neuraaliverkkotutkija James Anderson ja tiedetoimittaja Edward Rosenfeld ovat huomanneet että neuroverkkojen tausta juontaa juurensa 1940-luvulle ja joihinkin varhaisiin yrityksiin, kuten ne kuvailevat, "ymmärtää ihmisen hermostoa ja rakentaa keinotekoisia järjestelmiä, jotka toimivat kuten me, ainakin vähän". Ja niin 1940-luvulla ihmisen hermoston mysteereistä tuli myös laskennallisen ajattelun ja tekoälyn mysteereitä.

Yhteenvetona tämän pitkän tarinan tietojenkäsittelytieteen kirjoittaja Larry Hardesty on huomauttanut että syvä oppiminen neuroverkkojen muodossa "on ollut muodissa ja pois muodista yli 70 vuoden ajan". Tarkemmin sanottuna hän lisää, että "näitä hermoverkkoja ehdottivat ensimmäisen kerran vuonna 1944 Warren McCulloch ja Walter Pitts, kaksi Chicagon yliopiston tutkijaa, jotka muuttivat MIT:ään vuonna 1952 perustajajäseninä, mitä joskus kutsutaan ensimmäiseksi kognitiotieteen laitokseksi".

Muualla, 1943 on joskus annettu päivämäärä tekniikan ensimmäisenä vuotena. Joka tapauksessa noin 70 vuoden ajan kertomukset viittaavat siihen, että neuroverkot ovat siirtyneet muodissa ja pois muodissa, usein laiminlyötyinä, mutta joskus ne ovat ottaneet haltuunsa ja siirtyneet valtavirran sovelluksiin ja keskusteluihin. Epävarmuus jatkui. Nuo varhaiset kehittäjät kuvailevat usein tutkimuksensa tärkeyttä huomiotta jätetyksi, kunnes se löysi tarkoituksensa usein vuosia ja joskus vuosikymmeniä myöhemmin.

Siirtyessämme 1960-luvulta 1970-luvun lopulle voimme löytää lisää tarinoita näiden järjestelmien tuntemattomista ominaisuuksista. Jo silloin, kolmen vuosikymmenen jälkeen, hermoverkon oli vielä löydettävä tarkoituksensa. David Rumelhart, jolla oli psykologian tausta ja joka oli mukana kirjoittamassa vuonna 1986 julkaistuja kirjoja, jotka myöhemmin ohjasivat huomion takaisin hermoverkkoihin, huomasi tekevänsä yhteistyötä hermoverkkojen kehittämisessä. kollegansa Jay McClellandin kanssa.

Sen lisäksi, että he olivat kollegoita, he olivat äskettäin tavanneet toisensa Minnesotan konferenssissa, jossa Rumelhartin puhe "tarinoiden ymmärtämisestä" oli herättänyt keskustelua delegaattien keskuudessa.

Konferenssin jälkeen McClelland palasi pohtien, kuinka kehittää hermoverkko, joka voisi yhdistää malleja interaktiivisemmiksi. Tässä on merkitystä Rumelhartin muisto "Tietokoneen puuhastelun tunteista ja tunteista".

Istuimme alas ja teimme kaiken tämän tietokoneen ääressä ja rakensimme näitä tietokonemalleja, emmekä vain ymmärtäneet niitä. Emme ymmärtäneet, miksi he toimivat tai miksi he eivät toimineet tai mikä heissä oli kriittistä.

Kuten Taylor, Rumelhart huomasi puuhailevansa järjestelmää. Hekin loivat toimivan hermoverkon, ja mikä tärkeintä, he eivät myöskään olleet varmoja, kuinka tai miksi se toimi niin kuin se toimi, näennäisesti oppien tiedoista ja löytämään assosiaatioita.

Aivojen matkiminen - kerros kerrokselta

Olet ehkä jo huomannut, että kun keskustellaan hermoverkkojen alkuperästä, mielikuva aivoista ja sen aiheuttama monimutkaisuus eivät ole koskaan kaukana. Ihmisaivot toimivat eräänlaisena mallina näille järjestelmille. Varsinkin alkuvaiheessa aivoista – vielä yksi suurista tuntemattomista – tuli malli siitä, miten hermoverkko voisi toimia.

Joten nämä kokeelliset uudet järjestelmät mallinnettiin jostakin, jonka toiminta itse oli suurelta osin tuntematon. Neurotietokoneinsinööri Carver Mead on puhunut paljastavasti "kognitiivisen jäävuoren" käsityksestä, jota hän piti erityisen houkuttelevana. Se on vain tietoisuuden jäävuoren huippu, josta olemme tietoisia ja joka on näkyvissä. Loput mittakaava ja muoto jää tuntemattomaksi pinnan alla.

Vuonna 1998, James Anderson, joka oli työskennellyt jonkin aikaa hermoverkkojen parissa, totesi, että aivojen tutkimuksessa "suurin löytömme näyttää olevan tietoisuus siitä, että emme todellakaan tiedä mitä tapahtuu".

Yksityiskohtaisessa selvityksessä Financial Times vuonna 2018Teknologiatoimittaja Richard Waters totesi, että hermoverkot "mallinnetaan teorian mukaan siitä, kuinka ihmisen aivot toimivat, kuljettaen tietoja keinotekoisten hermosolujen kerrosten läpi, kunnes tunnistettavissa oleva kuvio syntyy". Tämä luo väliongelman, Waters ehdotti, koska "toisin kuin perinteisessä ohjelmistossa käytetyt logiikkapiirit, tätä prosessia ei ole mahdollista seurata tarkasti, miksi tietokone antaa tietyn vastauksen". Watersin johtopäätös on, että näitä tuloksia ei voida poistaa. Tämän tyyppisen aivomallin soveltaminen, joka vie tiedot useiden kerrosten läpi, tarkoittaa, että vastausta ei voida helposti jäljittää. Monikerroksisuus on hyvä osa syy tähän.

Hardesty havaittiin myös, että nämä järjestelmät on "mallinnettu löyhästi ihmisen aivoissa". Tämä tuo innokkuuden rakentaa yhä enemmän prosessoinnin monimutkaisuutta, jotta voidaan yrittää vastata aivoihin. Tämän tavoitteen tuloksena on hermoverkko, joka "koostuu tuhansista tai jopa miljoonista yksinkertaisista käsittelysolmuista, jotka ovat tiiviisti yhteydessä toisiinsa". Data liikkuu näiden solmujen läpi vain yhteen suuntaan. Hardesty havaitsi, että "yksittäinen solmu saattaa olla yhteydessä useisiin solmuihin sen alla olevassa kerroksessa, josta se vastaanottaa dataa, ja useisiin solmuihin sen yläpuolella olevassa kerroksessa, joille se lähettää dataa".

Ihmisaivojen mallit olivat osa sitä, miten nämä hermoverkot suunniteltiin ja suunniteltiin alusta alkaen. Tämä on erityisen mielenkiintoista, kun otamme huomioon, että aivot olivat itse aikansa mysteeri (ja on monin tavoin edelleen).

"Sopeutuminen on koko peli"

Meadin ja Kohosen kaltaiset tutkijat halusivat luoda järjestelmän, joka voisi aidosti mukautua maailmaan, jossa se oli. Se vastaisi sen ehtoihin. Mead oli selvää, että hermoverkkojen arvo oli se, että ne voisivat helpottaa tämäntyyppistä sopeutumista. Tuolloin ja tätä kunnianhimoa pohdittaessa Mead lisäsi että sopeutumisen tuottaminen "on koko peli". Tätä sopeutumista tarvitaan hänen mielestään "todellisen maailman luonteen vuoksi", jonka hän totesi olevan "liian vaihteleva tehdäkseen mitään absoluuttista".

Tämä ongelma oli otettava huomioon varsinkin siksi, että hänen mielestään tämä oli jotain "hermosto on keksinyt kauan sitten". Nämä keksijät eivät vain työskennelleet kuvan aivoista ja niiden tuntemattomista parissa, vaan he yhdistivät tämän näkemykseen "todellisesta maailmasta" ja sen tuomiin epävarmuuksiin, tuntemattomiin ja vaihteluihin. Mead ajatteli, että järjestelmien oli kyettävä reagoimaan ja mukautumaan olosuhteisiin ilman ohje.

Samoihin aikoihin 1990-luvulla Stephen Grossberg – matematiikan, psykologian ja biolääketieteen tekniikan parissa työskentelevä kognitiivisten järjestelmien asiantuntija – väitti myös sitä sopeutuminen oli tärkeä askel pidemmällä aikavälillä. Grossberg, kun hän työskenteli neuroverkkomallinnuksen parissa, ajatteli itsekseen, että kyse on siitä, kuinka biologiset mittaus- ja ohjausjärjestelmät on suunniteltu mukautumaan nopeasti ja vakaasti reaaliajassa nopeasti vaihtelevaan maailmaan. Kuten näimme aiemmin Kohosen "unelman" "itseorganisoituvasta" järjestelmästä, "todellisen maailman" käsitteestä tulee konteksti, jossa reagointi ja sopeutuminen koodataan näihin järjestelmiin. Se, miten tämä todellinen maailma ymmärretään ja kuvitellaan, vaikuttaa epäilemättä siihen, miten nämä järjestelmät on suunniteltu sopeutumaan.

Piilotetut kerrokset

Kun kerrokset lisääntyivät, syvä oppiminen loi uusia syvyyksiä. Neuraaliverkkoa koulutetaan käyttämällä koulutusdataa, joka Hardesty selitti, "syötetään alimmalle kerrokselle - syöttökerrokselle - ja se kulkee seuraavien kerrosten läpi, moninkertaistuen ja summautuen yhteen monimutkaisin tavoin, kunnes se lopulta saapuu radikaalisti muunnettuina lähtökerrokseen". Mitä enemmän kerroksia, sitä suurempi muunnos ja sitä suurempi etäisyys tulosta ulostuloon. Graphics Processing Units (GPU:t) -kehitys, esimerkiksi pelaamisessa, Hardesty lisäsi, että "1960-luvun yksikerroksiset verkot ja 1980-luvun kaksi-kolmikerroksiset verkot kasvoivat kymmeneksi, 15- tai jopa 50-luvuksi. - nykypäivän kerrosverkot”.

Neuroverkot syvenevät. Itse asiassa tämä kerrosten lisääminen on Hardestyn mukaan sitä, mitä "syvä oppiminen" tarkoittaa". Tällä on merkitystä, hän ehdottaa, koska "tällä hetkellä syväoppiminen on vastuussa parhaiten suoriutuvista järjestelmistä melkein kaikilla tekoälytutkimuksen osa-alueilla".

Mutta mysteeri syvenee entisestään. Kun hermoverkkojen kerrokset ovat kasaantuneet, niiden monimutkaisuus on kasvanut. Se on myös johtanut "piilotettujen kerrosten" kasvuun näissä syvyyksissä. Keskustelu neuroverkon piilokerrosten optimaalisesta määrästä on käynnissä. Mediateoreetikko Beatrice Fazi on kirjoittanut "Koska syvä hermoverkko toimii, luottaen piilotettuihin hermokerroksiin, jotka ovat välissä ensimmäisen neuronikerroksen (syöttökerros) ja viimeisen kerroksen (tulostuskerros), syväoppimistekniikat ovat usein läpinäkymättömiä tai jopa lukukelvottomia. ohjelmoijat, jotka alun perin asettivat ne”.

Kun tasot lisääntyvät (mukaan lukien piilotetut kerrokset), niistä tulee entistä vähemmän selitettäviä – jopa, kuten jälleen kerran käy ilmi, niille, jotka ne luovat. Saman asian esitti näkyvä ja monitieteinen uuden median ajattelija Katherine Hayles myös huomautti että on rajat "kuinka paljon voimme tietää järjestelmästä, mikä on olennaista "piilotetun kerroksen" kannalta hermoverkossa ja syväoppimisalgoritmeissa".

Selittämättömän tavoittelua

Yhdessä nämä pitkät kehityssuunnat ovat osa teknologian sosiologin näkemystä Taina Bucher on kutsunut "tuntemattoman ongelmaksi". Harry Collins laajentaa vaikutusvaltaista tieteellistä tutkimustaan ​​tekoälyn alalle on huomauttanut siitä hermoverkkojen tavoitteena on, että ne voivat olla ihmisen tuottamia, ainakin alun perin, mutta "kirjoitettuaan ohjelma elää ikään kuin omaa elämäänsä; ilman suuria ponnisteluja, kuinka ohjelma toimii, voi jäädä salaperäiseksi." Tässä on kaikuja noista pitkäaikaisista unelmista itseorganisoituvasta järjestelmästä.

Lisäisin tähän vielä, että tuntematonta ja ehkä jopa tuntematonta on tavoiteltu näiden järjestelmien perustavanlaatuisena osana niiden varhaisista vaiheista lähtien. On hyvä mahdollisuus, että mitä suurempi tekoälyn vaikutus elämäämme on, sitä vähemmän ymmärrämme miten tai miksi.

Mutta se ei sovi monille nykyään. Haluamme tietää, miten tekoäly toimii ja miten se tekee meihin vaikuttavia päätöksiä ja tuloksia. Tekoälyn kehitys jatkaa tietämyksemme ja ymmärryksemme muovaamista maailmasta, siitä, mitä löydämme, kuinka meitä kohdellaan, kuinka opimme, kulutamme ja olemme vuorovaikutuksessa, tämä ymmärtämisen sysäys kasvaa. Mitä tulee selitettäviin ja läpinäkyvään tekoälyyn, hermoverkkojen tarina kertoo meille, että tulemme todennäköisesti tulevaisuudessa kauemmaksi tästä tavoitteesta kuin lähemmäs sitä.

David BeerSosiologian professori, Yorkin yliopisto

Tämä artikkeli julkaistaan ​​uudelleen Conversation Creative Commons -lisenssin alla. Lue alkuperäinen artikkeli.