Turing-testi ja ai 10 17

Pexels/Google Deepmind, CC BY-SA

Vuonna 1950 brittiläinen tietojenkäsittelytieteilijä Alan Turing ehdotti kokeellista menetelmää vastatakseen kysymykseen: voivatko koneet ajatella? Hän ehdotti, että jos ihminen ei viiden minuutin kuulustelun jälkeen pysty kertomaan puhuuko tekoälykoneelle vai toiselle ihmiselle, tämä osoittaisi, että tekoälyllä on ihmisen kaltainen älykkyys.

Vaikka tekoälyjärjestelmät olivat kaukana Turingin testin läpäisystä hänen elinaikanaan, hän arveli, että

”[…] noin viidenkymmenen vuoden kuluttua on mahdollista ohjelmoida tietokoneet […] saamaan ne pelaamaan jäljitelmäpeliä niin hyvin, että keskivertokuulustelijalla ei ole yli 70 %:n todennäköisyydellä oikean tunnistuksen tekeminen viiden minuutin kuluttua. kyseenalaistaa.

Tänään, yli 70 vuotta Turingin ehdotuksen jälkeen, yksikään tekoäly ei ole onnistunut läpäisemään testiä täyttämällä hänen hahmottelemiaan erityisehtoja. Siitä huolimatta, kuten joitain otsikoita heijastaa, muutamat järjestelmät ovat tulleet melko lähelle.

Yksi tuore kokeilu testasi kolmea suurta kielimallia, mukaan lukien GPT-4 (ChatGPT:n takana oleva tekoälytekniikka). Osallistujat viettivät kaksi minuuttia chattaillen joko toisen henkilön tai tekoälyjärjestelmän kanssa. Tekoälyä kehotettiin tekemään pieniä kirjoitusvirheitä – ja lopettamaan, jos testaaja tuli liian aggressiiviseksi.


sisäinen tilausgrafiikka


Tällä kehotuksella tekoäly teki hyvää työtä huijatakseen testaajia. Kun testaajat laitettiin pariksi tekoälybotin kanssa, he pystyivät vain arvaamaan oikein, puhuivatko he tekoälyjärjestelmän kanssa 60 % ajasta.

Luonnollisten kielten käsittelyjärjestelmien suunnittelussa saavutetun nopean edistymisen vuoksi voimme nähdä tekoälyn läpäisevän Turingin alkuperäisen testin lähivuosina.

Mutta onko ihmisten matkiminen todella tehokas älykkyystesti? Ja jos ei, mitä vaihtoehtoisia vertailuarvoja voisimme käyttää tekoälyn kykyjen mittaamiseen?

Turingin testin rajoitukset

Vaikka Turingin testin läpäisevä järjestelmä antaa meille jonkin verran todiste siitä, että se on älykäs, tämä testi ei ole ratkaiseva älykkyystesti. Yksi ongelma on se, että se voi tuottaa "vääriä negatiivisia".

Nykypäivän suuret kielimallit on usein suunniteltu heti julistamaan, että ne eivät ole ihmisiä. Esimerkiksi kun kysyt ChatGPT:ltä kysymyksen, se usein johtaa vastauksensa lauseeseen "AI-kielimallina". Vaikka tekoälyjärjestelmillä on taustalla oleva kyky läpäistä Turingin testi, tällainen ohjelmointi ohittaisi tämän kyvyn.

Testissä on myös tiettyjen "väärien positiivisten" riski. Kuten filosofi Ned Block huomautti vuoden 1981 artikkelissa järjestelmä voisi kuvitella läpäisevän Turingin testin yksinkertaisesti koodaamalla siihen ihmisen kaltaisen vastauksen mihin tahansa mahdolliseen syötteeseen.

Tämän lisäksi Turingin testi keskittyy erityisesti ihmisen kognitioon. Jos tekoälyn kognitio eroaa ihmisen kognitiosta, asiantunteva kuulustelija pystyy löytämään tehtävän, jossa tekoälyn ja ihmisen suorituskyky eroaa.

Turing kirjoitti tästä ongelmasta:

Tämä vastalause on erittäin vahva, mutta ainakin voimme sanoa, että jos kone kuitenkin voidaan rakentaa pelaamaan matkimispeliä tyydyttävästi, meidän ei tarvitse huolestua tästä vastalauseesta.

Toisin sanoen, vaikka Turingin testin läpäiseminen on hyvä todiste järjestelmän älykkyydestä, sen epäonnistuminen ei ole hyvä todiste järjestelmästä emme älykäs.

Lisäksi testi ei ole hyvä mittari siitä, ovatko tekoälyt tietoisia, voivatko he tuntea kipua ja mielihyvää vai onko niillä moraalista merkitystä. Monien kognitiivisten tutkijoiden mukaan tietoisuuteen liittyy tietty joukko henkisiä kykyjä, mukaan lukien työmuisti, korkeamman asteen ajatukset ja kyky havaita ympäristönsä ja mallintaa kehon liikkumista sen ympärillä.

Turingin testi ei vastaa kysymykseen siitä, onko tekoälyjärjestelmiä vai ei on näitä kykyjä.

Tekoälyn kasvavat ominaisuudet

Turingin testi perustuu tiettyyn logiikkaan. Toisin sanoen: ihmiset ovat älykkäitä, joten kaikki, mikä voi tehokkaasti jäljitellä ihmisiä, on todennäköisesti älykästä.

Mutta tämä ajatus ei kerro meille mitään älykkyyden luonteesta. Erilainen tapa mitata tekoälyä on ajatella kriittisemmin, mitä älykkyys on.

Tällä hetkellä ei ole olemassa yhtä testiä, jolla voitaisiin mitata luotettavasti tekoälyä tai ihmisälyä.

Laajemmalla tasolla voimme ajatella älykkyyttä kyky saavuttaa erilaisia ​​tavoitteita eri ympäristöissä. Älykkäämpiä järjestelmiä ovat ne, jotka voivat saavuttaa laajemman määrän tavoitteita useammissa ympäristöissä.

Sellaisenaan paras tapa seurata yleiskäyttöisten tekoälyjärjestelmien suunnittelun edistymistä on arvioida niiden suorituskykyä useissa eri tehtävissä. Koneoppimisen tutkijat ovat kehittäneet joukon vertailuarvoja, jotka tekevät tämän.

Esimerkiksi GPT-4 oli osaa vastata oikein 86 % kysymyksistä massiivisessa moniajokielten ymmärtämisessä – vertailukohta, joka mittaa suorituskykyä monivalintatesteissä useissa korkeakoulutason akateemisissa aineissa.

Se teki myös positiivisen maalin AgentBench, työkalu, jolla voidaan mitata suuren kielimallin kykyä toimia agenttina esimerkiksi selaamalla verkkoa, ostamalla tuotteita verkosta ja kilpailemalla peleissä.

Onko Turingin testi edelleen ajankohtainen?

Turingin testi mittaa jäljitelmää – tekoälyn kykyä simuloida ihmisen käyttäytymistä. Suuret kielimallit ovat asiantuntevia jäljittelijöitä, mikä näkyy nyt niiden mahdollisuutena läpäistä Turingin testi. Älykkyys ei kuitenkaan ole sama asia kuin jäljittely.

Älykkyyttä on yhtä montaa tyyppiä kuin on saavutettavia tavoitteita. Paras tapa ymmärtää tekoälyn älykkyyttä on seurata sen edistymistä monien tärkeiden ominaisuuksien kehittämisessä.

Samanaikaisesti on tärkeää, ettemme jatkuvasti "vaihtaisi maalitolppaa", kun kyse on siitä, onko tekoäly älykäs. Koska tekoälyn ominaisuudet paranevat nopeasti, tekoälyn ajatuksen arvostelijat löytävät jatkuvasti uusia tehtäviä, joiden suorittamisessa tekoälyjärjestelmillä voi olla vaikeuksia – vain huomatakseen, että ne ovat hypänneet yli. vielä yksi este.

Tässä asetuksessa olennainen kysymys ei ole, ovatko tekoälyjärjestelmät älykkäitä, vaan tarkemmin sanottuna mitä erilaisia älykkyydestä, jota heillä voi olla.Conversation

Simon Goldstein, apulaisprofessori, Dianoia Institute of Philosophy, Australian Catholic University, Australian katolinen yliopisto ja Cameron Domenico Kirk-Giannini, filosofian apulaisprofessori, Rutgers University

Tämä artikkeli julkaistaan ​​uudelleen Conversation Creative Commons -lisenssin alla. Lue alkuperäinen artikkeli.