Daboost / Shutterstock

Kanssa äskettäinen irtisanominen ja nopea uudelleen palkkaaminen OpenAI:n Sam Altmanin keskustelut tekoälyn (AI) kehittämisestä ja käytöstä ovat jälleen valokeilassa. Vielä epätavallisempaa on, että näkyvä teema mediaraportoinnissa on ollut kyky Tekoälyjärjestelmät matematiikan tekemiseen.

Ilmeisesti osa OpenAI:n draamasta liittyi yrityksen kehittämään uutta AI-algoritmi nimeltä Q*. Järjestelmästä on puhuttu merkittävänä edistysaskeleena ja yksi sen keskeisistä ominaisuuksista oli kyky ajatella matemaattisesti.

Mutta eikö matematiikka ole tekoälyn perusta? Kuinka tekoälyjärjestelmällä voi olla ongelmia matemaattisen päättelyn kanssa, kun otetaan huomioon, että tietokoneet ja laskimet voivat suorittaa matemaattisia tehtäviä?

AI ei ole yksittäinen kokonaisuus. Se on tilkkutäkki strategioita laskennan suorittamiseksi ilman suoria ohjeita ihmisiltä. Kuten näemme, jotkut tekoälyjärjestelmät ovat päteviä matematiikassa.

Yksi tärkeimmistä nykyisistä teknologioista, AI-chatbottien, kuten ChatGPT:n, takana olevat suuret kielimallit (LLM) on kuitenkin kamppaillut toistaiseksi matemaattisen päättelyn jäljittelemisessä. Tämä johtuu siitä, että ne on suunniteltu keskittymään kieleen.


sisäinen tilausgrafiikka


Jos yrityksen uusi Q*-algoritmi pystyy ratkaisemaan ennennäkemättömiä matemaattisia ongelmia, niin se saattaa hyvinkin olla merkittävä läpimurto. Matematiikka on ikivanha ihmisen päättelyn muoto suuret kielimallit (LLM) ovat tähän mennessä kamppailleet jäljitelläkseen. LLM:t ovat tekniikka, joka on järjestelmien, kuten esim OpenAI:n ChatGPT.

Kirjoitushetkellä Q*-algoritmin yksityiskohdat ja sen ominaisuudet ovat rajallisia, mutta erittäin kiehtovia. On siis otettava huomioon useita hienouksia, ennen kuin Q*:n katsotaan menestyneen.

Esimerkiksi matematiikka on aine, johon kaikki osallistuvat vaihtelevasti, ja matematiikan taso, jossa Q* on pätevä, jää epäselväksi. On kuitenkin julkaistu akateemista työtä, joka käyttää vaihtoehtoisia tekoälyn muotoja edistääkseen tutkimustason matematiikkaa (mukaan lukien joitain itse kirjoittamiani, ja yhden on kirjoittanut matemaatikot yhteistyössä Google DeepMindin tutkijoiden kanssa).

Näitä tekoälyjärjestelmiä voitaisiin kuvata matematiikan osaajiksi. On kuitenkin todennäköistä, että Q*:ta ei käytetä tutkijoiden auttamiseksi heidän työssään, vaan se on tarkoitettu muuhun tarkoitukseen.

Siitä huolimatta, vaikka Q* ei pystykään lyömään huippututkimuksen rajoja, sen rakentamisella on hyvin todennäköisesti löydettävissä jotain merkitystä, joka voi nostaa esiin houkuttelevia mahdollisuuksia tulevalle kehitykselle.

Yhä mukavampi

Yhteiskuntana olemme yhä tyytyväisempiä siihen, että erikoistunutta tekoälyä käytetään ennalta määrättyjen ongelmien ratkaisemiseen. Esimerkiksi, digitaaliset avustajat, kasvotja online-suositusjärjestelmät on tuttu useimmille ihmisille. Se mikä jää epäselväksi, on ns "Yleinen tekoäly" (AGI) jolla on laajat päättelykyvyt, jotka ovat verrattavissa ihmisen kykyihin.

Matematiikka on perustaito, jonka haluamme opettaa jokaiselle koululaiselle, ja se on varmasti tärkeä virstanpylväs AGI:n etsinnässä. Miten muuten matemaattisesti pätevät tekoälyjärjestelmät auttaisivat yhteiskuntaa?

Matemaattisella ajattelutavalla on merkitystä monissa sovelluksissa, esimerkiksi koodauksessa ja suunnittelussa, ja siksi matemaattinen päättely on elintärkeä siirrettävä taito sekä ihmiselle että tekoälylle. Yksi ironista on, että tekoäly perustuu perustasolla matematiikkaan.

Esimerkiksi monet tekoälyalgoritmien toteuttamista tekniikoista tiivistyvät lopulta matemaattiseen alueeseen, joka tunnetaan nimellä matriisialgebra. Matriisi on yksinkertaisesti numeroverkko, josta digitaalinen kuva on tuttu esimerkki. Jokainen pikseli on ei muuta kuin numeerista dataa.

Suuret kielimallit ovat myös luonnostaan ​​matemaattisia. Valtavan tekstinäytteen perusteella kone voi oppia sanojen todennäköisyydet todennäköisimmin noudattaa käyttäjän kehotusta (tai kysymystä). chatbotille. Jos haluat valmiiksi koulutetun LLM:n erikoistuvan tiettyyn aiheeseen, se voidaan hienosäätää matemaattiseen kirjallisuuteen tai mihin tahansa muuhun oppimisalueeseen. LLM voi luoda tekstiä, joka lukee ikään kuin se ymmärtäisi matematiikkaa.

Valitettavasti tämän tekeminen tuottaa LLM:n, joka on hyvä bluffaamaan, mutta huono yksityiskohdissa. Ongelmana on, että matemaattinen lause on määritelmän mukaan sellainen, jolle voidaan antaa an yksiselitteinen Boolen arvo (eli tosi tai taru). Matemaattinen päättely merkitsee uusien matemaattisten väitteiden loogista päättämistä aiemmin vahvistetuista.

paholaisen asianajaja

Luonnollisesti mikä tahansa lähestymistapa matemaattiseen päättelyyn, joka perustuu kielellisiin todennäköisyyksiin, tulee ajamaan kaistansa ulkopuolella. Yksi tapa kiertää tämä voisi olla sisällyttää arkkitehtuuriin jokin muodollinen varmennusjärjestelmä (täsmälleen kuinka LLM on rakennettu), joka tarkistaa jatkuvasti suuren kielimallin tekemien hyppyjen takana olevaa logiikkaa.

Vihje, että tämä on tehty, voisi olla nimessä Q*, joka voisi uskottavasti viitata Algoritmi kehitettiin aina 1970-luvulla auttamaan deduktiivista päättelyä. Vaihtoehtoisesti Q* voisi viitata Q-oppimiseen, jossa malli voi kehittyä ajan myötä testaamalla ja palkitsemalla oikeita johtopäätöksiä.

Mutta matemaattisesti kykenevien tekoälyjen rakentamiseen liittyy useita haasteita. Esimerkiksi jotkut mielenkiintoisimmista matematiikasta koostuu erittäin epätodennäköisistä tapahtumista. On monia tilanteita, joissa voidaan ajatella, että kaava on olemassa pienten lukujen perusteella, mutta se katkeaa odottamatta, kun tarkastaa tarpeeksi tapauksia. Tätä ominaisuutta on vaikea sisällyttää koneeseen.

Toinen haaste saattaa tulla yllätyksenä: matemaattinen tutkimus voi olla erittäin luovaa. Sen täytyy olla, koska harjoittajien on keksittävä uusia käsitteitä ja silti pysyttävä niiden sisällä muinaisen aiheen muodolliset säännöt.

Mikä tahansa tekoälymenetelmä, joka on koulutettu vain löytämään malleja olemassa olevasta matematiikasta, ei todennäköisesti koskaan pystyisi luomaan aidosti uutta matematiikkaa. Kun otetaan huomioon matematiikan ja teknologian välinen putkilinja, tämä näyttää estävän uusien teknologisten vallankumousten käsitteen.

Mutta pelataanpa hetki paholaisen asianajajaa ja kuvittelemme, voisiko tekoäly todellakin luoda uutta matematiikkaa. Edellisessä väitteessä tätä vastaan ​​on se virhe, että voitaisiin myös sanoa, että parhaat ihmisten matemaatikot koulutettiin myös yksinomaan olemassa olevaan matematiikkaan. Suuret kielimallit ovat yllättäneet meidät ennenkin ja tekevät niin jatkossakin.Conversation

Tom Oliver, luennoitsija, tietojenkäsittelytiede ja -tekniikka, Westminsterin yliopisto

Tämä artikkeli julkaistaan ​​uudelleen Conversation Creative Commons -lisenssin alla. Lue alkuperäinen artikkeli.