Mitkä ovat Deepfake-videot ja niiden havaitseminen silmänräpäyksessä

Uuden väärän tiedon muotoilu leviää verkossa yhteisöihin, kun 2018-puolivälin vaalikampanjat lämpenevät. Sitä kutsutaan "syvähakkeiksi" pseudonyymi online-tili, joka on suosinut tekniikkaa - joka on mahdollisesti valinnut sen nimen, koska prosessissa käytetään teknistä menetelmää, jota kutsutaan ”syväksi oppimiseksi” - nämä väärennetyt videot näyttävät hyvin realistisilta.

Tähän mennessä ihmiset ovat käyttäneet deepfake-videoita pornografia ja satiiri näyttää siltä, ​​että kuuluisat ihmiset tekevät asioita, joita he eivät tavallisesti saisi.

Mutta se on lähes varmaa deepfakes ilmestyy kampanjakauden aikana, joiden tarkoituksena on kuvata ehdokkaita sanomalla asioita tai menossa paikoissa todellinen ehdokas ei olisi.

Se on Barack Obama - vai onko?

{youtube}cQ54GDm1eL0{/youtube}

Koska nämä tekniikat ovat niin uusia, ihmisillä on vaikeuksia todellisten videoiden ja deepfake-videoiden välillä. Työni, kollegani Ming-Ching Changin ja meidän tohtorimme kanssa. opiskelija Yuezun Li on löytänyt tien kerro luotettavasti todellisia videoita deepfake-videoista. Se ei ole pysyvä ratkaisu, koska teknologia paranee. Mutta se on alku, ja tarjoaa toivoa, että tietokoneet voivat auttaa ihmisiä kertomaan totuutta fiktiosta.


sisäinen tilausgrafiikka


Mikä on "syväfake"?

Syväfake-videon tekeminen on paljon kuin kielten kääntäminen. Palvelut kuten Google Translate käytä koneen oppimista - tietokoneiden analyysi kymmenistä tuhansista teksteistä useilla kielillä - kohteeseen tunnistaa tekstin käyttötavat että he käyttävät käännöstä.

Deepfake-algoritmit toimivat samalla tavalla: he käyttävät tietynlaista konetta oppivaa järjestelmää nimeltä a syvä hermoverkko tutkia yhden henkilön kasvojen liikkeet. Sitten ne syntetisoivat toisen henkilön kasvojen kuvia tekemällä analogisia liikkeitä. Tehokkaasti luodaan videon kohdehenkilöstä, joka näyttää tekevän tai sanovat, mitä lähde henkilö teki.

Miten deepfake-videoita tehdään.

{youtube}8LhI-e2B8Lg{/youtube}

Ennen kuin ne voivat toimia kunnolla, syvä hermoverkko tarvitsee paljon lähdetietoja, kuten valokuvia henkilöistä, jotka ovat persoonaamisen lähde tai kohde. Mitä enemmän kuvia käytetään deepfake-algoritmin kouluttamiseen, sitä realistisempi on digitaalinen persoona.

Vilkkuu

Uudessa algoritmissa on edelleen puutteita. Yksi niistä liittyy siihen, miten simuloidut kasvot vilkkuvat - tai eivät. Terveet aikuiset ihmiset vilkkuvat jokaisen 2- ja 10-sekunnin välillä, ja yksi vilkkuminen kestää kymmenesosan ja neljän kymmenesosan välillä. Se olisi normaalia nähdä videon, jossa puhutaan. Mutta se ei tapahdu monissa deepfake-videoissa.

Todellinen henkilö vilkkuu puhuessasi.

{youtube}https://www.youtube.com/watch?v=-MMXXEA3UaM{/youtube}

Simuloitu kasvot eivät vilku todellisen henkilön tapaa.

{youtube}EttSA9-YIuI{/youtube}

Kun deepfake-algoritmi on koulutettu henkilön kasvokuviin, se riippuu internetistä saatavilla olevista valokuvista, joita voidaan käyttää koulutustietona. Jopa niille ihmisille, jotka ovat usein valokuvattuja, on saatavilla vain vähän kuvia, joissa näkyy heidän silmänsä kiinni. Tällaiset kuvat ovat harvinaisia ​​- koska ihmisten silmät ovat auki suurimman osan ajasta - mutta valokuvaajat eivät yleensä julkaise kuvia, joissa päähenkilöiden silmät ovat kiinni.

Ilman vilkkuvien henkilöiden kouluttamiskuvia, deepfake-algoritmit eivät todennäköisesti luo kasvoja, jotka vilkkuvat normaalisti. Kun laskemme vilkkuvan kokonaisnopeuden ja verrataan sitä luonnollisen alueen kanssa, huomasimme, että deepfake-videoiden merkit vilkkuvat paljon harvemmin todellisiin ihmisiin verrattuna. Tutkimuksemme käyttää koneen oppimista tutkia silmien avaamista ja sulkemista videoissa.

Tämä antaa meille inspiraation havaita syväfake-videoita. Myöhemmin kehitämme menetelmän, jolla havaitaan, kun video videossa vilkkuu. Jotta se olisi tarkempi, se skannaa jokaisen kyseessä olevan videon kehyksen, havaitsee siinä olevat kasvot ja etsii silmät automaattisesti. Sitten se käyttää toista syvää hermoverkkoa sen määrittämiseksi, onko havaittu silmä auki tai lähellä, käyttämällä silmän ulkonäköä, geometrisia piirteitä ja liikettä.

Tiedämme, että työmme hyödyntää puutetta sellaisten tietojen saatavuudesta, jotka ovat käytettävissä syvälle menevien algoritmien kouluttamiseksi. Jotta vältyttäisiin saamasta saalista samankaltaiseen virheeseen, olemme kouluttaneet järjestelmämme suurelle kirjastolle, jossa on sekä avoimia että suljettuja silmiä. Tämä menetelmä näyttää toimivan hyvin, ja sen seurauksena olemme saavuttaneet yli 95-prosentin havaitsemisnopeuden.

Tämä ei ole viimeinen sana syvyyksien havaitsemisessa. Teknologia on nopeastija kilpailu väärennettyjen videoiden tuottamisen ja havaitsemisen välillä on samanlainen kuin shakkipeli. Erityisesti vilkkua voidaan lisätä syvälle tehtyihin videoihin lisäämällä kasvot kuvia suljetuilla silmillä tai käyttämällä videon sekvenssejä koulutusta varten. Ihmiset, jotka haluavat sekoittaa yleisöä, saavat paremmin vääriä videoita - ja meidän ja muiden teknologiayhteisön jäsenten on edelleen löydettävä keinoja havaita niitä.Conversation

Author

Siwei Lyu, tietotekniikan dosentti; Johtaja, tietokonenäkö ja koneopiskelaboratorio, University of Albany, New Yorkin osavaltion yliopisto

Tämä artikkeli julkaistiin alunperin Conversation. Lue alkuperäinen artikkeli.

Liittyvät kirjat

at InnerSelf Market ja Amazon