Miten Twitter antaa tutkijoille ikkunan ihmisen onnellisuuteen ja terveyteen

10in julkaisemisen jälkeen Twitter on käytetty sosiaalisen verkostoitumisen alustana ystävien, älypuhelinten käyttäjille tarkoitetun pikaviestipalvelun ja yritysten ja poliitikkojen myynninedistämistarkoituksessa.

Mutta se on myös ollut arvokas tietolähde tutkijoille ja tutkijoille - kuten minä - jotka haluavat tutkia, miten ihmiset tuntevat ja toimivat monimutkaisissa sosiaalisissa järjestelmissä.

Analysoimalla tweetit olemme pystyneet tarkkailemaan ja keräämään tietoja luonnonvaraisista miljoonien ihmisten sosiaalisista vuorovaikutuksista valvottujen laboratoriokokeiden ulkopuolella.

Se on auttanut meitä kehittämään työkaluja seurantaan suurten populaatioiden yhteiset tunteet, Etsi onnellisimmat paikat Yhdysvalloissa ja paljon enemmän.

Miten siis Twitter muuttui niin ainutlaatuiseksi resurssiksi laskennallisille yhteiskuntatieteilijöille? Ja mitä se on antanut meille mahdollisuuden löytää?


sisäinen tilausgrafiikka


Twitterin suurin lahja tutkijoille

Heinäkuun 15, 2006, Twittr (kuten sitten tiedettiin) julkisesti käynnistettiin ”mobiilipalveluna, joka auttaa kaveriporukoita kääntämään satunnaisia ​​ajatuksia tekstiviestillä”. Kyky lähettää ilmaisia ​​140-merkkiryhmätekstejä ajoi monia varhaisia ​​käyttäjiä (itse mukaan lukien) käyttämään alustaa.

Ajan myötä käyttäjien määrä räjähti: 20: sta 2009: sta 200: iin 2012: iin ja 310 miljoonaan. Sen sijaan, että kommunikoisivat suoraan ystävien kanssa, käyttäjät yksinkertaisesti kertoisivat seuraajilleen, miten he tuntevat, reagoivat uutisiin positiivisesti tai negatiivisesti, tai halkeavat vitsejä.

Tutkijoiden kannalta Twitterin suurin lahja on ollut suurten määrien avaaminen. Twitter oli yksi ensimmäisistä suurimmista sosiaalisista verkostoista, jotka toimittivat tietomalleja sovellusohjelmointirajapintojen (API) avulla, joiden avulla tutkijat voivat kysyä Twitteriä tietyntyyppisistä tweeteistä (esim. Tweetit, jotka sisältävät tiettyjä sanoja) sekä käyttäjiä koskevat tiedot .

Tämä johti näiden tietojen hyödyntämiseen tähtäävien tutkimushankkeiden räjähtämiseen. Tänään Google-tutkija etsii "Twitteriä" tuottaa kuusi miljoonaa hittiä, kun "Facebook" viiden miljoonan osuman. Ero on erityisen silmiinpistävää, kun otetaan huomioon, että Facebookilla on noin viisi kertaa enemmän käyttäjiä kuin Twitterissä (ja on kaksi vuotta vanhempi).

Twitterin antelias tietopolitiikka on epäilemättä johtanut yrityksen erinomaiseen vapaaseen julkisuuteen, sillä mielenkiintoiset tieteelliset tutkimukset saivat valtavirran median.

Onnea ja terveyttä tutkitaan

Kun perinteiset väestönlaskennatiedot ovat hitaita ja kalliita kerätä, avoimen tietosyötteen, kuten Twitterin, avulla voidaan tarjota reaaliaikainen ikkuna nähdäksesi suurten populaatioiden muutokset.

Vermontin yliopisto Laskennallinen Story Lab perustettiin 2006issa ja tutkii sovelletun matematiikan, sosiologian ja fysiikan ongelmia. 2008: n jälkeen Story Lab on kerännyt miljardeja twiitteja Twitterin Gardenhose-syötteen kautta, joka on API, joka virtaa satunnaisen otoksen 10-prosentista kaikista julkisista tweeteistä reaaliajassa.

Vietin kolme vuotta Computational Story Labissa ja olin onnekas siitä, että olen ollut osa monia mielenkiintoisia tutkimuksia käyttäen näitä tietoja. Esimerkiksi kehitimme a hedonometer joka mittaa Twittersphere-onnea reaaliajassa. Keskittymällä älypuhelimista lähetettyihin geolokoituihin tweetteihin pystyimme kartta Yhdysvaltojen onnellisimmat paikat. Ehkä olemme yllättäen löytäneet Havaiji on onnellisin valtio ja viininviljely Napa onnellisin kaupunki varten 2013. 

13: n 2013-maantieteellisesti sijoittuneiden USA: n tweettien kartta, jonka väri on onnea, punainen, joka osoittaa onnea ja sinistä, mikä osoittaa surua. PLOS ONE, Tekijä13: n 2013-maantieteellisesti sijoittuneiden USA: n tweettien kartta, jonka väri on onnea, punainen, joka osoittaa onnea ja sinistä, mikä osoittaa surua. PLoS ONE, Tekijä.Näissä tutkimuksissa oli syvempiä sovelluksia: Twitter-sanojen käytön ja väestötietojen yhdistäminen auttoi meitä ymmärtämään kaupunkien sosiaalis-taloudellisia malleja. Esimerkiksi voisimme yhdistää sanan käytön terveystekijöihin, kuten lihavuuteen, joten rakensimme a lexicocalorimeter mitata sosiaalisen median viestien "kaloripitoisuutta". Tietyn alueen tweetit, jotka mainitsivat kaloreita sisältäviä elintarvikkeita, kasvattivat kyseisen alueen "kaloripitoisuutta", kun taas harjoitusaktiviteetit pienensivät metriikkaamme. Löysimme tämän yksinkertaisen toimenpiteen korreloi muiden terveys- ja hyvinvoinnin mittareiden kanssa. Toisin sanoen, tweetit pystyivät antamaan meille tilannekuvan tietyllä hetkellä ajankohtana kaupungin tai alueen yleisestä terveydestä.

Twitter-tietojen rikkauden avulla olemme myös pystyneet nähdä ihmisten päivittäiset liikemallit ennennäkemättömän yksityiskohtaisesti. Ihmisen liikkuvuusmallien ymmärtäminen puolestaan ​​kykenee muuttamaan sairauden mallintamista ja avaamaan uuden kentän digitaalinen epidemiologia.

Muissa tutkimuksissa tarkasteltiin, ilmaisevatko matkustajat enemmän onnea Twitterissä kuin ne, jotka jäävät kotiin (vastaus: he tekevät) ja jos onnelliset henkilöt pyrkivät pitämään yhdessä sosiaalisen verkoston (jälleen, he tekevät). Todellakin, positiivisuus näyttää paistavan itse kieltäsiinä mielessä, että meillä on enemmän positiivisia sanoja kuin negatiivisia sanoja. Näin ei ollut vain Twitterissä, vaan eri medioissa (esim. Kirjoissa, elokuvissa ja sanomalehdissä) ja kielillä.

Nämä tutkimukset - ja tuhansia muita kuin heitä ympäri maailmaa - olivat mahdollisia vain Twitterin ansiosta.

Seuraavat 10-vuotta

Joten mitä voimme odottaa oppivan Twitteristä seuraavien 10-vuosien aikana?

Joitakin jännittävimpiä töitä liittyy tällä hetkellä sosiaalisen median tietojen yhdistämiseen matemaattisiin malleihin väestötason ilmiöiden, kuten taudinpurkausten, ennustamiseksi. Tutkijat ovat jo saaneet jonkin verran menestystä sairastumismallien lisäämisessä Twitter-tietojen avulla influenssan ennustamiseksi FluOutlook Northeastern Universityn ja tieteellisen vaihdon instituutin kehittämä foorumi.

Vielä on kuitenkin vielä monia haasteita. Sosiaalisen median tiedot kärsivät hyvin alhaisesta "signaali-kohinasuhteesta". Toisin sanoen, tietyn tutkimuksen kannalta merkitykselliset tweetit hukkuu usein merkityksettömällä ”melulla”.

Siksi meidän on jatkuvasti oltava tietoisia siitä, mitä on kopioitusuuret tiedot”Kehitettäessä uusia menetelmiä eikä ole liian varma tuloksistamme. Tähän on liitettävä tavoite tuottaa tulkittavia "lasilaatikon" ennusteita näistä tiedoista (toisin kuin "mustan laatikon" ennusteissa, joissa algoritmi on piilotettu tai epäselvä).

Sosiaalisen median tietoja arvostellaan usein (oikeudenmukaisesti) pienten, edustamaton näyte laajemmasta väestöstä. Yksi suurimmista haasteista tutkijoille on selvittää, miten tilastollisissa malleissa otetaan huomioon tällaiset vääriä tietoja. Sillä aikaa enemmän ihmisiä käyttää sosiaalista mediaa vuosittain, meidän on edelleen pyrittävä ymmärtämään näiden tietojen puolueellisuudet. Esimerkiksi tiedot osoittavat edelleen, että nuoret yksilöt ylittävät yhä enemmän vanhempien populaatioiden kustannuksella.

Ainoastaan ​​parempien bias-korjausmenetelmien kehittämisen jälkeen tutkijat voivat tehdä täysin luottavaisia ​​ennusteita tweeteistä.

Author

Lewis Mitchell, sovelletun matematiikan lehtori, University of Adelaide

Tämä artikkeli julkaistiin alunperin Conversation. Lue alkuperäinen artikkeli.

Liittyvät kirjat

at InnerSelf Market ja Amazon