Kuka kerää big dataa ja miksi?

Syksyllä 2019 Apple Card -palvelusta nousi skandaali: se myönsi rekisteröityessään eri luottolimiittejä miehille ja naisille. Jopa Steve Wozniakilla ei ollut onnea:

Vuotta aiemmin paljastui, että Netflix-alusta näyttää käyttäjille erilaisia julisteita ja teasereita heidän sukupuolensa, iän ja kansallisuuden mukaan. Tästä palvelua syytettiin rasismista.

Lopuksi Mark Zuckerberg saa säännöllisesti moitteita Facebookin väitetystä käyttäjiensä tietojen keräämisestä, myymisestä ja manipuloinnista. Vuosien mittaan häntä syytettiin ja jopa yritettiin manipuloinnista Yhdysvaltain vaalien aikana, Venäjän erikoispalveluiden avustamisesta, vihan ja radikaalien näkemysten lietsomisesta, sopimattomasta mainonnasta, käyttäjätietojen vuotamisesta, pedofiilien vastaisten tutkimusten estämisestä.

Facebook-postaus zuckilta

Samaan aikaan Pornhub-verkkopalvelu julkaisee vuosittain raportteja siitä, millaista pornoa eri kansallisuuksia, sukupuolta ja ikää edustavat ihmiset etsivät. Ja jostain syystä tämä ei häiritse ketään. Vaikka kaikki nämä tarinat ovat samanlaisia: jokaisessa niistä käsittelemme big dataa, jota XNUMX. vuosisadalla kutsutaan "uudeksi öljyksi".

Mikä on big data

Big data – ne ovat myös big dataa (eng. Big Data) tai metadataa – on joukko dataa, jota saapuu säännöllisesti ja suuria määriä. Niitä kerätään, käsitellään ja analysoidaan, mikä johtaa selkeisiin malleihin ja kuvioihin.

Hämmästyttävä esimerkki on Large Hadron Colliderin tiedot, joita tulee jatkuvasti ja suuria määriä. Heidän avullaan tutkijat ratkaisevat monia ongelmia.

Mutta iso data verkossa ei ole vain tilastoja tieteellistä tutkimusta varten. Niiden avulla voidaan seurata, miten eri ryhmien ja kansallisuuksien käyttäjät käyttäytyvät, mihin he kiinnittävät huomiota ja miten he ovat vuorovaikutuksessa sisällön kanssa. Joskus tätä varten tietoja ei kerätä yhdestä lähteestä, vaan useasta, vertaamalla ja tunnistamalla tiettyjä malleja.

Siitä, kuinka tärkeää big data on verkossa, alettiin puhua, kun sitä oli todella paljon. Vuoden 2020 alussa maailmassa oli 4,5 miljardia Internetin käyttäjää, joista 3,8 miljardia oli rekisteröitynyt sosiaalisiin verkostoihin.

Kenellä on pääsy Big Dataan

Tutkimusten mukaan yli puolet maistamme uskoo, että heidän verkossa olevia tietojaan käyttävät kolmannet osapuolet. Samaan aikaan monet julkaisevat henkilökohtaisia tietoja, valokuvia ja jopa puhelinnumeron sosiaalisiin verkostoihin ja sovelluksiin.

Se pitää selittää tässä: ensimmäinen henkilö on käyttäjä itse, joka sijoittaa tietonsa mihin tahansa resurssiin tai sovellukseen. Samalla hän suostuu (rasti sopimukseen) näiden tietojen käsittelyyn toinen osapuoli eli resurssin omistajat. Kolmas osapuoli on se, jolle resurssin omistajat voivat siirtää tai myydä käyttäjätietoja. Usein tämä on kirjattu käyttösopimukseen, mutta ei aina.

Kolmas osapuoli on valtion virastot, hakkerit tai yritykset, jotka ostavat tietoja kaupallisiin tarkoituksiin. Edellinen voi saada tietoja tuomioistuimen tai ylemmän viranomaisen päätöksellä. Hakkerit eivät tietenkään käytä mitään oikeuksia – he yksinkertaisesti hakkeroivat palvelimille tallennetut tietokannat. Yritykset pääsevät (lain mukaan) käsiksi tietoihin vain, jos olet itse antanut niille luvan – valitsemalla sopimuksen alla olevasta ruudusta. Muuten se on laitonta.

Miksi yritykset käyttävät Big Dataa?

Big dataa kaupallisella alalla on käytetty vuosikymmeniä, mutta se ei vain ollut niin intensiivistä kuin nyt. Näitä ovat esimerkiksi valvontakameroiden tallenteet, GPS-navigaattorien tiedot tai verkkomaksut. Nyt sosiaalisten verkostojen, verkkopalvelujen ja sovellusten kehittyessä kaikki tämä voidaan yhdistää ja saada mahdollisimman kattava kuva: missä potentiaaliset asiakkaat asuvat, mitä he haluavat katsella, minne he lähtevät lomalle ja minkä merkkinen auto heillä on.

Yllä olevista esimerkeistä käy selväksi, että big datan avulla yritykset haluavat ennen kaikkea kohdistaa mainoksia. Eli tarjota tuotteita, palveluita tai yksittäisiä vaihtoehtoja vain oikealle yleisölle ja jopa räätälöidä tuote tietylle käyttäjälle. Lisäksi mainonta Facebookissa ja muilla suurilla alustoilla on yhä kalliimpaa, eikä sen näyttäminen kaikille peräkkäin ole ollenkaan kannattavaa.

Vakuutusyhtiöt, yksityiset klinikat ja työnantajat käyttävät aktiivisesti tietoa avoimista lähteistä potentiaalisista asiakkaista. Edellinen voi esimerkiksi muuttaa vakuutusehtoja, jos he näkevät, että etsit usein tietoa tietyistä sairauksista tai lääkkeistä, ja työnantajat voivat arvioida, oletko altis konflikteille ja epäsosiaaliselle käytökselle.

Mutta on toinenkin tärkeä tehtävä, joka on kamppaillut viime vuosina: päästä lähelle maksukykyisintä yleisöä. Tämä ei ole niin helppoa, vaikka tehtävää helpottavat merkittävästi maksupalvelut ja sähköiset sekit yhden OFD:n (fiscal data operator) kautta. Päästäkseen mahdollisimman lähelle yritykset jopa yrittävät jäljittää ja "kasvata" potentiaalisia asiakkaita lapsuudesta asti.: verkkopelien, interaktiivisten lelujen ja koulutuspalvelujen kautta.

Miten tämä toimii?

Suurimmat tiedonkeruumahdollisuudet ovat globaaleilla yrityksillä, jotka omistavat useita palveluita kerralla. Facebookilla on nyt yli 2,5 miljardia aktiivista käyttäjää. Samaan aikaan yritys omistaa myös muita palveluita: Instagram - yli miljardi, WhatsApp - yli 1 miljardia ja muita.

Mutta Googlella on vielä enemmän vaikutusvaltaa: Gmailia käyttää 1,5 miljardia ihmistä maailmassa, 2,5 miljardia Android-mobiilikäyttöjärjestelmää ja yli 2 miljardia YouTubessa. Ja tähän ei lasketa Google-hakua ja Google Maps -sovelluksia, Google Play -kauppaa ja Chrome-selainta. Vielä on kiinnitettävä verkkopankkisi – ja Google voi tietää sinusta kirjaimellisesti kaiken. Muuten, Yandex on jo askeleen edellä tässä suhteessa, mutta se kattaa vain venäjänkielisen yleisön.

???? Ensinnäkin yritykset ovat kiinnostuneita siitä, mitä julkaisemme ja mistä pidämme sosiaalisessa mediassa. Jos esimerkiksi pankki näkee, että olet naimisissa ja pidät aktiivisesti tytöistä Instagramissa tai Tinderissä, hyväksyt todennäköisemmin kulutuslainan. Ja perheen asuntolaina on poissa.

Tärkeää on myös mitä mainoksia klikkaat, kuinka usein ja millä tuloksella.

(Eli Seuraava askel on yksityisviestit: ne sisältävät paljon enemmän tietoa. Viestit vuotivat VKontakteen, Facebookiin, WhatsAppiin ja muihin pikaviestintäpalveluihin. Heidän mukaansa maantieteellistä sijaintia on muuten helppo seurata viestin lähetyshetkellä. Olet varmasti huomannut: kun keskustelet jonkun kanssa ostamisesta tai vain pizzan tilaamisesta, syötteessä näkyy heti asiaankuuluvaa mainontaa.

🚕 Kuljetus- ja taksipalvelut käyttävät ja ”vuotavat” aktiivisesti big dataa. He tietävät missä asut ja työskentelet, mitä rakastat, mitkä ovat likimääräiset tulosi. Esimerkiksi Uber näyttää hintaa korkeampana, jos ajat baarista kotiin ja olet ilmeisen ylikypsä. Ja kun puhelimessasi on joukko muita aggregaattoreita, päinvastoin, he tarjoavat halvempia.

(Eli On palveluita, jotka keräävät mahdollisimman paljon tietoa kuvien ja videoiden avulla. Esimerkiksi tietokonenäkökirjastot – Googlella on sellainen. He skannaavat sinut ja ympäristösi nähdäkseen, minkä kokoinen tai korkeus olet, mitä merkkejä käytät, millä autolla ajat, onko sinulla lapsia tai lemmikkejä.

(Eli Ne, jotka tarjoavat SMS-yhdyskäytäviä pankeille postituksiinsa, voivat seurata ostojasi kortilla – tietää viimeiset 4 numeroa ja puhelinnumero – ja sitten myydä nämä tiedot jollekin toiselle. Siksi kaikki tämä roskaposti alennuksilla ja pizzalla lahjaksi.

🤷️️ Lopuksi vuodatamme itse tietomme vasempaan palveluihin ja sovelluksiin. Muista Getcontactin ympärillä oleva hype, kun kaikki täyttivät mielellään puhelinnumeronsa saadakseen selville, kuinka muut ovat sen kirjoittaneet. Ja nyt löydät heidän suostumuksensa ja lue, mitä siinä sanotaan tietojesi siirrosta (spoileri: omistajat voivat siirtää ne kolmansille osapuolille oman harkintansa mukaan):

Yritykset voivat menestyksekkäästi kerätä ja jopa myydä käyttäjätietoja vuosia, kunnes se joutuu oikeusjuttuun – kuten tapahtui saman Facebookin kanssa. Ja sitten ratkaiseva rooli oli yrityksen rikkomalla GDPR:ää – EU:n lakia, joka rajoittaa tietojen käyttöä paljon tiukemmin kuin amerikkalainen. Toinen tuore esimerkki on Avast-virustorjuntaskandaali: yksi yhtiön tytäryhtiöistä keräsi ja myi dataa 100-400 miljoonalta käyttäjältä.

Mutta onko tästä kaikesta meille hyötyä?

Kuinka suuri data auttaa meitä kaikkia?

Kyllä, on myös valoisa puoli.

Big data auttaa saamaan kiinni rikollisia ja ehkäisemään terrori-iskuja, löytämään kadonneita lapsia ja suojelemaan heitä vaaroilta.

Heidän avullaan me saamme upeita tarjouksia pankeista ja henkilökohtaisia alennuksia. Kiitos heille me emme maksa monista palveluista ja sosiaalisista verkostoista, jotka ansaitsevat vain mainonnasta. Muuten pelkkä Instagram maksaisi meille useita tuhansia dollareita kuukaudessa.

Pelkästään Facebookilla on 2,4 miljardia aktiivista käyttäjää. Samaan aikaan heidän voittonsa vuonna 2019 oli 18,5 miljardia dollaria. Osoittautuu, että yritys ansaitsee jopa 7,7 dollaria vuodessa jokaiselta käyttäjältä mainonnan kautta.

Lopuksi, joskus se on vain kätevää: kun palvelut tietävät jo missä olet ja mitä haluat, eikä sinun tarvitse etsiä tarvitsemaasi tietoa itse.

Toinen lupaava Big Datan soveltamisalue on koulutus.

Yhdessä amerikkalaisessa Virginian yliopistossa tehtiin tutkimus, jossa kerättiin tietoa niin sanotun riskiryhmän opiskelijoista. Nämä ovat niitä, jotka opiskelevat huonosti, jättävät tunnit väliin ja ovat keskeyttämässä. Tosiasia on, että osavaltioissa vähennetään vuosittain noin 400 ihmistä. Tämä on huono asia sekä yliopistoille, joiden luokituksia alennetaan ja rahoitusta leikataan, että opiskelijoille itselleen: monet ottavat koulutukseen lainaa, joka vähennyksen jälkeen on vielä maksettava takaisin. Puhumattakaan menetetystä ajasta ja uranäkymistä. Big datan avulla on mahdollista tunnistaa jälkeenjääneet ajoissa ja tarjota heille tutoria, lisätunteja ja muuta kohdennettua apua.

Tämä muuten sopii myös kouluihin: silloin järjestelmä ilmoittaa opettajille ja vanhemmille – sanotaan, että lapsella on ongelmia, autetaan häntä yhdessä. Big Data auttaa myös ymmärtämään, mitkä oppikirjat toimivat paremmin ja ketkä opettajat selittävät materiaalia helpommin.

Toinen myönteinen esimerkki on uraprofilointi.: silloin nuoria autetaan päättämään tulevasta ammatistaan. Täällä big datan avulla voidaan kerätä tietoa, jota ei saada perinteisillä testeillä: miten käyttäjä käyttäytyy, mihin hän kiinnittää huomiota, miten hän on vuorovaikutuksessa sisällön kanssa.

Samassa Yhdysvalloissa on uraohjausohjelma SC ACCELERATE. Siinä käytetään muun muassa CareerChoice GPS-tekniikkaa: ne analysoivat tietoa opiskelijoiden luonteesta, heidän taipumuksistaan aineisiin, vahvuuksista ja heikkouksista. Tietoja käytetään sitten auttamaan teini-ikäisiä valitsemaan heille oikeat korkeakoulut.

Tilaa ja seuraa meitä Yandex.Zenissä – tekniikka, innovaatio, talous, koulutus ja jakaminen yhdessä kanavassa.

Jätä vastaus