Kļūdu atrašana sociālo mediju pētījumos

Pētniekiem jābūt piesardzīgiem pret nopietnām kļūmēm darbā ar milzīgām sociālo mediju datu kopām, uzskata datorzinātnieki Makgila universitātē Monreālā un Karnegi Melona universitātē Pitsburgā.

Nepareiziem rezultātiem var būt milzīgas sekas: tūkstošiem pētījumu katru gadu tagad balstās uz datiem, kas iegūti no sociālajiem medijiem.

"Daudzi no šiem dokumentiem tiek izmantoti, lai informētu un pamatotu lēmumus un ieguldījumus sabiedrības, kā arī rūpniecības un valdības starpā," sacīja doktors Dereks Rutss, Makgila Datorzinātņu skolas docents.

Uzvedības zinātniekiem sociālo mediju izaugsme ir šķitusi nepieredzēta iespēja iegūt un pēc tam analizēt daudz informācijas par cilvēka uzvedību.

Daudzi zinātnieki uzskata, ka šādas nobriedušas datu kopas var palīdzēt paredzēt cilvēka uzvedību tādā līmenī, kāds vēl nav iedomājies. Pēdējos gados pētījumos ir apgalvota spēja paredzēt visu, sākot no vasaras grāvējiem līdz svārstībām akciju tirgū.

Bet žurnālā publicētajā rakstā Zinātne, Ruths un Dr Jürgen Pfeffer no Karnegijas Melones programmatūras pētījumu institūta izceļ vairākus jautājumus, kas saistīti ar sociālo mediju datu kopu izmantošanu, kā arī stratēģijas to risināšanai. Starp izaicinājumiem:

  • Dažādas sociālo mediju platformas piesaista dažādus lietotājus - piemēram, Pinterest dominē sievietes vecumā no 25 līdz 34 gadiem, tomēr pētnieki reti koriģē sagrozīto ainu, ko šīs populācijas var radīt;
  • Sociālo mediju pētījumos izmantotās publiski pieejamās datu plūsmas ne vienmēr sniedz precīzu priekšstatu par platformas kopējiem datiem - un pētnieki parasti nezina, kad un kā sociālo mediju nodrošinātāji filtrē savas datu plūsmas;
  • Sociālo mediju platformu dizains var diktēt lietotāju uzvedību un līdz ar to arī to, kādu uzvedību var izmērīt. Piemēram, vietnē Facebook, ja nav pogas “nepatīk”, negatīvas atbildes uz saturu ir grūtāk noteikt nekā pozitīvas “patīk”;
  • Liels skaits surogātpasta izplatītāju un robotu, kas sociālajos medijos maskējas kā parasti lietotāji, kļūdaini tiek iekļauti daudzos cilvēku uzvedības mērījumos un prognozēs;
  • Pētnieki bieži ziņo par rezultātiem viegli klasificējamu lietotāju grupām, tēmām un notikumiem, tādējādi jaunās metodes šķiet precīzākas nekā patiesībā. Piemēram, mēģinājumi secināt Twitter lietotāju politisko orientāciju sasniedz tikai 65 procentu precizitāti tipiskiem lietotājiem - kaut arī pētījumi (koncentrējoties uz politiski aktīviem lietotājiem) ir pieprasījuši 90 procentu precizitāti. Twitter lietotāji sasniedz gandrīz 65 procentu precizitāti tipiskiem lietotājiem - kaut arī pētījumi (koncentrējoties uz politiski aktīviem lietotājiem) ir pieprasījuši 90 procentu precizitāti.

Izmeklētāji saka, ka daudzas problēmas ir raksturīgas arī citām jomām, piemēram, epidemioloģijai, statistikai un mašīnmācībai.

"Visu šo jautājumu kopīgais pavediens ir nepieciešamība pētniekiem precīzāk apzināties, ko viņi patiesībā analizē, strādājot ar sociālo mediju datiem," saka Ruths.

Sociālie zinātnieki jau iepriekš ir pilnveidojuši savas metodes un standartus, lai tiktu galā ar šāda veida izaicinājumiem.

"Bēdīgi slavenais 1948. gada virsraksts" Dewey Defeats Truman "izrietēja no telefoniskām aptaujām, kurās Truman atbalstītāji kopumā tika atlasīti nepietiekami," atzīmē Ruths.

“Tā vietā, lai pastāvīgi diskreditētu vēlēšanu praksi, šī acīmredzamā kļūda noveda pie mūsdienu sarežģītākajām metodēm, augstākiem standartiem un precīzākām aptaujām. Tagad mēs esam nonākuši līdzīgā tehnoloģiskā lēciena punktā. Risinot problēmas, ar kurām mēs saskaramies, mēs varēsim realizēt milzīgo labā potenciālu, ko sola sociālo mediju pētījumi. "

Avots: Makgila universitāte

!-- GDPR -->