Tvīti sniedz daudz sabiedrības veselības datu
Fenomenālā sociālo mediju izaugsme ir radījusi vēl nebijušu saziņas līdzekli. Tikai čivināt ļauj miljoniem sociālo mediju faniem komentēt gandrīz jebko 140 rakstzīmēs.Jauni pētījumi pētīja, vai šo digitālo formātu varētu izmantot, lai izsekotu svarīgas sabiedrības veselības tendences. Un, pēc divu Džona Hopkinsa universitātes datorzinātnieku domām, viena vārda tvīts ir šāds: “Jā!”
Dr. Marks Dredze un Maikls Dž. Pols datoros ievadīja 2 miljardus publisku tvītu, kas publicēti laikā no 2009. gada maija līdz 2010. gada oktobrim, pēc tam programmatūru izmantoja, lai filtrētu 1,5 miljonus ziņojumu, kas attiecās uz veselības jautājumiem. Čivinātāju identitāte netika apkopota.
"Mūsu mērķis bija noskaidrot, vai Twitter ziņas varētu būt noderīgs sabiedrības veselības informācijas avots," sacīja Dredze.
"Mēs noteicām, ka patiešām viņi varēja. Dažos gadījumos mēs, iespējams, uzzinājām dažas lietas, kuras pat tweeters ārsti nezināja, piemēram, kuras bezrecepšu zāles plakāti lietoja, lai ārstētu simptomus mājās. ”
Kārtojot šos ar veselību saistītos tvītus elektroniskās “kaudzēs”, Dredze un Pols atklāja intriģējošus modeļus par alerģijām, gripas gadījumiem, bezmiegu, vēzi, aptaukošanos, depresiju, sāpēm un citām slimībām.
"Ir bijuši daži šauri pētījumi, izmantojot, piemēram, Twitter ziņas, lai izsekotu gripu," sacīja Dredze. "Bet, cik mums zināms, neviens nekad nav izmantojis tvītus, lai apskatītu tik daudz veselības problēmu kā mēs."
Dredze un Pāvils 18. jūlijā Barselonā, Spānijā, Starptautiskajā tīmekļa žurnālu un sociālo mediju konferencē, kuru sponsorēja Asociācija mākslīgā intelekta attīstībai, iepazīstinās ar pilnu pētījumu.
Papildus tam, ka Twitter ierakstos tika atrastas dažādas veselības kaites, pētnieki varēja ierakstīt daudzus medikamentus, ko patērēja slikti tweeteri, pateicoties tādiem ierakstiem kā: "Nācās pop Benadryl ... alerģijas ir vissliktākās."
Citi tvīti norādīja uz nepareizu zāļu lietošanu.
"Mēs atklājām, ka daži cilvēki tvītoja, ka viņi lieto gripas antibiotikas," sacīja Pāvils. "Bet antibiotikas nedarbojas ar gripu, kas ir vīruss, un šī prakse varētu veicināt pieaugošās antibiotiku rezistences problēmas. Tātad šie tvīti parādīja, ka tur pastāv daži nopietni medicīniski pārpratumi. ”
Protams, lielākajai daļai ikdienas tvītu nav nekāda sakara ar slimību. Lai gan vienkārša pieeja būtu filtrēt vārdus, kas saistīti ar slimību, piemēram, “galvassāpes” vai “drudzis”, šī stratēģija neizdodas tādos tvītos kā “Augsta gāzes cena ir galvassāpes manam biznesam” vai “Ir gadījums no Bībera drudža. Mīli viņa jauno dziesmu. ”
Lai atrastu ar veselību saistītās ziņas starp miljardiem ziņojumu sākotnējā krājumā, Džona Hopkinsa pētnieki izmantoja viņu izveidoto filtrēšanas un kategorizēšanas sistēmu. Izmantojot šo rīku, datoriem var iemācīt neņemt vērā frāzes, kas patiesībā nav saistītas ar cilvēka veselību, pat ja tajās ir vārds, ko parasti lieto veselības kontekstā.
Kad nesaistītie tvīti tika noņemti, atlikušie rezultāti sniedza dažus pārsteidzošus secinājumus.
"Kad mēs sākām, es pat nezināju, vai čivināt cilvēki runāja par alerģijām," sacīja Pāvils. "Bet mēs uzzinājām, ka viņi to dara. Un bija viena lieta, ko es negaidīju: sistēma atrada divus dažādus alerģiju veidus: veidu, kas izraisa šņaukšanu un šķaudīšanu, un tādu, kas izraisa ādas izsitumus un nātreni. "
Apmēram 200 000 ar veselību saistīto tvītu pētnieki varēja izmantot lietotāju sniegto publisko informāciju, lai identificētu stāvokli, no kura ziņa tika nosūtīta. Tas ļāva viņiem izsekot dažām tendencēm pēc laika un vietas, piemēram, kad alerģijas un gripas sezona sasniedza maksimumu dažādās valsts daļās.
"Mēs no tvītiem varējām pārliecināties, ka alerģijas sezona sākās agrāk siltākos štatos un vēlāk Vidusrietumos un Ziemeļaustrumos," sacīja Dredze.
Dredze un Pāvils jau ir sākuši sarunas ar sabiedrības veselības zinātniekiem, tostarp dažiem, kas saistīti ar Džonu Hopkinsu, kuri saka, ka turpmākie tvītu pētījumi varētu atklāt vēl noderīgākus datus ne tikai par plakātu medicīniskajām problēmām, bet arī par sabiedrības uztveri par slimībām, medikamentiem un citiem citi veselības jautājumi.
Tomēr Dredze un Pāvils brīdināja, ka mēģinājumiem noteikt valsts temperatūru, analizējot tvītus, ir ierobežojumi.
Pirmkārt, lielākā daļa Twitter lietotāju vairāk nekā vienu reizi nekomentēja viņu konkrētās kaites, tāpēc bija grūti izsekot, cik ilgi slimība ilga un vai tā atkārtojās. Turklāt lielākā daļa Twitter lietotāju mēdz būt jauni, kas daudzus vecāka gadagājuma cilvēkus izslēgtu no sabiedrības veselības pētījuma. Tāpat šobrīd čivināt dominē lietotāji, kas atrodas Amerikas Savienotajās Valstīs, padarot to mazāk noderīgu pētījumiem citās valstīs.
Lai gan sociālo mediju vietnes ļauj lietotājiem atklāt daudz personiskas informācijas draugiem un svešiniekiem, čivināt balstītie pētījumi var sasniegt tikai noteiktu dziļumu.
"Mūsu pētījumā," sacīja Pāvils, "mēs varējām uzzināt tikai to, ko cilvēki bija gatavi dalīties. Mēs domājam, ka ir ierobežojums tam, ko cilvēki ir gatavi kopīgot vietnē Twitter. ”
Neskatoties uz to, Dredze saka, ka joprojām ir daudz noderīgu datu, ko atstāt no Twitter ziņām. "Cilvēki, ar kuriem esmu runājis, jutās, ka tas ir patiešām interesants pētījumu rīks," viņš teica, "un viņiem ir dažas lieliskas idejas par to, ko viņi vēlētos uzzināt no Twitter."
Avots: Džona Hopkinsa universitāte