(Atlasīto) pūļu gudrība

Arvien vairāk uzņēmumu izmanto savu klientu un lietotāju gudrību - ļoti izvēlētu pūli. Viņi to dara, izmantojot “lielos datus” - vāc anonīmu datu dārgumus un pēc tam uz tiem veic post-hoc analīzes.

Šīs pūles var radīt dažas interesantas atziņas. Tas var arī likt uzņēmumiem domāt, ka rezultāti ir vispārināmi visiem iedzīvotājiem.

Un tieši šī pēdējā problēma ir problēma. Jo, ja sākat ar pašu izvēlētu izlasi, jūsu dati attiecas tikai uz tiem līdzīgiem cilvēkiem, nevis visiem iedzīvotājiem. Tā ir tikai viena no problēmām, kas rodas, mērot un rīkojoties, pamatojoties uz informāciju no izvēlētajiem pūļiem.

Vietnes ir veikušas “lielo datu” mērījumus jau gandrīz 20 gadus. Katru reizi, kad apmeklējat vietni, vietnes serverī tā atstāj nelielu datu pēdu. Servera īpašnieki ņem šos datus un palaiž tos caur datu analīzes platformu (piemēram, Google Analytics). Tas sniedz vietnes īpašniekam apkopotu informāciju par to cilvēku tipiem, kuri apmeklē viņu vietni.

Tā kā katra vietne ir unikāla, šādas atziņas attiecas tikai uz šo vietni. Piemēram, lietotājam, kurš apmeklē CNN, var būt maz kopīga ar lietotāju, kurš apmeklē Match.com.

Atlasiet pūļu problēmu

Datu analīzē statistikas speciālisti šādu izlasi dēvē par “pašu izvēlētu izlasi”, kā rezultātā rodas “pašizlases neobjektivitātes” problēma. Vienkārši sakot, tas nozīmē, ka, tā kā jūsu dati tiek iegūti tikai no cilvēkiem, kuri izmanto noteiktu lietotni vai sociālo mediju veidu, tie nav reprezentatīvi iedzīvotāji kopumā. Tā kā tas nav reprezentatīvs iedzīvotājiem kopumā, jūs nevarat vispārināt datus.

Es to saucu par “izvēlēto pūļu” problēmu. Jo, ja jūs gūstat savu gudrību no pūļa, labāk pārliecinieties, ka šis pūlis pārstāv iedzīvotājus, ja mēģināt no tā gūt vispārināmas atziņas.

Ir veseli uzņēmumi, kas nedara neko citu, kā tikai analizē tendences un datus no Twitter. Bet, ja paskatās, kas lieto čivināt - un kā viņi to lieto, jūs nekavējoties uztrauktu jautājums par to, ko šādi dati patiesībā nozīmē. Piemēram, Twitter lietotāji ir daudz jaunāki nekā vispārējie iedzīvotāji, un vecāka gadagājuma cilvēki ir nepietiekami pārstāvēti. Ja jūs vadāt uzņēmumu, kas vietnē Twitter aplūko veselības tendences, jūs redzēsiet kaut ko pavisam citu, nekā tad, ja jūs veiktu randomizētu tālruņa aptauju.

Citiem vārdiem sakot, kādām tendencēm Twitter var būt vai nav nekādas nozīmes vairāk nekā 80 procentiem amerikāņu, kuri nelieto čivināt.

Lietotnes nav labākas

Lietotnēm bieži patīk apkopot savu lietotāju datus, anonimizēt tos un pēc tam tos izmantot, lai salīdzinātu jūsu sniegumu ar citiem, kas arī izmanto šo lietotni. Paredzams, ka tas liek jums justies kā daļai no sociālā tīkla, kuram ir kopīga lietotne. Tā ir lieliska ideja.

Jo kā būtu, ja šo konkrēto lietotni izmantotu tikai noteikta veida cilvēki? Kā būtu, ja tikai nomākti cilvēki izmantotu garastāvokļa izsekošanas lietotni, kas domāta, lai palīdzētu cilvēkiem izkļūt no depresijas, palīdzot izsekot viņu noskaņojumiem, salīdzinot viņu progresu ar citiem, kas arī izmanto šo lietotni? Šādi rezultāti paši par sevi varētu neapzināti nomākt.

Vai jūs varat kādu pozitīvi motivēt, izmantojot sociālo salīdzinājumu? Jūs varat, bet pārāk bieži pētījums arī parāda, ka šādi sociālie salīdzinājumi liek cilvēkiem justies sliktāk nekā iepriekš. Tas ir jādara ļoti rūpīgi - kaut ko parasti lietotņu izstrādātāji nesaprot.

Atstājot svarīgas lietas, ko izmērīt

Jebkura lietotne vai pakalpojums ir tikpat labs kā tā izvēlētā informācija. Jūs varat ieviest neobjektivitāti - tīši vai netīši - savos rezultātos pēc tā, ko izvēlaties izmērīt - nevis mērīt.

Padomājiet par to šādi: jūs domājat pārcelties uz jaunu pilsētu ar mazāk lietus, tāpēc jūs skatāties tikai uz vidējo gada lietus daudzumu dažādās pilsētās. Jūs uzmeklētu tādu pilsētu kā Maiami un domātu: “Ziniet, es nepārvietojos uz Maiami - viņiem lietus ir gandrīz 62 collas gadā! Salīdziniet to ar niecīgo 37 collu lietus daudzumu Sietlā. Sietlā ir jābūt saulainākai un mazāk lietainai vietai. ” Tā kā mērījumos neiekļāvāt citus svarīgus rādītājus, jūs izvēlējāties nepareizi, pamatojoties uz pārāk ierobežotu informāciju.

Tas, kas lietotnes vai vietnes izstrādātājam šķiet svarīgs, lai kaut ko novērtētu, patiesībā var nebūt tik svarīgs kā tas, ko viņi atstāja malā. Iedomājieties lietotni, kas tikai mērīja jūsu reakciju uz medikamentiem, bet izlaida visus pārējos svarīgos faktorus, kas veicina jūsu garastāvokli un ārstēšanu.

Ārstēšana nenotiek vakuumā ar jums un vienu medikamentu. Tas notiek bagātīgā, sarežģītā ekosistēmā, kas var ietvert medikamentus, bet ietver arī daudzas citas svarīgas lietas, ko jūs darāt, lai palīdzētu sev atveseļoties. Tas var būt tas, cik daudz jūs vingrojat vai neremējat, vai dienas, kuras jūs pavadāt bez panikas lēkmes vai stresa par ģimenes locekli vai darbu.

Īsāk sakot, ir neskaitāmas lietas, kuras vajadzētu izsekot lietotnēm un citiem labi domājošiem pakalpojumiem, taču tas tā nav. Tas dod sagrozītu perspektīvu tam, kā mērāmais ir saistīts ar cilvēka garastāvokli vai atveseļošanās progresu. Medikamenti patiešām ir svarīgi daudzu cilvēku ārstēšanā, taču tas var nebūt - un bieži vien nav - vissvarīgākais.

!-- GDPR -->