Slikti pētījumi: populāri seksa meklēšanas vienumi
Cilvēkiem patīk sekss. Viņiem tik ļoti patīk sekss, viņi daudz laika pavada, meklējot to tiešsaistē. Iet figūra. (Jūs varat pateikt, ka es gatavojos šeit iedziļināties ļoti augstās, pārsteidzošās lietās ...)Pētnieki Ogi Ogas un Sai Gaddam nesen publicēja grāmatu Miljards ļaunu domu, detalizēti analizējot 400 miljonu meklēšanas gadījumu, ko viņi savāca no meklētājprogrammas Dogpile. No šiem 400 miljoniem meklēšanas gadījumu 13 procenti (55 miljoni) bija domāti erotiskam saturam.
Kā sadalījās šie 55 miljoni meklējumu? Uzzināsim ... bet apskatīsim arī šo pētnieku metodoloģiju, lai noskaidrotu, vai viņu atklājumi ir tā papīra vērti, uz kuru viņi ir drukāti. (Ja jūs domājat, ka nē, jums, iespējams, ir taisnība.)
Tātad, lūk, ko cilvēki Dogpile meklē, kad runa ir par seksuālām interesēm. Ņemiet vērā, ka zemāk minētie vārdi ir vispārīga šīs intereses meklēšanas kategorija, kas ietver visu veidu terminu mutācijas. Šīs permutācijas (piemēram, “krūtis” krūtīm) nav uzskaitītas turpmāk; izmantojiet iztēli.
- Jaunatne - 13,5 procenti
- Gejs - 4,7 procenti
- MILFs (Mother’s I'd like to F ***) - 4,3 procenti
- Krūtis - 4,0 procenti
- Krāpšanās sievas - 3,4 procenti
- Maksts - 2,8 procenti
- Dzimumlocekļi - 2,4 procenti
Atkritumi iekšā, atkritumi ārā
Datorprogrammēšanā ir vecs teiciens - GIGO: Garbage In, Garbage Out. Tas vienlīdz labi attiecas uz visiem zinātniskiem centieniem, kas ir tikpat labi kā dati, kurus izvēlaties analizēt. Ja sākat ar apšaubāmas vispārināmības vai vērtības datu kopu, jūs varat atrast secinājumus, kuriem ir maz sakara ar realitāti.
Šajā gadījumā ir milzīga problēma ar pētījumu datiem, kurus šie pētnieki apkopoja. Tie nenāk no Google vai pat Bing. Tie nāk no mazpazīstamas meklētājprogrammas ar nosaukumu “Dogpile”, kas pat nav meklētājprogramma. Kas ir Dogpile, ir vienkārši Google, Yahoo un Bing meklēšanas rezultātu apkopošanas dzinējs (tā kā Bing tagad nodrošina Yahoo savus meklēšanas datus, es neesmu pārliecināts, kāpēc joprojām pastāv šī diferenciācija).
Tas nav tas pats, kas meklēšana, kas veikta Google tīklā, izmantojot Google.com, vai meklēšana, kas veikta vietnē Bing caur Bing.com. Lai iegūtu šos rezultātus, jums faktiski jādodas uz Dogpile vietni - rezultāti, kas veidoja datu kopu pašreizējiem pētniekiem. Ja veicat meklēšanu vietnē Google.com, šie pētnieki nebūtu analizējuši jūsu meklēšanu (kas ir jēga, jo Google un Bing nepadara pētniekiem viegli pieejamus datus, ko savāc par meklējumiem).
Iespējams, ka Dogpile ir maz izmantots, ir fakts, ka tas sajauc sponsorētās meklēšanas reklāmas ar dabiskās meklēšanas rezultātiem, praktiski neredzot nekādu vizuālu norādi. Sīkā drukāšana katra meklēšanas rezultāta beigās ļauj uzzināt, vai tas ir “sponsorēts” rezultāts, piemēram, reklāma. Meklējot “depresiju” Dogpile, 14 no pirmajiem 20 meklēšanas rezultātiem bija reklāmas - ne gluži tas, ko lielākā daļa parasto cilvēku ļoti ilgi panes.
Cilvēki, kuri meklē saturu tiešsaistē, jau sen ir nolēmuši atteikties no meklētājprogrammām, kas mēģina sajaukt reklamēšanu ar faktiskajiem rezultātiem. Iemesls ir vienkāršs - cilvēki noklikšķinās uz reklāmas, kad viņus interesēs piedāvātais produkts vai pakalpojums. Viņiem nepatīk, ka viņus maldina noklikšķināt uz, viņuprāt, meklēšanas rezultāta, tikai lai uzzinātu, ka tā ir slēpta reklāma.
Tātad, kurš izmanto Dogpile? Kas zina, bet tas, visticamāk, nebūs galvenais interneta lietotājs. Lai gan vairāk nekā 150 miljoni cilvēku izmanto Google un 90 miljoni izmanto Bing.com, Dogpile maigi 2-3 miljoni cilvēku mēnesī salīdzinājumā ar to nobāl un ir daudz mazāk nekā 0,05 procenti no kopējā meklētājprogrammu tirgus.
Vai jūs varat veikt aptauju par tik mazu datu kopu un izmēģināt dūmus un spoguļus, lai liktos, ka jūs patiešām veicāt tādu pašu revolucionāru pētījumu kā Kinsija institūts 1950. un 1960. gados? Jūs noteikti varat.
Piemēram, Ogi Ogas un Sai Gadams sacīja, ka viņi analizēja 400 miljonus meklēšanas vaicājumu internetā. Bet salīdziniet šo skaitli ar katru dienu veikto 3 miljardu meklējumu skaitu, norāda tiešsaistes analītikas uzņēmums Hitwise. Pēkšņi 400 miljoni - kaut arī šķietami iespaidīgs skaits vakuumā - izskatās daudz mazāk iespaidīgi, ja tos ievieto sava veida datu kontekstā. 400 miljoni meklējumu ir ekvivalents tam, kas tiek veikts apmēram 3 stundās. Vienā dienā.
Konteksts, protams, ir viss, kad runa ir par datu kopām, it īpaši, ja šīs datu kopas, iespējams, ir tendenciozas tādā veidā, kā jūs nekad neuztraucāties izpētīt. Šajā gadījumā datu kopa ir neobjektīva, izmantojot Dogpile meklētājprogrammu - niecīgu, nišas meklētājprogrammu, kuru, visticamāk, neizmanto noteikta populācijas apakškopa, kas atšķiras no pārējiem iedzīvotājiem.
Tāpēc ņemiet šo sarakstu ar sāls graudu. Tas ir interesanti, bet es neesmu pārliecināts, ka tas atspoguļo vispārējos iedzīvotājus. Un noteikti nav vērts iegādāties veselu grāmatu, kas iedziļinās šajā kļūdainajā datu kopā.