Dr Epšteins, politiskā aizspriedumi un Google meklēšanas rezultāti

Mani nedaudz mulsina doktora Roberta Epšteina apgalvojumi un viņa apgalvojums, kas balstīts uz vienu 95 dalībnieku pētījumu, ka Google kaut kā tīši neobjektīvi uzrādīja rezultātus, kas tika parādīti pirms 2016. gada ASV prezidenta vēlēšanām. Tāpēc tas, iespējams, ietekmēja vēlēšanu rezultātus.

Tas ir a milzīgs apgalvojums, ko izteikt. Var cerēt, ka tādam cienījamam pētniekam kā Dr Epšteins būs zinātniski dati, kas tos pamatotu. Diemžēl es to neredzu.

Zinātne ir objektīva tikai līdz brīdim, kad zinātnieks atzīst un izskaidro viņas vai viņas aizspriedumus. Zinātne nav balstīta uz iepriekš iestatītu darba kārtību vai mēģinājumiem nokārtot rezultātu. Es neesmu pārliecināts, ka doktors Epšteins savās šķietamajās raganu medībās ir pārbaudījis savus aizspriedumus, lai nojauktu Google par “neobjektīvu” meklēšanas rezultātu piedāvāšanu.

Meklētājprogrammas vienmēr ir bijušas tendenciozas

Google vienmēr ir piedāvājis neobjektīvus meklēšanas rezultātus. Ja jūs to nesaprotat ir lai tas būtu piemērojams jebkurai meklētājprogrammai, jums, iespējams, būs nepieciešams ātrs atsvaidzināšanas kurss par meklētājprogrammu darbību.

Nav objektīvu meklēšanas rezultātu. Visas meklētājprogrammas izmanto patentētus komercnoslēpumu algoritmus, lai pārliecinātos, ka meklētājprogrammu uzņēmums uzskata par vislabāko rezultātu. Kopš meklētājprogrammu darbības sākuma 1990. gadu sākumā “Best” vienmēr ir bijis subjektīvs termins. Nav vienotu objektīvu vietņu rangu, kurā teikts: “Vienmēr parādiet šo vietni vispirms šim meklēšanas vaicājumam, jo ​​tas nepārprotami ir labākais rezultāts.”

Un uzmini - cilvēkiem tas patīk! Tāpēc Google atrodas meklētājprogrammu kaudzē, jo tas patiešām piedāvā rezultātus, kas acīmredzot ir visatbilstošākie lielākajai daļai cilvēku. Tajā brīdī, kad Google pārtrauks piedāvāt šādus atbilstošus rezultātus, jauna meklētājprogramma var un stāsies tās vietā. (Kāds atceras Alta Vista, Excite vai pat Yahoo? [Un nē, Yahoo vairs neveic meklēšanu - tā rezultātus nodrošina Bing.])

Kā izskatās aizspriedumi meklētājprogrammu rezultātos?

Daudziem nezinot, meklētājprogrammas neuzrāda tieši tos pašus rezultātus vienam un tam pašam vaicājumam, kuru uzdeva divi dažādi cilvēki. Lielākā daļa meklētājprogrammu, tostarp Google, izmanto sarežģītus personalizācijas faktorus, kā arī psihogrāfisko profilu, lai vēl vairāk kārtotu un parādītu rezultātus, kas, viņuprāt, ir jums visatbilstošākais.

Praksē tas nozīmē, ka mans meklējums pēc “depresijas simptomiem” var atgriezt atšķirīgu rezultātu kopu nekā jūsu meklēšana ar tieši tādiem pašiem noteikumiem. Ja jūs savā metodikā to rūpīgi nekontrolējat, jūsu rezultāti būs bezjēdzīgi un sabojāti.

Epšteins un Robertsons (2015) laboratorijas (nevis reālās pasaules) eksperimentu sērijā atklāja, ka, mākslīgi manipulējot ar meklētājprogrammu rezultātu lapām, viņi īsā laikā varēja ietekmēt subjektu vēlētāju vēlmes. Tā neizpētīja nevienu faktisko meklētājprogrammu lapu. Un tas ignorēja mūsdienu meklētājprogrammu rezultātu lapu izkārtojumu un sastāvu. Īstās meklēšanas rezultātu lapās ir redzamas vairākas reklāmas (kuras ikviens var iegādāties) lapas augšdaļā pirms jebkādiem dabiskiem rezultātiem.

Šie pētnieku rezultāti nav pārsteidzoši, jo tie atkārto to, ko jums teiktu jebkurš meklētājprogrammu optimizācijas (SEO) eksperts - pozīcija ir svarīga meklētājprogrammas rezultātu lapā. Vietnes saņem daudz vairāk datplūsmas, ja rezultātu otrajā lapā tās ir 1., 2. vai 3., salīdzinot ar 9. numuru vai vēl sliktāk.

Otrajā laboratorijas eksperimentā tas pats pētnieks parādīja metodes (atkal izmantojot pilnīgi viltotu meklētājprogrammu, nevis Google), kurās viņu radīto efektu - meklētājprogrammu manipulācijas efektu (SEME) - varēja nomākt (savlaicīgi brīdinot lietotājus) ).

Google palīdzēja Hilarijai uzvarēt?

2017. gadā Epšteins un Robertsons vairs neapmierinājās ar acīmredzamo - ka pozīciju rangs ir svarīgs meklētājprogrammu rezultātu lapās. Viņi spēra soli tālāk un veica pētījumu par 95 amerikāņiem (no kuriem tikai 21 no viņiem nākamajās prezidenta vēlēšanās atzina par “neizšķirtiem”) un viņu meklēšanas paradumiem.

Baltajā grāmatā, kas publicēta tikai viņu pašu vietnē, Epstein & Robertson izvirza ārkārtas prasību:

[… W] esam atklājuši, ka laikā no 2016. gada maija līdz novembrim meklēšanas rezultāti, kas tika parādīti, reaģējot uz plašu ar vēlēšanām saistītu meklēšanas vienumu klāstu, visās 10 meklēšanas rezultātu pozīcijās bija vidēji tendenciozi par labu Klintonei.

Tas tika publicēts kā “balts papīrs”, nevis kā recenzēts žurnāla pētījums. Tas izsauca virkni sarkanu karogu.1

Pētījumā izskaidrotais metodoloģijas veids bija maz. Tajā nav informācijas par to, kas tika darīts, lai ierobežotu meklēšanas rezultātu personalizēšanu (jo vēlaties kontrolēt šo neatkarīgo mainīgo), ne arī par to, kādus meklēšanas vienumus viņi faktiski izmantoja.Patiesībā, lasot divus iepriekšējos pētniekus, kurus šie pētnieki publicēja, nav pat skaidrs, ka viņi zina, kā darbojas meklētājprogrammas attiecībā uz to monetizācijas stratēģijām, iknedēļas algoritmu izmaiņām, ko viņi izmanto, un meklēšanas rezultātu personalizēšanu.

Manuprāt, pētnieka centienos ir arī acīmredzama pavirša. Nav pamatojuma par konkrēto 25 dienu laika periodu, ko viņi izmantoja pētījumā, salīdzinājumā ar jebkuru citu laika periodu. Un patiesībā viņi atzīst, ka patiesībā neskatījās tik uzmanīgi uz lielāko daļu datu punktu viņi bija savākuši. Pētnieki ignorēja 7 mēnešus ilgus pētījumu datus, lai koncentrētos tikai uz 3 nedēļām pirms vēlēšanām

Viņi arī post-hoc pieņēma lēmumu izmest visus Gmail.com balstītos datus šo datu anomāliju dēļ. Šīs anomālijas neparādīja šādu neobjektivitāti, ko tās attiecināja vai nu uz “robotu” komplektu, vai arī - gaidiet to - tīšu Google sabotāžu.

Tā kā ir daudz mazāk likumīgu lietotāju, kuri izmanto Gmail, šie iemesli, lai izmestu visus no Gmail.com iegūtos datus, labākajā gadījumā šķiet apšaubāmi. Manuprāt, tas ir šausmīgs izpētes lēmums, kas nejauši nodrošināja arī to, ka pētnieki atrada nozīmīgumu savos datos.

Bet šeit ir īstais kicker:

Ekstrapolējot no šajā ziņojumā iekļautās matemātikas 2016. gada februārī un pēc tam publicētajos rakstos, PNAS pētījuma vadošais autors paredzēja, ka Klintone atbalstoša neobjektivitāte Google meklēšanas rezultātos laika gaitā vismaz 2,6 miljonus balsu novirzīs Klintonei.

Viņu baltajā grāmatā ir nulle matemātikas. Tur ir virkne aprakstošas ​​statistikas, taču šī statistika tik tikko runā par to, kādas procedūras vai modelēšanu pētnieki faktiski izmantoja, lai izdarītu secinājumus, ko viņi darīja.

Pētnieku “pierādījumi par sistemātisku neobjektivitāti 2016. gada prezidenta vēlēšanās?” Neliela modelēšanas datu atlase, kuras pamatā ir 95 amerikāņi (atskaitot Gmail.com lietotājus, kuru datus viņi meta post-hoc).

Īsāk sakot, manuprāt, tas ir tieši tāds nepietiekams, ēnains, šausmīgi izstrādāts pētījums, kas šajā dienā un laikmetā tiek izmantots kā "pierādījums". Kāpēc pētnieki veic tik šķietami politiski neobjektīvu pētījumu un arī izdara secinājumus, ka viņiem nav reālu tiešu pierādījumu? 3

Varbūt tur ir jāmaļ cirvis?

Pētnieki ir cilvēki. Un cilvēkiem dažreiz ir cirvis, ko sasmalcināt. Jums nav jādodas tālu, lai atrastu vienu no Epšteina iespējamām īpašajām asīm.

Pirms 2012. gada Epšteins izrādīja nelielu interesi par meklētājprogrammām vai to darbību. Viņš publicēja dažādas psiholoģiskās, attiecību un garīgās veselības tēmas un rakstīja par tām parastajām vietnēm.

Tad 2012. gada sākumā Epšteina personīgā vietne saņēma brīdinājumu par ļaunprātīgu programmatūru, kas parādījās, kad lietotāji mēģināja piekļūt viņa vietnei no Google. Google parāda šos brīdinājumus, lai novirzītu lietotājus prom no potenciāli ļaunprātīgām vietnēm.

Bet šis incidents acīmredzot kaut kādā veidā nonāca Epšteina ādā, jo pēkšņi viņš 2012. gada rudenī raksta vairākus rakstus par nepieciešamību regulēt Google. Tas no pētnieka, kurš nekad iepriekš nebija uzrakstījis nevienu vārdu par meklētājprogrammām. Man šķiet interesants laiks.

Īsāk sakot, Epšteins pēdējos septiņus gadus iestājās par federālās valdības Google regulējumu. Nebūtu pārāk grūti iedomāties hipotētisku pētnieku, kas izstrādā pētījumus, lai atbalstītu viņu vai viņa uzskatus.

Meklētājprogrammas neobjektivitātes attēls

Meklētājprogrammas vienmēr ir bijušas tendenciozas un vienmēr būs, jo tās ir subjektīvi rīki, kas domāti, lai palīdzētu lietotājiem iegūt informāciju vai izklaidi. Minūtē, kad lielā valdība vēlas sākt pārraudzīt manus meklēšanas rezultātus, tiek minēts brīdis, kad es vēršos pie meklētājprogrammas, kur šāda valdības filtrēšana netiek veikta.

Tas arī palīdz paturēt prātā hipotētisku iejaukšanos pret reālu iejaukšanos ASV politikā. Kamēr Epšteins apgalvo, ka Google manipulē ar politiskās meklēšanas rezultātiem, lai atbalstītu kandidātus, kurus tā vēlas ievēlēt amatā, mums ir reāls pierādījums tam, ka Facebook manipulē ar 2016. gada prezidenta vēlēšanām, izmantojot Krievijas sponsorētas organizācijas, kas savā platformā iegādājas miljoniem dolāru nepatiesas reklāmas.

Interesanti, ka Epšteins, šķiet, par to nav īpaši ieinteresēts. Varbūt tas ir tāpēc, ka Facebook nekad nav nodarījis viņam pāri, kā to izdarīja Google.

Lai iegūtu papildinformāciju

Politifact: Donalds Tramps kļūdījies Google manipulējot ar vēlēšanu rezultātiem

Atsauces

Epšteins un Robertsons. (2017). Meklētājprogrammas manipulācijas efekta (SEME) nomākšana. Proc. ACM Hum.-Comput. Mijiedarboties, 1 (2), 42.

Epšteins un Robertsons. (2017). Metode, lai atklātu neobjektivitāti meklēšanas reitingos, ar pierādījumiem par sistemātisku aizspriedumu, kas saistīts ar 2016. gada prezidenta vēlēšanām. Balto grāmatu izdevusi Epstein organizācija AIBRT.

Epšteins un Robertsons. (2015). Meklētājprogrammas manipulācijas efekts (SEME) un tā iespējamā ietekme uz vēlēšanu rezultātiem. PNAS, 10.1073 / pnas.1419828112

Zemsvītras piezīmes:

  1. Atbildot uz jautājumu par salīdzinošo pētījumu trūkumu, Epšteins man atbildēja: “Man ir arī problēmas, kas saistītas gan ar steidzamību, gan ar daudzumu: esmu pabeidzis vai turpinu tik daudz dažādu pētījumu par jaunām tiešsaistes ietekmes formām (es studēju šobrīd septiņi dažādi ietekmes veidi - SEME un seši citi), kurus esmu nolēmis apkopot savus secinājumus konferenču dokumentos, baltajos rakstos un kādā brīdī grāmatu formā, nevis tērēt to, kas man paliek maz sāpīgi lēns akadēmisko publikāciju process. Kad es uzdūros citam jaunam tiešsaistes ietekmes veidam, man ir vajadzīgs vismaz gads vai divi, lai to saprastu un izteiktu skaitļos. (Es pat neesmu sapratis, lai sāktu eksperimentus ar pusduci jaunu ietekmes veidu, par kuriem es zinu.) Vēl viena vai divu gadu pievienošana šim procesam, lai to publicētu žurnālā, šķiet neprātīga, ņemot vērā manu vecumu un ņemot vērā to, cik potenciāli svarīgi šie atklājumi ir cilvēcei. ” [↩]
  2. Pētnieki apgalvoja, ka tas bija saistīts ar to, ka, viņuprāt, tika pieņemti darbā jautājumi un uzlabotas viņu procedūras. Kas liek uzdot jautājumu - vai vispirms viņu procedūras nevajadzēja pilnveidot izmēģinājuma pētījumā, kā to darītu lielākā daļa pētnieku? [↩]
  3. Vai arī, ja vēlaties būt pedantisks, 25 dienu laikā ir jābūt minimālam pierādījumam, pamatojoties uz nelielu 95 lietotāju meklēšanas vaicājumu - atskaitot dažus Gmail.com priekšmetus. [↩]

!-- GDPR -->