Testul asocierilor implicite: Suntem cu toții rasiști fără să știm?

Sumar. Testul asocierilor implicite, varianta rasială, este văzut de publicul larg și promovat de unii cercetători ca un instrument prin care fiecare poate descoperi cât de rasist este în mod implicit și cum o să se comporte față de persoane de alte rase sau etnii. Cercetarea, în schimb, nu justifică folosirea testului. Dacă ne uităm la toate studiile și le analizăm riguros, puterea de predicție a testului este prea mică pentru a avea relevanță practică; dacă o persoană face testul a doua oară sunt mari șanse să obțină un alt rezultat; și nu există dovezi concludente că tehnicile de reducere a prejudecăților implicite chiar funcționează.

Conținut

Înainte de toate

Ce este testul asocierilor implicite?

Unde e promovat și folosit?

În cărți de psihologie populară

În presă

În companii, universități, poliție…

În alte locuri

Ce spune cercetarea? La ce e bun acest test?

Primele studii

Poate prezice acest test comportamentul discriminatoriu?

Dacă îl repeți mai obții același rezultat?

Care este legătura dintre scorul IAT și realitate?

Pot fi reduse prejudecățile implicite?

Cum răspund apărătorii testului dincolo de dezbaterea științifică?

Concluzii

Înainte de toate

Înainte să intrăm în detalii vreau să clarific niște lucruri care vor fi importante pe parcursul acestui articol. Primul este că există mai multe tipuri de IAT, dar aici o să mă ocup în mod explicit de IAT-ul rasial (pe care o să-l descriu imediat). Pentru simplitate în acest articol folosesc termenii „IAT” și „IAT rasial” interschimbabil. Dacă nu menționez explicit că mă refer la alt IAT, trebuie să presupuneți că mă refer la IAT-ul rasial.

Analizele, datele și concluziile pe care le prezint în acest articol se referă strict la IAT-ul rasial, iar alte forme de IAT s-ar putea să aibă alte caracteristici. Ba chiar o să dau un exemplu concret: IAT-ul suicidal este un test IAT folosit pentru a detecta încercările de sinucidere. Acest test are date robuste care arată că este util pentru a prezice (într-o anumită măsură) cine e mai probabil să încerce să se sinucidă.48

Al doilea lucru este că existența rasismului și utilitatea IAT-ului rasial sunt două lucruri independente. Dacă IAT-ul rasial se dovedește a nu fi util nu înseamnă că rasismul nu există. Contestarea IAT-ul rasial nu este un act de rasism, ba din contră! Dacă IAT-ul rasial are probleme serioase care nu sunt cunoscute, s-ar putea chiar să îngreuneze combaterea rasismului. A lupta contra rasismului prin metode ineficiente e echivalent cu a lupta contra cancerului folosind homeopatia. Iar persoanele care explică de ce homeopatia este o opțiune proastă nu sunt pro-cancer, ci anti-cancer.

Politica, ideologia sau credințele personale nu ar trebui să aibă niciun rol în determinarea răspunsurilor la întrebări științifice, chiar dacă rezultatele nu sunt cele dorite. Nu ar trebui să fie nevoie să spun asta, dar simt că este.

Ce este testul asocierilor implicite?

Testul asocierilor implicite (Implicit Association Test, IAT) este un test inventat în 1998 care încearcă să descopere asocierile pe care le facem între concepte fără să fim conștienți de ele. IAT-ul rasial este cel pe care o să ne concentrăm în acest articol pentru că despre acesta se spune că ne poate arăta prejudecățile noastre implicite și dacă ne comportăm într-un mod discriminatoriu fără să știm. Puteți face acest test foarte ușor, din fața calculatorului în aproximativ 5 minute. Trebuie să mergeți la următorul link și să selectați Rasă (TAI ’Albi-Negri’):

implicit.harvard.edu

Inițial vi se cere să răspundeți la niște întrebări care o să fie folositoare cercetătorilor când vor să analizeze datele pentru studii (puteți să săriți peste ele). Ce trebuie să faceți e să apăsați e (pentru stânga) sau i (pentru dreapta) în funcție de categoria din care face parte elementul afișat. La început o să fie ușor, o să trebuiască să apăsați i dacă apare o față albă și e dacă apare una neagră.

IAT. Test 1.PNG

Apoi trebuie să faceți același lucru pentru cuvinte bune sau rele. La al treilea set se complică un pic lucrurile. Acum trebuie să alegeți e pentru fețe albe sau cuvinte rele și i pentru fețe negre sau cuvinte bune.

IAT. Test 3.PNG

Apoi urmează o serie în care trebuie să alegeți doar între fețe albe și negre, dar de data asta pozițiile sunt inversate (negri la stânga, albi la dreapta), iar în ultima serie o să alegeți între fețe albe sau cuvinte bune și fețe negre sau cuvinte rele. Ordinea secvențelor poate fi diferită (adică s-ar putea să fie întâi secvența cu fețe albe sau cuvinte bune și apoi secvența cu fețe albe sau cuvinte rele).

IAT. Test 5.PNG

Ideea din spatele testului este că dacă în subconștient avem o preferință automată pentru albi, o să răspundem mai repede și cu mai puține greșeli atunci când avem de asociat fețele albe cu cuvinte bune sau fețele negre cu cuvinte rele. Și invers, o să răspundem mai încet și cu mai multe greșeli când avem de asociat fețele albe cu cuvinte rele și fețele negre cu cuvinte bune. Diferențele în timpul de răspuns sunt transformate de un algoritm într-un număr. În funcție de cât de mare este numărul, o să fim puși într-o categorie sau alta.

După ce am scris acest articol (minus această secțiune de descriere a testului) am făcut testul IAT de patru ori (înainte de asta nu l-am făcut niciodată). Am obținut de fiecare dată alt rezultat (în această ordine): preferință puternică pentru albi, preferință moderată pentru albi, preferință ușoară (poate inexistentă) pentru albi și preferință moderată pentru negri. Ultimul rezultat arată așa:

IAT. Rez.PNG

Testul a fost creat și dezvoltat până la varianta în care este azi în principal de trei cercetători: Anthony Greenwald, Mahzarin Banaji și Brian Nosek.

IAT. Greenwald, Banaji, Nosek
Fig. 1: Creatorii testului: Anthony Greenwald, Mahzarin Bananji și Brian Nosek.

Dintre cei trei, Brian Nosek a devenit mult mai cunoscut (printre cercetători) pentru implicarea sa în îmbunătățirea felului în care e făcută știința. De exemplu, în 2013 a fondat Center for Open Science, a condus mai multe proiecte de replicare (inclusiv replicarea a 100 de experimente din psihologie18) sau a promovat practici care să îmbunătățească transparența din știință (ex.: insignele de preînregistrare49 sau principiile TOP). Nosek a avut un rol principal în revoluția care a început în psihologie în ultimul deceniu. Mă declar fanul său, dar asta bineînțeles nu înseamnă că sunt de acord cu tot ce zice.

Unde e promovat și folosit?

Testul asocierilor implicite (IAT) a devenit foarte popular de-a lungul timpului, în special în ultimii ani. El este prezentat în cărți de psihologie populară sau în presă aproape exclusiv în mod pozitiv, iar unele organizații sau companii îl recomandă sau chiar îl fac obligatoriu pentru angajații lor în încercarea de a combate rasismul. În secțiunile următoare o să ne uităm în detaliu la cât de justificată este imaginea testului, dar înainte de asta aș vrea să dau niște exemple care ne arată cum e văzut testul de către cea mai mare parte a populației.

În cărți de psihologie populară

O să încep cu cărțile pentru că îmi place să citesc, iar în trecut obișnuiam să citesc multe cărți de psihologie populară.

Una dintre cele mai de succes este Blink (2005) de Malcolm Gladwell, iar capitolul 3 este dedicat în mare parte IAT-ului. După ce explică în ce constă testul și își încurajează cititorii să-l facă, Gladwell spune că rezultatul „este un puternic mod de predicție despre cum ne comportăm în anumite situații spontane” și că dacă avem un scor care indică o tendință pro-albi o să afecteze cum ne comportăm în prezența negrilor. De asemenea, Gladwell dă exemple ipotetice despre cum prejudecățile implicite influențează deciziile de angajare.1 Iar în aparițiile sale publice, a susținut că prejudecata implicită este de vină pentru un caz concret în care o persoană de culoare a fost împușcată de un polițist alb.2

N-am fost mare fan al lui Gladwell, dar în schimb am fost fascinat de cartea The Hidden Brain (2010) de Shankar Vedantam. Erau atât de multe exemple despre cum preferințele sau tendințele noastre subconșitente ne pot face să greșim încât era ca și cum descopeream o lume ascunsă. Și toate afirmațiile păreau susținute de studii. În apărarea mea, era o vreme de dinainte de criza replicării și orice rezultat părea plauzibil. În prezent nu aș mai fi fascinat de o astfel de carte. În capitolul 9, Vedantam prezintă testul asocierilor implicite într-un mod pozitiv. Ne spune, de exemplu, că „în ultimul deceniu, multe experimente au arătat că rezultatele la Testul Asocierilor Implicite prezic comportamentul oamenilor în lumea reală” sau că Mahzarin Banaji i-a spus că s-a simțit rușinată când l-a făcut prima dată și a aflat rezultatele. Banaji, Greenwald și Nosek „au creat o hartă a Americii care arată vârfurile și văile prejudecății, locurile în care prejudecățile rasiale inconștiente sunt cele mai mari și unde sunt cele mai mici”.3

Dar cartea care a promovat cel mai mult IAT-ul este chiar cea scrisă de doi dintre creatorii testului (Greenwald și Banaji). Se numește Blindspot, e din 2013, iar în capitolul 3 sunt mai multe afirmații din care se înțelege clar că testul este util pentru descoperirea prejudecăților rasiale și că este susținut de o știință solidă:

Nici noi și nici alții nu făcuseră studii care să determine dacă cei cu scorurile cele mai înalte la preferința pentru albi la IAT-ul rasial sunt și cel mai probabil cei cu un comportament discriminatoriu rasial. Dar situația s-a schimbat. Datorită acumulării rapide de cercetare care folosește IAT-ul rasial în ultimul deceniu, două descoperiri importante sunt acum demonstrate. În primul rând, știm acum că preferința automată pentru albi este universală în societatea americană – aproximativ 75% dintre cei care fac IAT-ul rasial în studii pe internet sau în laborator dezvăluie preferințe automate pentru albi.

În al doilea rând, preferința automată pentru albi exprimată în IAT-ul rasial este acum dovedită ca arătând comportament discriminatoriu. Prezice comportament discriminatoriu chiar și printre participanții care cu toată seriozitatea (și, credem noi, sinceritatea) îmbrățișează credințe egalitare. Această ultimă afirmație poate părea că se contrazice, dar este un adevăr empiric. Printre participanții care se descriu ca egalitarieni din punct de vedere rasial, IAT-ul rasial, s-a arătat cu încredere și repetat, că prezice comportamentul discriminatoriu care a fost observat în cercetare.4

Cred că acestea sunt niște afirmații care nu lasă urmă de îndoială în legătură cu ce cred autorii: IAT-ul rasial este știință consacrată, adevăr empiric și prezice comportamentul discriminatoriu. O să vedem mai târziu că acest mesaj pentru public diferă destul de mult de cel pentru alți cercetători.

În presă

Cei mai mulți oameni își iau informațiile din articole de presă, așa că hai să vedem ce fel de informații găsim aici. E probabil imposibil de făcut o analiză sistematică, dar în căutările mele nu am găsit decât foarte rar articole critice față de IAT. De-a lungul timpului limbajul a devenit mai moderat (în general), dar a rămas predominant pozitiv. Chiar creatorii testului au dat interviuri la televizor, la radio, în presă și au ținut (și țin în continuare) prezentări la companii în care leagă rezultatele la IAT de comportamentul discriminatoriu.2

După publicarea primului studiu în care a fost folosit IAT-ul rasial, în 1998, declarația de presă făcută de Universitatea din Washington a avut titlul: „Rădăcinile prejudecății inconșitente îi afectează pe 90-95% dintre oameni, psihologii demonstrează la conferința de presă”. Mai recent, în 2009, The Guardian recomanda oamenilor să facă testul pentru a afla dacă au prejudecăți rasiale. În 2017, după ce un afro-american de 32 de ani a fost ucis de un polițist, Huffington Post publica un articol care spunea în titlu că nu polițistul l-a ucis, ci prejudecata implicită.

Și mai aproape de prezent, în iunie 2020, pe fundalul protestelor din SUA, IAT-ul este prezentat uneori ca dovadă pentru rasism. Pe site-ul radioului KQED (parte din rețeaua NPR), testul este descris ca un instrument făcut pentru „a expune prejudecățile rasiale subconștiente care se ascund sub suprafețe de altfel anti-rasiste”, iar cei care vor să fie aliați Black Lives Matter sunt încurajați să îl facă. Autoarea povestește cum prima dată când a făcut testul n-a obținut rezultatele dorite și de atunci s-a preocupat foarte mult de problemele de inegalitate rasială, iar acum l-a făcut din nou și i-au ieșit rezultate bune (o să vedem mai târziu că șansa de a obține rezultate complet diferite a doua oară, mai ales după multă vreme, este destul de mare chiar și fără nicio schimbare reală).

Mai multe site-uri de presă au prezentat ca senzațional un studiu care a folosit datele de la Proiectul Implicit și care a arătat că trei din patru persoane au prejudecăți implicite negative față de australienii indigeni. Studiul pare impresionant la prima vedere: 11.000 de participanți și date colectate timp de 10 ani. Iar pe baza rezultatelor, autorii de la Universitatea Națională Australiană afirmă că aceste prejudecăți implicite observate la testul IAT sunt „probabil cauza rasismului pe care mulți aborigieni îl resimt”. Însă pentru ca studiul să ne spună ceva util e necesar ca IAT-ul să fie valid. O să vedem mai târziu că nu este.

În companii, universități, poliție…

Pentru că testul e promovat ca un instrument care poate descoperi pejudicii ascunse și poate prezice viitorul comportament discriminatoriu, multe instituții și companii au ales, deloc surpinzător, să apeleze la programe de training pentru prejudecăți implicite, programe care de cele mai multe ori includ și teste IAT (există și altele despre care se spune că pot descoperi prejudecăți inconștiente, dar nu sunt deloc atât de populare).

În 2018, un administrator a sunat la poliție pentru că două persoane de culoare stăteau în Starbucks fără să comande nimic. Gestul său a creat un scandal în mass-media, iar Starbucks pentru a potoli acuzațiile de rasism a anunțat că toți angajații săi vor fi obligați să facă training contra prejudecăților implicite.5 Starbucks nu e singură. Facebook, de exemplu, oferă un program pentru administrarea prejudecăților implicite care conține testul IAT „care le permite oamenilor să își descopere propriile prejudecăți”.

Southern Poverty Law Center, o organizație nonprofit specializată pe lupta împotriva „hate groups”, recomandă IAT-ul pe site-ul său tolerance.org pentru că le poate arăta oamenilor ce „prejudecăți negative” au. Institutul Kirwan pentru studierea rasei și etnicității a produs anual sinteze ale cercetării legate de prejudecățile implicite. Cea mai recentă, din 2017, afirmă că există cercetare considerabilă care documenteză efectele în lumea reală pe care le au prejudecățile implicite de-a lungul societății.6

Multe universități de peste tot din lume recomandă sau obligă angajații să participe la module de educare despre prejudecățile inconștiente. La fel și multe departamente de poliție, în special din Statele Unite, apelează la astfel de programe. Mahzarin Banaji, de exemplu, în 2019 s-a ocupat personal de educarea polițiștilor din Cambridge, Massachusetts. Cea mai populară companie care oferă astfel de programe este Fair and Impartial Policing, care a câștigat milioane de dolari în ultimii ani de la departamentele de poliție din New York, Austin, Los Angeles, Miami, Milwakee sau Minneapolis.7

În alte locuri

Înainte să trec la cercetare mai vreau să menționez că testul asocierilor implicite a încercat să pătrundă și în domeniul legal. Mai mulți cercetători, unii împreună cu creatorii testului, au sugerat schimbarea unor legi pentru a lua în considerare efectele inconștiente descoperite prin IAT. Astfel, au fost propuneri pentru ca judecătorii sau jurații să fie aleși în așa fel încât să fie evitate sau minimizate prejudecățile implicite sau ca testul IAT să fie unul dintre criteriile de angajare pentru a contracara discriminarea la locul de muncă.8

Și există și manuale de psihologie care prezintă IAT-ul într-un mod în totalitate pozitiv: dezvăluie „prejudecăți subtile, non-conștiente”, prezice comportamentul, iar studenții sunt încurajați să îl facă pentru a afla dacă au stereotipuri sau prejudecăți față de diverse grupuri. Un cercetător care a fost implicat în revoluția replicării numește astfel de afirmații „propagandă”.9

Ce spune cercetarea? La ce e bun acest test?

Dacă ne uităm în presă, cărți populare sau la practicile unor companii sau ale unor universități, imaginea e clară: testul asocierilor implicite funcționează pentru a ne arăta cât de rasiști suntem în mod implicit și cum o să ne comportăm în viitor. Dar dacă un lucru e popular nu înseamnă neapărat că e și corect.

Dacă ne uităm la cercetare, lucrurile stau altfel.

Primele studii

Acest test al asocierilor implicite a fost introdus prima dată în literatura științifică în 1998 când o echipă de psihologi condusă de Anthony Greenwald a publicat un articol în Journal of Personality and Social Psychology,10 un jurnal de top din domeniul psihologiei sociale (întâmplător, în același jurnal a publicat și Daryl Bem celebrul articol în care afirma că a demonstrat că există precogniție). Până în prezent, articolul lui Greenwald are 12.700 citări pe Google Scholar, ceea ce e foarte mult. Pentru comparație, în 2014 Nature a făcut un top al celor mai citate articole din știință (nu doar din psihologie). Principalul mod de notare a fost prin Web of Science, dar Google Scholar a fost prezentat ca alternativă.11 Ultimul articol din acea listă Google Scholar (nr. 100) avea 19.100 de citări, iar în prezent are 27.300. Așa că putem spune că articolul lui Greenwald, chiar dacă nu e de top 100, e cu siguranță influent.

Articolul a cuprins mai multe experimente, iar într-unul a fost folosit IAT-ul rasial.10 După standardele de azi, experimentul nu este deloc convingător pentru că a inclus doar 26 de participanți (14 studente și 12 studenți de la cursurile de psihologie). Nici celelalte experimente nu au fost mai impresionante, dar în acele vremuri de dinainte de criza replicării, metodologia slabă nu era o piedică în fața popularității ideilor, iar ideea că un test care poate fi făcut în câteva minute în fața calculatorului ne poate spune cât de rasiști suntem e foarte tentantă.

În anii 2000 au fost publicate multe articole care au avut ca subiect testul asocierilor implicite, iar un articol influent a fost publicat în 2001 și a arătat pentru prima dată că rezultatele IAT-ului prezic comportamente discriminatorii.12 Nici experimentul din acest articol nu a avut mulți participanți – doar 42. După mai mulți ani, când au început criticii să dea atenție subiectului asocierilor implicite, acest articol a fost reanalizat, iar reanaliza a arătat că datele originale nu arată o prejudecată pro-albi cum se credea inițial, ci o prejudecată pro-negri.13 Cum era de așteptat, autorii articolului original au răspuns și au contestat reanaliza,14 iar autorii reanalizei au contestat critica și și-au menținut concluziile.15 Și probabil pe urmă jurnalul i-a trimis să se certe în altă parte.

Printre autorii reanalizei se află cei trei principali critici ai testului asocierilor implicite: Philip E. Tetlock, Hart Blanton și Gregory Mitchell. Pe aceștia îi vom întâlni în dezbaterile care urmează. Practic lupta în literatura științifică s-a dus între creatorii testului (Greenwald, Banaji, Nosek) și acești trei critici (plus diverși co-autori).

IAT. Tetlock, Blanton, Mitchell.png
Fig. 2: Principalii critici ai testului: Philip E. Tetlock, Hart Blanton, Gregory Mitchell.

Cele două studii care au propulsat IAT-ul nu sunt impresionante, ba chiar unul dintre ele s-ar putea să aibă erori în interpretarea datelor, dar în condițiile în care există multe altele cum putem ști cât de util este IAT-ul?

Dacă ne uităm la studii individuale riscăm să nu vedem imaginea completă. De exemplu, pe lângă multe studii care arată utilitatea IAT-ului, există și studii care arată că dacă oamenii fac un test IAT rasial le crește prejudecata rasială implicită;16 sau că cei care au o preferință implicită pentru albi au un comportament care îi favorizează pe negri;45 sau că simplul fapt că participanților li se spune că un grup fictiv e oprimat, o să îi facă să aibă scoruri IAT mai mari; sau că preferința pentru explicațiile externe sau interne (ex.: „grupul este discriminat” vs. „grupul este mai puțin capabil”) poate inversa scorurile la IAT; sau că persoanele cu un proces cognitiv mai lent au avut scoruri mai mari la IAT. Blanton a zis că aceste rezultate pot de exemplu să îi facă automat pe cei mai bătrâni să pară mai afectați de prejudecăți implicite decât cei mai tineri sau pe cei care fac integrame sau joacă jocuri video să pară mai puțin afectați decât cei care nu fac asta.17

De asemenea, din criza replicării18,19,20,21 am aflat că studiile individuale pot foarte ușor să aibă rezultate greșite care poate sunt obținute prin tehnici chestionabile de cercetare sau sunt doar un artefact statistic (rezultate fals-pozitive), iar când cineva le repetă nu știm dacă o să mai obțină același rezultat sau nu.

Soluția la aceste probleme este complexă, dar ideal ar fi ca studiile individuale să fie pre-înregistrate,22 adică autorii să publice un protocol în care să descrie cum o să facă experimentele și cum o să analizeze datele și abia apoi să facă experimentele (iar după ce le-au făcut, să publice rezultatele cum au promis în protocol). Am vrut să văd dacă există vreun studiu pre-înregistrat relevant pentru legătura dintre IAT-ul rasial și comportamentul discriminatoriu, așa că am căutat pe Curate Science, dar nu am găsit nimic. M-am uitat și pe paginile lui Brian Nosek și nici acolo nu am găsit aproape nimic (Brian Nosek e unul dintre creatorii testului și în același timp unul dintre cei care au evidențiat criza replicării). Am găsit niște sinteze sistematice pre-înregistrate (pe care o să le menționez mai târziu) și un studiu despre schimbarea preferințelor implicite care n-a găsit rezultate pozitive (și pe acesta o să îl menționez mai târziu).

Un alt lucru important e să existe analize care iau în considerare toate studiile: sinteze sistematice. Există câteva astfel de analize și, după cum era de așteptat, sunt un motiv de contradicție între promotorii și criticii testului. Ca să clarificăm utilitatea IAT-ului trebuie să intrăm în mai multe detalii.

Poate prezice acest test comportamentul discriminatoriu?

Prima sinteză a studiilor despre IAT a fost făcută în 2009 de promotorii testului (Greenwald, Bananji și alți colegi) și a avut concluzii pozitive.23 Cam așa sună o parte dintre concluzii (într-un limbaj tehnic):

Această sinteză justifică recomandarea de a folosi IAT-ul și măsurile auto-raportate împreună ca predictori ai comportamentului. […] Sinteza a arătat că pentru subiecte sensibile din punct de vedere social validitatea predictivă a măsurilor auto-raportate a fost remarcabil de scăzută și validitatea incrementală a IAT-ului a fost relativ ridicată. […] În aceste domenii [inclusiv comportamentul rasial], validitatea predictivă a măsurilor IAT a depășit în mod semnificativ validitatea predictivă a măsurilor auto-raportate.

Dacă traducem într-un limbaj mai accesibil, autorii spun că rezultatele IAT-ului sunt utile pentru a prezice cum se comportă albii față de negri și că IAT-ul e chiar mai bun decât dacă i-am întreba direct pe oameni ce atitudini au. O astfel de concluzie justifică, într-adevăr, folosirea IAT-ului pentru a descoperi cât de rasiști suntem fiecare.

Problema este că o astfel de concluzie exagerează rezultatele sintezei. Este important să știm că IAT-ul poate prezice comportamentul, dar este la fel de important să știm și cât de mult. Prezice 90% din comportament? 50%? 1%? Acest „cât de mult” e măsurat în psihologie prin ceva ce se numește „mărimea efectului”. În acest caz, Greenwald și Bananji au găsit un efect de 0,236. Acum dacă nu sunteți obișnuiți cu cercetarea din psihologie o să întrebați ce înseamnă numărul ăsta. Dacă sunteți obișnuiți o să întrebați cum a fost calculat și la ce se referă.

Valoarea este o corelație între scorul la IAT-ul rasial și comportamentul discriminatoriu și este o valoare foarte mică. Valoarea ne spune că doar în jur de 5,8% din comportamentul discriminatoriu este explicat de scorul IAT-ului rasial.

IAT. Greenwald corelație 2
Fig. 3: Conform creatorilor testului, scorul la IAT-ul rasial explică mai puțin de 5,8% din comportamentul discriminatoriu. Sursa: adaptare după R Psychologist.

Puteți obține această valoare (și graficul fără text) dacă mergeți pe R Psychologist la secțiunea de corelații și alegeți valoarea 0,24 (cea mai apropiată de 0,236). Și tot acolo mai găsiți un grafic util. Punctele sunt generate aleator automat pentru a corespunde cu corelația aleasă, așa că n-o să vedeți exact graficul de mai jos. Am pus niște detalii pentru a fi mai ușor de înțeles. Fiecare punct reprezintă o persoană ipotetică. Cu cât deviază mai mult de la axa de 45° care unește colțul din stânga-jos cu cel din dreapta-sus (nu cea desenată), cu atât discrepanța între scorul IAT și comportament e mai mare. Cei peste axă discriminează mai mult decât indică scorul, iar cei sub axă mai puțin și sunt acuzați pe nedrept că ar fi rasiști dacă ne luăm după ce spune IAT-ul.

IAT. Greenwald corelație 1.PNG
Fig. 4: O posibilă distribuție care corespunde cu corelația de 0,24 găsită de Greenwald și Banaji. Punctele roșii și punctul verde sunt în original pe grafic, doar că nu erau colorate. Sursa: adaptare după R Psychologist.

Dacă ne uităm cum arată testul aplicat în lumea reală laborator, n-avem de ce să fim entuziasmați pentru că puterea sa de predicție este foarte mică. Iar asta e cea mai optimistă evaluare, făcută de creatorii testului.

În 2013, criticii (printre care Tetlock, Blanton și Mitchell) au făcut propria sinteză sistematică și au obținut rezultate mai proaste pentru IAT, iar argumentele lor sunt convingătoare.24

De exemplu, când Greenwald și Banaji au pus toate studiile împreună, nu au ținut cont de direcția efectului. Știu că sună tehnic, dar e de fapt simplu de înțeles. Să zicem că avem două studii cu participanți albi. În primul, scorul mare la IAT-ul rasial este strâns legat de (adică prezice) comportamentul discriminatoriu față de negri. În al doilea, scorul mare este strâns legat de (prezice) comportamentul discriminatoriu față de albi, nu față de negri. Aceste două rezultate sunt contradictorii, dar Greenwald și Banaji le-au tratat ca și când ar fi același lucru. Tetlock și colegii săi, în schimb, le-au considerat cum trebuie considerate: contradictorii.24

O problemă și mai mare în sinteza lui Greenwad și Banaji este că au fost puse la grămadă studii care preziceau comportamentul cu studii care preziceau altceva. De exemplu, studii care arătau o legătură între scorul IAT și niște scanări cerebrale. Deși poate fi interesant pentru cercetători să găsească o astfel de legătură, ea nu are nicio relevanță practică pentru că nu știm cum să legăm activitatea în anumite zone din creier cu diverse comportamente. Și chiar dacă am ști, tot ar fi discutabil cât de relevant mai e dacă am corelat întâi scorul IAT cu activitatea în anumite zone din creier și apoi activitatea în acele zone cu anumite comportamente. Prin urmare, Tetlock și colegii au făcut analize separate: una în care au măsurat legătura dintre IAT și activitatea cerebrală și alta în care au măsurat legătura dintre IAT și comportament.24 Iar pentru legătura dintre IAT și comportament au găsit o corelație și mai mică decât Greenwald & Banaji: doar 0,149. Dacă mergem din nou pe R Psychologist și punem valoarea 0,15 (cea mai apropiată de 0,149) vedem că această corelație ne spune că de fapt scorul la IAT-ul rasial explică cel mult 2,3% din comportamentul discriminatoriu.

IAT. Oswald. Corelație
Fig. 5: Conform criticilor, scorul la IAT-ul rasial explică în jur de de 2,3% din comportamentul discriminatoriu. Sursa: adaptare după R Psychologist.

După 2 ani, în 2015, creatorii testului (de data asta toți trei: Greenwald, Banaji și Nosek) au publicat un articol în care au răspuns la sinteza criticilor. Deși au găsit niște detalii cu care n-au fost de acord, au fost nevoiți să cedeze în fața datelor și au scris următoarele lucruri:25

Măsurile IAT au două proprietăți care fac problematică folosirea lor pentru a clasifica persoanele ca probabile în a se angrena în comportamente discriminatorii. Aceste două proprietăți sunt stabilitatea la retestare […] și mărimea efectului mică-spre-moderată pentru validitatea predictivă. Încercările de a folosi aceste măsuri pentru diagnosticarea indivizilor riscă, prin urmare, rate indezirabil de mari de clasificări eronate.

În traducere: testul IAT nu e util pentru a afla dacă o persoană e rasistă sau discriminează.

Totuși, autorii insistă că deși testul IAT nu ne poate spune nimic despre persoana care îl face, el ne poate arăta nivelul de prejudecată la nivel de societate.25 Această afirmație este ciudată. După cum remarcă Blanton: „Dacă sunt dispus să le dau la 100 de copii un test IQ, dar nu sunt dispus să spun ce înseamnă scorul unui copil individual, cum pot să spun pe urmă că 75% dintre ei sunt genii sau că au probleme de dezvoltare?”.17 Cred că are mult mai mult sens ce spune Blanton decât ce spun creatorii testului. Criticii (inclusiv Blanton) au contestat această interpretare într-un alt articol științific. Din punctul lor de vedere, concluziile potrivite ar fi că scorul IAT nu este un bun predictor al discriminării rasiale și etnice, iar semnificația sa la nivel de societate este necunoscută.26

În 2016, doi cercetători norvegieni fără legătură cu promotorii sau cu criticii testului au publicat o sinteză sistematică independentă care a confirmat rezultatele criticilor și au recomandat împotriva oricărei aplicații practice a IAT-ului rasial.27

În 2019, promotorii (Greenwald și Banaji și alți colegi de-ai lor) au publicat o altă sinteză sistematică, de data asta care a inclus de șase ori mai mulți participanți (36 de mii) și au găsit rezultate asemănătoare (corelație de 0,14), dar au analizat datele în mai multe feluri și au descoperit că un un grup de studii cu anumite caracteristici pot da o corelație mai mare (0,37). Prin urmare, au făcut niște recomandări pentru cercetarea viitoare.28

Pe de altă parte, o altă sinteză sistematică la care a participat Brian Nosek (dar nu și Banaji sau Greenwald) a investigat cât de mult pot fi schimbate prejudecățile implicite și menționează în trecere că a fost găsită o corelație de doar 0,09 între scorurile IAT-ului rasial și comportament.29 Această corelație corespunde cu o putere a scorului IAT de a explica doar 0,8% din comportamentul discriminatoriu. Avantajul acestei sinteze este că a fost pre-înregistrată, adică autorii au publicat un protocol în care au descris cum o să facă analizele și cum o să selecteze studiile și abia apoi le-au făcut. Pre-înregistrarea reduce gradul de libertate pe care îl au cercetătorii când văd rezultatele, astfel că dacă nu le convin nu mai pot să caute alte moduri de a analiza datele.

Personal prefer studiile pre-înregistrate, dar chiar dacă echipa lui Greenwald și Banaji are dreptate, IAT-ul rasial nu este încă gata pentru aplicații practice. Și problemele IAT-ului nu se opresc aici.

Dacă îl repeți mai obții același rezultat?

Pentru ca un instrument de măsurare să fie folositor este foarte important ca rezultatele pe care le dă să fie la fel și a doua oară. Pentru că n-am inspirație, o să ilustrez asta cu exemplele pe care le-a dat Jesse Singal.17 Un instrument de măsurare foarte bun e o ruletă. Dacă îți măsori înălțimea azi și o mai măsori o dată mâine (sau peste o lună), o să obții aproximativ același rezultat. Dacă, în schimb, încerci să îți măsori înălțimea folosind cuburi de gheață proaspăt scoase din congelator, sunt slabe șanse ca a doua oară să mai obții aceeași înălțime. Măsurarea înălțimii în număr de cuburi de gheață nu este un instrument bun.

În psihologie (și în alte domenii) există o procedură care se numește stabilitatea/fiabilitatea la retestare (sau procedura testare-retestare) și măsoară într-un mod mai formal cât de bine se potrivesc rezultatele originale cu cele de la retestate (sau re-măsurare). Dacă stabilitatea e 1 înseamnă că valorile conicid perfect. Dacă e zero înseamnă că nu e nicio legătură între ele (sunt la întâmplare).

În general pentru ca un test să fie folositor se consideră că trebuie să aibă stabilitate la retestare de peste 0,7 (asta ar însemna că rezultatele sunt la fel în cel puțin 49% din cazuri). Această valoare e doar o convenție și unii autori acceptă și valori mai mici. Ca să ne facem o idee ne putem uita la niște teste folosite în psihologie.

Unul dintre cele mai utile instrumente pentru măsurarea personalității este BigFive-ul. Diverse studii au găsit că stabilitatea la retestare, în medie, este de 0,81-0,84 după două săptămâni, 0,76-0,83 după patru și între 0,62 și 0,70 după trei ani (timp în care personalitatea se mai poate schimba).30 Unul dintre cele mai folosite instrumente pentru a măsura inteligența este Wechsler Adult Intelligence Scale (WAIS). Stabilitatea la retestare pare să fie în medie între 0,85 și 0,90 dacă sunt combinate estimări foarte variate (perioada de la testare la retestare a variat în studii de la o săptămână la 13 ani).31

O scară pentru măsurarea depresiei (Beck Depression Inventory) are o stabilitate de 0,86 la două săptămâni într-o populație cu boala Parkinson.32 Chiar și testul Rorschach (celebrul test cu petele de cerneală) pare să aibă o stabilitate acceptabilă la retestare: 0,70 după șase luni.33

Cât de bine se descurcă IAT-ul? Nu prea bine. IAT-ul general are o stabilitate de 0,54, iar cel rasial are chiar mai puțin (0,44) pe o perioadă de 1-2 luni, în timp ce măsurile explicite (adică dacă oamenii sunt întrebați direct) au o performanță mai bună (0,75).34,35 O valoare de 0,44 înseamnă că rezultatele de la prima testare influențează doar 19,4% din rezultatele de la a doua testare, ceea ce e foarte puțin.

IAT. Corelație 0,44.PNG
Fig. 6: Cât de mult sunt corelate rezultatele de la prima testare cu cele de la retestare după 1-2 luni. Sursa: adaptare după R Psychologist.

Care este legătura dintre scorul IAT și realitate?

După cum am văzut, IAT-ul rasial nu are stabilitate la retestare suficient de mare să fie practic, dar și dacă ar avea nu ar fi destul: trebuie să aibă și validitate. Există mai multe tipuri de validitate, dar cea mai importantă este cea conceptuală (sau de construct). Un test are validitate conceptuală dacă măsoară ceea ce afirmă că măsoară. Un exemplu foarte simplu este ruleta. Producătorii ruletelor afirmă că ruletele măsoară lungimea și putem verifica ușor asta pentru că lungimea este o noțiune pe care o înțelegem intuitiv, iar folosirea ruletei este directă și o putem compara cu alte instrumente de măsurare.

Dar în loc de ruletă să ne imaginăm că avem un aparat complicat pe care îl îndreptăm spre un obiect și care ne dă înapoi un număr. Cum știm că acel aparat a măsurat lungimea obiectului și nu greutatea lui? A, o să spuneți, măsurăm și cu ruleta și vedem dacă corespunde! Într-adevăr, așa e simplu. Dar dacă nu există nicio ruletă și niciun alt obiect de măsurare a lungimii? Și, mai mult de atât, rezultatele pe care le dă aparatul dacă măsurăm de mai multe ori se potrivesc doar câteodată.

Cam în această situație e IAT-ul: produce un număr pe baza altor numere (timpi de răspuns), iar dacă e repetat de aceeași persoană sunt mai multe șanse să dea un alt rezultat decât același (am experimentat chiar eu acest lucru când l-am încercat de patru ori). Iar cum e interpretat acel număr ține de preferințele arbitrare ale celor care au creat testul. Ce vreau să spun prin asta? Creatorii testului au ales fără nicio justificare valoarea de 0,65 ca prag peste care oamenilor li se spune că au „o puternică preferință automată pentru albi față de negri”. Cineva ar putea spune că cel mai simplu mod de a scădea prejudecățile rasiale implicite este să ridicăm acest prag. Dacă punem pragul la 0,90 nu mai avem atât de mulți oameni cu prejudecăți, nu? Pare absurd, dar ceva asemănător s-a întâmplat deja. Până în 2002, procentul celor care se încadrau la „o puternică preferință pentru albi” era de 48%, iar din 2002 a devenit 27%. Ce s-a întâmplat? Ceva foarte simplu: autorii au schimbat criteriile de notare.38 Ce îi oprește să le mai schimbe o dată mâine?

Studiile care afirmă că demonstrează validitatea conceptuală se împiedică în diverse greșeli, ceea ce îi face pe unii cercetători să afirme că IAT-ul nu are validitate conceptuală și nu e clar ce măsoară: prejudecăți implicite sau doar prejudecăți explicite dar mai prost decât un simplu chestionar?36,37 Bineînțeles, apărătorii testului nu sunt de acord,39 dar în cel mai bun caz putem spune că nu există un consens în legătură cu validitatea conceptuală a testului asocierilor implicite.

Dacă la toate aceste probleme mai punem și faptul că pentru o persoană care face testul IAT rasial, legătura între scorul obținut și comportamentul discriminatoriu este cel mult trivială, validitatea nu arată prea bine. Ca să folosesc un exemplu de-al lui Blanton: să ne imaginăm că în loc de un om cu scor mic la IAT-ul rasial care se comportă discriminatoriu am avea un om care insistă că e curajos, dar se comportă ca un laș. „N-ai spune că e curajos în mod explicit, dar laș în mod implicit. Ai spune că e laș”.40

Având în vedere toate problemele IAT-ului, Blanton îl compară cu un test de pe Facebook care îți spune ce prințesă Disney ești, „doar că ăla are ceva date de marketing în spate”.46

Apropo, un astfel de test chiar există și puteți să-l faceți aici. Mi-e mi-a ieșit că sunt Jasmine din Aladdin.

IAT. Disney Princess
Fig. 7: Ce prințesă Disney ești? Sursa: Brainfall.

Pot fi reduse prejudecățile implicite?

La început am menționat că unele universități, companii sau departamente de poliție au programe de educare pentru a combate prejudecățile implicite. Funcționează? Știind că legătura dintre scorul la IAT-ul rasial și comportamentul discriminatoriu este trivială, ar fi surprinzător dacă un program care încearcă să schimbe prejudecățile implicite ar avea un efect asupra comportamentului, dar să vedem ce spun studiile.

Primul studiu care a arătat că prejudecățile implicite pot fi modificare a fost un studiu de-al lui Greenwald din 2001 care a inclus două experimente. Aceste experimente au arătat că dacă participanților le sunt arătate poze cu persoane negre admirabile, preferința lor automată pentru albi scade.41 Ca multe studii din acea perioadă, și acesta are probleme ce țin de numărul mic de participanți (48+26) sau de p-hacking, ceea ce face rezultatele puțin credibile.5

În 2010, Brian Nosek a făcut o replicare mult mai mare, cu 4.600 de participanți și a găsit un efect de zece ori mai mic față de original (0,08 versus 0,82 în original).42 Acest efect e prea mic pentru a avea o semnificație practică, iar autorii menționează în concluzii că ar fi chiar surprinzător dacă o intervenție de câteva minute ar avea un efect asupra atitudinilor acumulate de o persoană de-a lungul vieții.

În 2016, o echipă din care a făcut parte și Nosek a făcut două studii pre-înregistrate cu un total de 6.300 de participanți. Au fost testate nouă intervenții pentru a schimba preferințele implicite. Deși imediat după aplicarea intervențiilor preferințele rasiale implicite au fost reduse, efectul n-a mai fost vizibil după câteva ore sau câteva zile.43 Cu alte cuvinte, intervențiile au fost degeaba.

Iar în 2019, o sinteză sistematică pre-înregistrată (unde, din nou, Nosek e printre autori) a analizat toate studiile care au evaluat astfel de intervenții. Rezultatele au fost la fel de dezamăgitoare: deși unele schimbări limitate sunt posibile în ce privește prejudecățile implicite, ele nu se reflectă în schimbări ale prejudecățile explicite, iar comportamentul e schimbat doar într-un mod trivial (adică nu are relevanță practică).29 De asemenea, o altă sinteză sistematică făcută de cercetători fără legătură cu promotorii sau criticii IAT-ului conformă că lipsesc datele care să arate că aceste intervenții sunt utile.44

Ținând cont de aceste rezultate, până și creatorii testului spun acum că programele de educare pentru reducerea prejudecăților implicite sunt inutile. Mă rog, mai puțin Banaji.

Brian Nosek a criticat pe Twitter decizia luată de Starbucks de a arunca bani pe astfel de programe pentru care nu există dovezi că ar funcționa, iar Anthony Greenwald într-un interviu a spus că „nu există justificare științifică pentru utilitatea acestor tehnici”.40

În schimb, Mahzarin Banaji confinuă să ofere astfel de programe7 și zice că ele nu funcționează doar în cazul în care oamenii sunt obligați să participe la ele. Dacă participă în mod voluntar, iar cea care face trainingul se pricepe (îl face interesant și captivant), atunci pot foarte bine să funcționeze. Astfel de declarații mă fac să cred că Banaji e într-o stare de negare și că nimic nu o poate face să-și schimbe părerea. Atitudinea nu e deloc potrivită pentru un cercetător. Și asta ne aduce la ultima parte din articol.

Cum răspund apărătorii testului dincolo de dezbaterea științifică?

Creatorilor testului nu le place deloc când oamenii au îndoieli în legătură cu utilitatea IAT-ului rasial. De exemplu, când o jurnalistă, Olivia Goldhill, a vrut să scrie un articol despre IAT, Greenwald în mod explicit a descurajat-o pentru că „dezbaterile despre interpretarea științifică își au locul în jurnale științifice, nu în presa populară” și toți trei au refuzat să vorbească cu ea la telefon, preferând să îi răspundă doar prin email.40

Probabil cea mai neprietenoasă atitudine o are Mahzarin Banaji. Într-o discuție pe care a avut-o cu un alt jurnalist (tot prin email), i-a asemănat pe cei care au dubii despre IAT cu cei care neagă încălzirea globală, iar despre (criticul) Blanton a zis că e convinsă că el „crede că salvează umanitatea de pericolele IAT-ului”.46 Când un alt jurnalist i-a scris să o întrebe despre anumite critici care au fost aduse IAT-ului, Banaji a răspuns într-un mod care mie îmi sună arogant:

Ca regulă, operez pe principiul că trebuie să fiu atentă la criticile REALE ale IAT-ului. Criticile care vin de la oameni care sunt experți – adică oameni care înțeleg presupunerile științei despre măsurile latenței la răspuns. Oameni care fac muncă originală cu aceste metode. Îmi pare rău să zic asta, dar suntem toți atât de departe în munca noastră că eu cel puțin citesc doar critici de la oameni care sunt experți. Nu citesc comentarii de la non-experți. Sunt atât de multe lucruri interesante de făcut și prea mulți oameni minunați care fac asta pentru mine pentru a justifica să îmi fac griji pentru un mic grup de indivizi mâhniți care cred că negrilor le e ușor în societatea americană

Dar fetișul cu relațiile rasiale albi-negri la unii oameni este ceva la care știința nu va putea răspunde pentru că nu pare să fie despre dovezi. Vor trebui să se ocupe singuri [de fetiș] în prezența unui psihoterapeut sau a liderilor religioși.17

Aveți dubii legate de IAT? Banaji nu se coboară la nivelul ăsta să discute cu voi chiar dacă sunteți jurnaliști (pe de altă parte dacă vreți să scrieți un articol în care să lăudați IAT-ul, vorbește cu cea mai mare plăcere). Sunteți critici față de IAT? Știe Banaji de ce sunteți critici: pentru că sunteți niște rasiști mâhniți cu probleme mentale. Cel puțin eu asta înțeleg din declarațiile ei. De ce să recomande cuiva care e critic față de IAT să își vadă de fetiș în prezența psihoterapeutului? Afirmațiile sunt complet nepotrivite și ar fi trebuit să-și ceară scuze pentru ele.

Pe lângă că obișnuiesc să fie ostili cu cei care exprimă dubii, creatorii testului sunt și neclari când comunică la ce e bun. Am menționat deja la început că în cartea Blindspot (2013) au scris foarte clar că rezultatul IAT-ului rasial prezice comportamentul discriminatoriu. Apoi în 2015, într-un articol științific au cedat și au zis că testul nu poate fi folosit pentru a afla cine e probabil să aibă comportament discriminatoriu. Dar în 2017 au revenit la vechile afirmații. Într-un interviu, Greenwald spunea așa: „IAT-ul poate fi folosit pentru a selecta oamenii care ar fi mai puțin predispuși decât alții să manifeste comportament discriminatoriu”.40 Pare că una spun în literatura științifică și alta când vorbesc cu publicul larg.

Nosek și Greenwald insistă însă că nu există nicio contradicție pentru că în acel articol științific au zis că IAT-ul nu e util ca instrument de diagnosticare și că de fapt e util pentru „a da feedback” (Nosek). „Nu privim IAT-ul ca diagnosticând ceva ce inevitabil rezultă în comportament rasist sau cu prejudecăți”46 (Greenwald). Aceste explicații mi se par nerezonabile pentru că nu e clar ce se califică drept diagnostic și ce e doar feedback. Nosek a fost întrebat pe Twitter în ce sens e util acel feedback și n-a răspuns, iar pe Greenwald l-am citat mai sus spunând că testul e util pentru a selecta persoane (în categorii). Care e diferența dintre a selecta și a diagnostica în acest caz? Putem face o comparație cu scara lui Hamilton, despre care Hamilton a zis că n-ar trebui folosită pentru diagnosticare, dar care este folosită de facto în majoritatea studiilor clinice care evaluează efectul antidepresivelor.47 Când cercetătorii folosesc scorul pe scara lui Hamilton pentru a selecta participanții în grupuri (cu/fără depresie), îi diagnostichează sau doar îi selectează? Eu aș zice că îi diagnostichează. La fel, când publicul larg aude că IAT-ul rasial ne poate selecta în persoane mai probabil să fie discriminatorii și mai puțin probabil să fie, ce înțelege? Distincția între a selecta și a diagnostica mi se pare forțată, iar efectul ei e un public confuz.

Iar până la apariția articolelor lui Jesse Singal și Olivia Goldhill în 2017 care au scos în evidență contradicția, site-ul Proiectului Implicit (unde se poate face și testul) informa vizitatorii că scorul la IAT-ul rasial prezice comportamentul (ex.: „când [persoanele cu preferințe automate către albi] își relaxează eforturile active, aceste persoane fără prejudecăți e probabil să manifeste discriminare în gânduri sau comportament”) sau că dacă există diferențe între atitudinile implicite și cele explicite, sunt mai de încredere cele implicite pentru că ele nu pot fi ascunse, cum se întâmplă cu cele explicite (Project Implicit, FAQ, #13 și #16, versiunea arhivată în 2017). În versiunea curentă, afirmațiile sunt mai moderate, dar timp de aproape 20 de ani au oferit informații greșite publicului. De asemenea, înainte de a face testul, ni se prezintă un text mai lung care spune și că „universitățile și cercetătorii care au contribuit la acest site nu fac nico afirmație în legătură cu validitatea acestor interpetări sugerate”.

Ce să înțeleagă publicul din aceste afirmații contradictorii? Exact ce am văzut că înțelege: IAT-ul e bun pentru a descoperi rasismul implicit, rasismul implicit duce la comportament rasist, iar educarea împotriva prejudecăților implicite reduce rasismul. Singura problemă e că acest mesaj e fals.

Concluzii

În acest articol am văzut că IAT-ul e prezentat de cele mai multe ori pozitiv către public, ca și cum ar putea descoperi și combate rasismul, deși nu poate face aceste lucruri. Știința din spatele testului e complicată și nu confirmă încă utilitatea sa. Există două grupuri de cercetători care au avut o dezbatere în literatura științifică de vreo 15 ani și s-au contrazis constant. Testului îi lipsesc lucruri esențiale precum puterea de a prezice comportamentul rasist într-un mod relevant în lumea reală, validitatea (nu știm exact ce măsoară) și stabilitatea la retestare (sunt mari șanse să dea rezultate diferite dacă aceeași persoană îl face de mai multe ori). De asemenea, nu există motive științifice să credem că programele care promit reducerea prejudecăților implicite au un efect real.

Recomandări:

Există trei articole din 2017 care tratează IAT-ul pe larg și din care am citat în mod repetat. Două sunt scrise de jurnaliști și unul de către criticii testului. Toate sunt foarte bune.

Jesse Singal (2017). Psychology’s Favorite Tool for Measuring Racism Isn’t Up to the Job. Almost two decades after its introduction, the implicit association test has failed to deliver on its lofty promises. The Cut.

Olivia Goldhill (2017). The world is relying on a flawed psychological test to fight racism. Quartz.

Mitchell, G., & Tetlock, P. E. (2017). Popularity as a poor proxy for utility: The Case of Implicit Prejudice. In Lilienfeld, S. O., & Waldman, I. D. (Eds.). (2017). Psychological science under scrutiny: Recent challenges and proposed solutions. John Wiley & Sons, Cap. 10, pg. 164.

Referințe:

1: Gladwell, M. (2005). Blink: The power of thinking without thinking. Back Bay Books. Cap. 3: The Warren Harding Error: Why We Fall For Tall, Dark, and Handsome Men.

2: Mitchell, G., & Tetlock, P. E. (2017). Popularity as a poor proxy for utility: The Case of Implicit Prejudice. In Lilienfeld, S. O., & Waldman, I. D. (Eds.). (2017). Psychological science under scrutiny: Recent challenges and proposed solutions. John Wiley & Sons, Cap. 10, pg. 164.

3: Vedantam, S. (2010). The Hidden Brain: How our unconscious minds elect presidents, control markets, wage wars, and save our lives. Random House Digital, Inc. Cap. 9: Disarming the Bomb: Politics, Race and the Hidden Brain.

4: Banaji, M. R., & Greenwald, A. G. (2013). Blindspot: Hidden biases of good people. Bantam. Cap. 3: Into the Blindspot.

5: Schimmack, U (2018). Implicit Racism, Starbucks, and the Failure of Experimental Social Psychology. Replication Index.

6: Kirwan Institute for the Study of Race and Ethnicity (2017). State of the Science: Implicit Bias Review 2017. The Ohio State University.

7: Candice Wang (2020). Can implicit bias training help cops overcome racism?. Popular Science.

8: Blanton, H., & Jaccard, J. (2008). Unconscious racism: A concept in pursuit of a measure. Annu. Rev. Sociol, 34, 277-297.

9: Schimmack, U (2018). The Implicit Association Test in a Social Psychology Textbook. Science or Propaganda? Replication Index.

10: Greenwald, A. G., McGhee, D. E., & Schwartz, J. L. (1998). Measuring individual differences in implicit cognition: the implicit association test. Journal of personality and social psychology, 74(6), 1464.

11: Noorden, R. V., Maher, B., & Nuzzo, R. (2014). The top 100 papers: Nature explores the most-cited research of all time. Nature News.

12: McConnell, A. R., & Leibold, J. M. (2001). Relations among the Implicit Association Test, discriminatory behavior, and explicit measures of racial attitudes. Journal of experimental Social psychology, 37(5), 435-442.

13: Blanton, H., Jaccard, J., Klick, J., Mellers, B., Mitchell, G., & Tetlock, P. E. (2009). Strong claims and weak evidence: Reassessing the predictive validity of the IAT. Journal of applied Psychology, 94(3), 567.

14: McConnell, A. R., & Leibold, J. M. (2009). Weak criticisms and selective evidence: Reply to Blanton et al.(2009). Journal of Applied Psychology, Vol. 94, No. 3, 583–589.

15: Blanton, H., Jaccard, J., Klick, J., Mellers, B., Mitchell, G., & Tetlock, P. E. (2009). Transparency should trump trust: Rejoinder to McConnell and Leibold (2009) and Ziegert and Hanges (2009). Journal of Applied Psychology, Vol. 94, No. 3, 598-603.

16: Hussey, I., & De Houwer, J. (2018). Completing a Race IAT increases implicit racial bias. PsyArXiv Preprints.

17: Jesse Singal (2017). Psychology’s Favorite Tool for Measuring Racism Isn’t Up to the Job. Almost two decades after its introduction, the implicit association test has failed to deliver on its lofty promises. The Cut.

18: Nosek, B. A., Aarts, A. A., Anderson, J. E., Kappes, H. B., & Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716-aac4716.

19: Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-positive psychology: Undisclosed flexibility in data collection and analysis allows presenting anything as significant. Psychological science, 22(11), 1359-1366.

20: Klein, R. A., Ratliff, K. A., Vianello, M., Adams Jr, R. B., Bahník, Š., Bernstein, M. J., … & Cemalcilar, Z. (2014). Investigating variation in replicability: A “Many Labs” Replication Project. Social Psychology, 45(3), 142-152.

21: Klein, R. A., Vianello, M., Hasselman, F., Adams, B. G., Adams Jr, R. B., Alper, S., … & Batra, R. (2018). Many Labs 2: Investigating variation in replicability across samples and settings. Advances in Methods and Practices in Psychological Science, 1(4), 443-490.

22: Lindsay, D. S. (2015). Replication in psychological science. Psychological Science, Vol. 26, Issue 12, pg. 1827-1832.

23: Greenwald, A. G., Poehlman, T. A., Uhlmann, E., & Banaji, M. R. (2009). Understanding and using the Implicit Association Test: III. Meta-analysis of predictive validity. Journal of Personality and Social Psychology, 97, 17–41.

24: Oswald, F. L., Mitchell, G., Blanton, H., Jaccard, J., & Tetlock, P. E. (2013). Predicting ethnic and racial discrimination: A meta-analysis of IAT criterion studies. Journal of Personality and Social Psychology, 105, 171–192. http://dx.doi.org/10.1037/a0032734.

25: Greenwald, A. G., Banaji, M. R., & Nosek, B. A. (2015). Statistically small effects of the Implicit Association Test can have societally large effects. Journal of Personality and Social Psychology, 108, 553–561. http://dx.doi.org/10.1037/pspa0000016.

26: Oswald, F. L., Mitchell, G., Blanton, H., Jaccard, J., & Tetlock, P. E. (2015). Using the IAT to predict ethnic and racial discrimination: small effect sizes of unknown societal significance. Journal of personality and social psychology, 108(4), 562–571. https://doi.org/10.1037/pspa0000023.

27: Carlsson, R., & Agerström, J. (2016). A closer look at the discrimination outcomes in the IAT literature. Scandinavian journal of psychology, 57(4), 278-287.

28: Kurdi, B., Seitchik, A. E., Axt, J. R., Carroll, T. J., Karapetyan, A., Kaushik, N., … & Banaji, M. R. (2019). Relationship between the Implicit Association Test and intergroup behavior: A meta-analysis. American psychologist, 74(5), 569.

29: Forscher, P. S., Lai, C. K., Axt, J. R., Ebersole, C. R., Herman, M., Devine, P. G., & Nosek, B. A. (2019). A meta-analysis of procedures to change implicit measures. Journal of personality and social psychology, 117(3), 522.

30: Gnambs, T. (2014). A meta-analysis of dependability coefficients (test–retest reliabilities) for measures of the Big Five. Journal of Research in Personality, 52, 20-28.

31: Matarazzo, J. D., Carmody, T. P., & Jacobs, L. D. (1980). Test-retest reliability and stability of the WAIS: A literature review with implications for clinical practice. Journal of Clinical and Experimental Neuropsychology, 2(2), 89-105. [Sci-Hub]

32: Huang, S. L., Hsieh, C. L., Wu, R. M., & Lu, W. S. (2017). Test-retest reliability and minimal detectable change of the Beck Depression Inventory and the Taiwan Geriatric Depression Scale in patients with Parkinson’s disease. PLoS One, 12(9).

33: McGrath, R. E., & Carroll, E. J. (2012). The current status of „projective” „tests”. In H. Cooper, P. M. Camic, D. L. Long, A. T. Panter, D. Rindskopf, & K. J. Sher (Eds.), APA handbooks in psychology®. APA handbook of research methods in psychology, Vol. 1. Foundations, planning, measures, and psychometrics (p. 329–348). American Psychological Association. [Sci-Hub]

34: Gawronski, B. (2019). Six lessons for a cogent science of implicit bias and its criticism. Perspectives on Psychological Science, 14(4), 574-595.

35: Gawronski, B., Morrison, M., Phills, C. E., & Galdi, S. (2017). Temporal stability of implicit and explicit measures: A longitudinal analysis. Personality and Social Psychology Bulletin, 43(3), 300-312.

36: Schimmack, U. (2019). The implicit association test: a method in search of a construct. Perspectives on Psychological Science, doi:10.1177/1745691619863798.

37: Schimmack, U (2019). The race IAT: A Case Study of The Validity Crisis in Psychology. Replication Index.

38: Blanton, H., & Jaccard, J. (2008). Unconscious racism: A concept in pursuit of a measure. Annu. Rev. Sociol, 34, 277-297.

39: Kurdi, B., Ratliff, K. A., & Cunningham, W. A. (2020). Can the Implicit Association Test serve as a valid measure of automatic cognition? A response to Schimmack (2020). Perspectives on Psychological Science, 1745691620904080.

40: Olivia Goldhill (2017). The world is relying on a flawed psychological test to fight racism. Quartz.

41: Dasgupta, N., & Greenwald, A. G. (2001). On the malleability of automatic attitudes: combating automatic prejudice with images of admired and disliked individuals. Journal of personality and social psychology, 81(5), 800.

42: Joy-Gaba, J. A., & Nosek, B. A. (2010). The surprisingly limited malleability of implicit racial evaluations. Social Psychology; Vol. 41(3):137–146, DOI: 10.1027/1864-9335/a000020.

43: Lai, C. K., Skinner, A. L., Cooley, E., Murrar, S., Brauer, M., Devos, T., … & Simon, S. (2016). Reducing implicit racial preferences: II. Intervention effectiveness across time. Journal of Experimental Psychology: General, 145(8), 1001.

44: FitzGerald, C., Martin, A., Berner, D., & Hurst, S. (2019). Interventions designed to reduce implicit prejudices and implicit stereotypes in real world contexts: a systematic review. BMC Psychology, 7(1), 29.

45: Axt, J. R., Ebersole, C. R., & Nosek, B. A. (2016). An unintentional, robust, and replicable pro-Black bias in social judgment. Social Cognition, 34(1), 1-39.

46: Tom Bartlett (2017). Can We Really Measure Implicit Bias? Maybe Not. The Chronicle of Higher Education.

47: Cipriani, A., Furukawa, A. T., Salanti, G., Chaimani, A., & Atkinson, Z. L. (2018). Comparative efficacy and acceptability of 21 antidepressant drugs for the acute treatment of adults with major depressive disorder: A systematic review and network meta-analysis. Lancet 391: 1357-66.

48: Tello, N., Harika-Germaneau, G., Serra, W., Jaafari, N., & Chatard, A. (2020). Forecasting a fatal decision: Direct replication of the predictive validity of the Suicide–Implicit Association Test. Psychological science, 31(1), 65-74.

49: Kidwell, M. C., Lazarević, L. B., Baranski, E., Hardwicke, T. E., Piechowski, S., Falkenberg, L. S., … & Nosek, B. (2016). Badges to acknowledge open practices: A simple, low-cost, effective method for increasing transparency. PLoS biology, 14(5), e1002456.

3 gânduri despre &8222;Testul asocierilor implicite: Suntem cu toții rasiști fără să știm?&8221;

  1. Foarte interesant articol și efortul de documentare care stă la baza lui.
    Dacă mi se permite totuși o observație pe care o consider importantă. Autorul folosește frecvent (inclusiv în finalul concluziilor) termenul „prejudiciu” în loc de prejudecată sau preconcepție. Cuvântul englez „prejudice” se traduce prin românescul „prejudecată” sau „preconcepție” (prejudiciu semnificând dauna, pierdere materială).
    Pentru claritatea a aceea ce se dorește a se transmite, mai ales că este vorba de un articol de știință, o corectură ar fi necesară.

    1. Nici nu mi-a trecut prin minte că prejudiciu nu e traducerea corectă. Am modificat acum să fie prejudecată peste tot. Mulțumesc pentru observație.

    2. Inițial am ezitat să fac această observație dar articolul chiar mi s-a părut interesant și am considerat că va avea numai de câștigat dacă totuși o fac.
      Mă bucur că intenția mea a fost înțeleasă. ☺️
      Aștept cu curiozitate următorul articol. 🙂

Lasă un comentariu

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.