Testul asocierilor implicite: Suntem cu toții rasiști fără să știm?

Sumar. Testul asocierilor implicite, varianta rasială, este văzut de publicul larg și promovat de unii cercetători ca un instrument prin care fiecare poate descoperi cât de rasist este în mod implicit și cum o să se comporte față de persoane de alte rase sau etnii. Cercetarea, în schimb, nu justifică folosirea testului. Dacă ne uităm la toate studiile și le analizăm riguros, puterea de predicție a testului este prea mică pentru a avea relevanță practică; dacă o persoană face testul a doua oară sunt mari șanse să obțină un alt rezultat; și nu există dovezi concludente că tehnicile de reducere a prejudecăților implicite chiar funcționează.

Conținut

Înainte de toate

Ce este testul asocierilor implicite?

Unde e promovat și folosit?

În cărți de psihologie populară

În presă

În companii, universități, poliție…

În alte locuri

Ce spune cercetarea? La ce e bun acest test?

Primele studii

Poate prezice acest test comportamentul discriminatoriu?

Dacă îl repeți mai obții același rezultat?

Care este legătura dintre scorul IAT și realitate?

Pot fi reduse prejudecățile implicite?

Cum răspund apărătorii testului dincolo de dezbaterea științifică?

Concluzii

Înainte de toate

Înainte să intrăm în detalii vreau să clarific niște lucruri care vor fi importante pe parcursul acestui articol. Primul este că există mai multe tipuri de IAT, dar aici o să mă ocup în mod explicit de IAT-ul rasial (pe care o să-l descriu imediat). Pentru simplitate în acest articol folosesc termenii „IAT” și „IAT rasial” interschimbabil. Dacă nu menționez explicit că mă refer la alt IAT, trebuie să presupuneți că mă refer la IAT-ul rasial.

Analizele, datele și concluziile pe care le prezint în acest articol se referă strict la IAT-ul rasial, iar alte forme de IAT s-ar putea să aibă alte caracteristici. Ba chiar o să dau un exemplu concret: IAT-ul suicidal este un test IAT folosit pentru a detecta încercările de sinucidere. Acest test are date robuste care arată că este util pentru a prezice (într-o anumită măsură) cine e mai probabil să încerce să se sinucidă.48

Al doilea lucru este că existența rasismului și utilitatea IAT-ului rasial sunt două lucruri independente. Dacă IAT-ul rasial se dovedește a nu fi util nu înseamnă că rasismul nu există. Contestarea IAT-ul rasial nu este un act de rasism, ba din contră! Dacă IAT-ul rasial are probleme serioase care nu sunt cunoscute, s-ar putea chiar să îngreuneze combaterea rasismului. A lupta contra rasismului prin metode ineficiente e echivalent cu a lupta contra cancerului folosind homeopatia. Iar persoanele care explică de ce homeopatia este o opțiune proastă nu sunt pro-cancer, ci anti-cancer.

Politica, ideologia sau credințele personale nu ar trebui să aibă niciun rol în determinarea răspunsurilor la întrebări științifice, chiar dacă rezultatele nu sunt cele dorite. Nu ar trebui să fie nevoie să spun asta, dar simt că este.

Ce este testul asocierilor implicite?

Testul asocierilor implicite (Implicit Association Test, IAT) este un test inventat în 1998 care încearcă să descopere asocierile pe care le facem între concepte fără să fim conștienți de ele. IAT-ul rasial este cel pe care o să ne concentrăm în acest articol pentru că despre acesta se spune că ne poate arăta prejudecățile noastre implicite și dacă ne comportăm într-un mod discriminatoriu fără să știm. Puteți face acest test foarte ușor, din fața calculatorului în aproximativ 5 minute. Trebuie să mergeți la următorul link și să selectați Rasă (TAI ’Albi-Negri’):

implicit.harvard.edu

Inițial vi se cere să răspundeți la niște întrebări care o să fie folositoare cercetătorilor când vor să analizeze datele pentru studii (puteți să săriți peste ele). Ce trebuie să faceți e să apăsați e (pentru stânga) sau i (pentru dreapta) în funcție de categoria din care face parte elementul afișat. La început o să fie ușor, o să trebuiască să apăsați i dacă apare o față albă și e dacă apare una neagră.

IAT. Test 1.PNG

Apoi trebuie să faceți același lucru pentru cuvinte bune sau rele. La al treilea set se complică un pic lucrurile. Acum trebuie să alegeți e pentru fețe albe sau cuvinte rele și i pentru fețe negre sau cuvinte bune.

IAT. Test 3.PNG

Apoi urmează o serie în care trebuie să alegeți doar între fețe albe și negre, dar de data asta pozițiile sunt inversate (negri la stânga, albi la dreapta), iar în ultima serie o să alegeți între fețe albe sau cuvinte bune și fețe negre sau cuvinte rele. Ordinea secvențelor poate fi diferită (adică s-ar putea să fie întâi secvența cu fețe albe sau cuvinte bune și apoi secvența cu fețe albe sau cuvinte rele).

IAT. Test 5.PNG

Ideea din spatele testului este că dacă în subconștient avem o preferință automată pentru albi, o să răspundem mai repede și cu mai puține greșeli atunci când avem de asociat fețele albe cu cuvinte bune sau fețele negre cu cuvinte rele. Și invers, o să răspundem mai încet și cu mai multe greșeli când avem de asociat fețele albe cu cuvinte rele și fețele negre cu cuvinte bune. Diferențele în timpul de răspuns sunt transformate de un algoritm într-un număr. În funcție de cât de mare este numărul, o să fim puși într-o categorie sau alta.

După ce am scris acest articol (minus această secțiune de descriere a testului) am făcut testul IAT de patru ori (înainte de asta nu l-am făcut niciodată). Am obținut de fiecare dată alt rezultat (în această ordine): preferință puternică pentru albi, preferință moderată pentru albi, preferință ușoară (poate inexistentă) pentru albi și preferință moderată pentru negri. Ultimul rezultat arată așa:

IAT. Rez.PNG

Testul a fost creat și dezvoltat până la varianta în care este azi în principal de trei cercetători: Anthony Greenwald, Mahzarin Banaji și Brian Nosek.

IAT. Greenwald, Banaji, Nosek
Fig. 1: Creatorii testului: Anthony Greenwald, Mahzarin Bananji și Brian Nosek.

Dintre cei trei, Brian Nosek a devenit mult mai cunoscut (printre cercetători) pentru implicarea sa în îmbunătățirea felului în care e făcută știința. De exemplu, în 2013 a fondat Center for Open Science, a condus mai multe proiecte de replicare (inclusiv replicarea a 100 de experimente din psihologie18) sau a promovat practici care să îmbunătățească transparența din știință (ex.: insignele de preînregistrare49 sau principiile TOP). Nosek a avut un rol principal în revoluția care a început în psihologie în ultimul deceniu. Mă declar fanul său, dar asta bineînțeles nu înseamnă că sunt de acord cu tot ce zice.

Unde e promovat și folosit?

Testul asocierilor implicite (IAT) a devenit foarte popular de-a lungul timpului, în special în ultimii ani. El este prezentat în cărți de psihologie populară sau în presă aproape exclusiv în mod pozitiv, iar unele organizații sau companii îl recomandă sau chiar îl fac obligatoriu pentru angajații lor în încercarea de a combate rasismul. În secțiunile următoare o să ne uităm în detaliu la cât de justificată este imaginea testului, dar înainte de asta aș vrea să dau niște exemple care ne arată cum e văzut testul de către cea mai mare parte a populației.

În cărți de psihologie populară

O să încep cu cărțile pentru că îmi place să citesc, iar în trecut obișnuiam să citesc multe cărți de psihologie populară.

Una dintre cele mai de succes este Blink (2005) de Malcolm Gladwell, iar capitolul 3 este dedicat în mare parte IAT-ului. După ce explică în ce constă testul și își încurajează cititorii să-l facă, Gladwell spune că rezultatul „este un puternic mod de predicție despre cum ne comportăm în anumite situații spontane” și că dacă avem un scor care indică o tendință pro-albi o să afecteze cum ne comportăm în prezența negrilor. De asemenea, Gladwell dă exemple ipotetice despre cum prejudecățile implicite influențează deciziile de angajare.1 Iar în aparițiile sale publice, a susținut că prejudecata implicită este de vină pentru un caz concret în care o persoană de culoare a fost împușcată de un polițist alb.2

N-am fost mare fan al lui Gladwell, dar în schimb am fost fascinat de cartea The Hidden Brain (2010) de Shankar Vedantam. Erau atât de multe exemple despre cum preferințele sau tendințele noastre subconșitente ne pot face să greșim încât era ca și cum descopeream o lume ascunsă. Și toate afirmațiile păreau susținute de studii. În apărarea mea, era o vreme de dinainte de criza replicării și orice rezultat părea plauzibil. În prezent nu aș mai fi fascinat de o astfel de carte. În capitolul 9, Vedantam prezintă testul asocierilor implicite într-un mod pozitiv. Ne spune, de exemplu, că „în ultimul deceniu, multe experimente au arătat că rezultatele la Testul Asocierilor Implicite prezic comportamentul oamenilor în lumea reală” sau că Mahzarin Banaji i-a spus că s-a simțit rușinată când l-a făcut prima dată și a aflat rezultatele. Banaji, Greenwald și Nosek „au creat o hartă a Americii care arată vârfurile și văile prejudecății, locurile în care prejudecățile rasiale inconștiente sunt cele mai mari și unde sunt cele mai mici”.3

Dar cartea care a promovat cel mai mult IAT-ul este chiar cea scrisă de doi dintre creatorii testului (Greenwald și Banaji). Se numește Blindspot, e din 2013, iar în capitolul 3 sunt mai multe afirmații din care se înțelege clar că testul este util pentru descoperirea prejudecăților rasiale și că este susținut de o știință solidă:

Nici noi și nici alții nu făcuseră studii care să determine dacă cei cu scorurile cele mai înalte la preferința pentru albi la IAT-ul rasial sunt și cel mai probabil cei cu un comportament discriminatoriu rasial. Dar situația s-a schimbat. Datorită acumulării rapide de cercetare care folosește IAT-ul rasial în ultimul deceniu, două descoperiri importante sunt acum demonstrate. În primul rând, știm acum că preferința automată pentru albi este universală în societatea americană – aproximativ 75% dintre cei care fac IAT-ul rasial în studii pe internet sau în laborator dezvăluie preferințe automate pentru albi.

În al doilea rând, preferința automată pentru albi exprimată în IAT-ul rasial este acum dovedită ca arătând comportament discriminatoriu. Prezice comportament discriminatoriu chiar și printre participanții care cu toată seriozitatea (și, credem noi, sinceritatea) îmbrățișează credințe egalitare. Această ultimă afirmație poate părea că se contrazice, dar este un adevăr empiric. Printre participanții care se descriu ca egalitarieni din punct de vedere rasial, IAT-ul rasial, s-a arătat cu încredere și repetat, că prezice comportamentul discriminatoriu care a fost observat în cercetare.4

Cred că acestea sunt niște afirmații care nu lasă urmă de îndoială în legătură cu ce cred autorii: IAT-ul rasial este știință consacrată, adevăr empiric și prezice comportamentul discriminatoriu. O să vedem mai târziu că acest mesaj pentru public diferă destul de mult de cel pentru alți cercetători.

În presă

Cei mai mulți oameni își iau informațiile din articole de presă, așa că hai să vedem ce fel de informații găsim aici. E probabil imposibil de făcut o analiză sistematică, dar în căutările mele nu am găsit decât foarte rar articole critice față de IAT. De-a lungul timpului limbajul a devenit mai moderat (în general), dar a rămas predominant pozitiv. Chiar creatorii testului au dat interviuri la televizor, la radio, în presă și au ținut (și țin în continuare) prezentări la companii în care leagă rezultatele la IAT de comportamentul discriminatoriu.2

După publicarea primului studiu în care a fost folosit IAT-ul rasial, în 1998, declarația de presă făcută de Universitatea din Washington a avut titlul: „Rădăcinile prejudecății inconșitente îi afectează pe 90-95% dintre oameni, psihologii demonstrează la conferința de presă”. Mai recent, în 2009, The Guardian recomanda oamenilor să facă testul pentru a afla dacă au prejudecăți rasiale. În 2017, după ce un afro-american de 32 de ani a fost ucis de un polițist, Huffington Post publica un articol care spunea în titlu că nu polițistul l-a ucis, ci prejudecata implicită.

Și mai aproape de prezent, în iunie 2020, pe fundalul protestelor din SUA, IAT-ul este prezentat uneori ca dovadă pentru rasism. Pe site-ul radioului KQED (parte din rețeaua NPR), testul este descris ca un instrument făcut pentru „a expune prejudecățile rasiale subconștiente care se ascund sub suprafețe de altfel anti-rasiste”, iar cei care vor să fie aliați Black Lives Matter sunt încurajați să îl facă. Autoarea povestește cum prima dată când a făcut testul n-a obținut rezultatele dorite și de atunci s-a preocupat foarte mult de problemele de inegalitate rasială, iar acum l-a făcut din nou și i-au ieșit rezultate bune (o să vedem mai târziu că șansa de a obține rezultate complet diferite a doua oară, mai ales după multă vreme, este destul de mare chiar și fără nicio schimbare reală).

Mai multe site-uri de presă au prezentat ca senzațional un studiu care a folosit datele de la Proiectul Implicit și care a arătat că trei din patru persoane au prejudecăți implicite negative față de australienii indigeni. Studiul pare impresionant la prima vedere: 11.000 de participanți și date colectate timp de 10 ani. Iar pe baza rezultatelor, autorii de la Universitatea Națională Australiană afirmă că aceste prejudecăți implicite observate la testul IAT sunt „probabil cauza rasismului pe care mulți aborigieni îl resimt”. Însă pentru ca studiul să ne spună ceva util e necesar ca IAT-ul să fie valid. O să vedem mai târziu că nu este.

În companii, universități, poliție…

Pentru că testul e promovat ca un instrument care poate descoperi pejudicii ascunse și poate prezice viitorul comportament discriminatoriu, multe instituții și companii au ales, deloc surpinzător, să apeleze la programe de training pentru prejudecăți implicite, programe care de cele mai multe ori includ și teste IAT (există și altele despre care se spune că pot descoperi prejudecăți inconștiente, dar nu sunt deloc atât de populare).

În 2018, un administrator a sunat la poliție pentru că două persoane de culoare stăteau în Starbucks fără să comande nimic. Gestul său a creat un scandal în mass-media, iar Starbucks pentru a potoli acuzațiile de rasism a anunțat că toți angajații săi vor fi obligați să facă training contra prejudecăților implicite.5 Starbucks nu e singură. Facebook, de exemplu, oferă un program pentru administrarea prejudecăților implicite care conține testul IAT „care le permite oamenilor să își descopere propriile prejudecăți”.

Southern Poverty Law Center, o organizație nonprofit specializată pe lupta împotriva „hate groups”, recomandă IAT-ul pe site-ul său tolerance.org pentru că le poate arăta oamenilor ce „prejudecăți negative” au. Institutul Kirwan pentru studierea rasei și etnicității a produs anual sinteze ale cercetării legate de prejudecățile implicite. Cea mai recentă, din 2017, afirmă că există cercetare considerabilă care documenteză efectele în lumea reală pe care le au prejudecățile implicite de-a lungul societății.6

Multe universități de peste tot din lume recomandă sau obligă angajații să participe la module de educare despre prejudecățile inconștiente. La fel și multe departamente de poliție, în special din Statele Unite, apelează la astfel de programe. Mahzarin Banaji, de exemplu, în 2019 s-a ocupat personal de educarea polițiștilor din Cambridge, Massachusetts. Cea mai populară companie care oferă astfel de programe este Fair and Impartial Policing, care a câștigat milioane de dolari în ultimii ani de la departamentele de poliție din New York, Austin, Los Angeles, Miami, Milwakee sau Minneapolis.7

În alte locuri

Înainte să trec la cercetare mai vreau să menționez că testul asocierilor implicite a încercat să pătrundă și în domeniul legal. Mai mulți cercetători, unii împreună cu creatorii testului, au sugerat schimbarea unor legi pentru a lua în considerare efectele inconștiente descoperite prin IAT. Astfel, au fost propuneri pentru ca judecătorii sau jurații să fie aleși în așa fel încât să fie evitate sau minimizate prejudecățile implicite sau ca testul IAT să fie unul dintre criteriile de angajare pentru a contracara discriminarea la locul de muncă.8

Și există și manuale de psihologie care prezintă IAT-ul într-un mod în totalitate pozitiv: dezvăluie „prejudecăți subtile, non-conștiente”, prezice comportamentul, iar studenții sunt încurajați să îl facă pentru a afla dacă au stereotipuri sau prejudecăți față de diverse grupuri. Un cercetător care a fost implicat în revoluția replicării numește astfel de afirmații „propagandă”.9

Ce spune cercetarea? La ce e bun acest test?

Dacă ne uităm în presă, cărți populare sau la practicile unor companii sau ale unor universități, imaginea e clară: testul asocierilor implicite funcționează pentru a ne arăta cât de rasiști suntem în mod implicit și cum o să ne comportăm în viitor. Dar dacă un lucru e popular nu înseamnă neapărat că e și corect.

Dacă ne uităm la cercetare, lucrurile stau altfel.

Primele studii

Acest test al asocierilor implicite a fost introdus prima dată în literatura științifică în 1998 când o echipă de psihologi condusă de Anthony Greenwald a publicat un articol în Journal of Personality and Social Psychology,10 un jurnal de top din domeniul psihologiei sociale (întâmplător, în același jurnal a publicat și Daryl Bem celebrul articol în care afirma că a demonstrat că există precogniție). Până în prezent, articolul lui Greenwald are 12.700 citări pe Google Scholar, ceea ce e foarte mult. Pentru comparație, în 2014 Nature a făcut un top al celor mai citate articole din știință (nu doar din psihologie). Principalul mod de notare a fost prin Web of Science, dar Google Scholar a fost prezentat ca alternativă.11 Ultimul articol din acea listă Google Scholar (nr. 100) avea 19.100 de citări, iar în prezent are 27.300. Așa că putem spune că articolul lui Greenwald, chiar dacă nu e de top 100, e cu siguranță influent.

Articolul a cuprins mai multe experimente, iar într-unul a fost folosit IAT-ul rasial.10 După standardele de azi, experimentul nu este deloc convingător pentru că a inclus doar 26 de participanți (14 studente și 12 studenți de la cursurile de psihologie). Nici celelalte experimente nu au fost mai impresionante, dar în acele vremuri de dinainte de criza replicării, metodologia slabă nu era o piedică în fața popularității ideilor, iar ideea că un test care poate fi făcut în câteva minute în fața calculatorului ne poate spune cât de rasiști suntem e foarte tentantă.

În anii 2000 au fost publicate multe articole care au avut ca subiect testul asocierilor implicite, iar un articol influent a fost publicat în 2001 și a arătat pentru prima dată că rezultatele IAT-ului prezic comportamente discriminatorii.12 Nici experimentul din acest articol nu a avut mulți participanți – doar 42. După mai mulți ani, când au început criticii să dea atenție subiectului asocierilor implicite, acest articol a fost reanalizat, iar reanaliza a arătat că datele originale nu arată o prejudecată pro-albi cum se credea inițial, ci o prejudecată pro-negri.13 Cum era de așteptat, autorii articolului original au răspuns și au contestat reanaliza,14 iar autorii reanalizei au contestat critica și și-au menținut concluziile.15 Și probabil pe urmă jurnalul i-a trimis să se certe în altă parte.

Printre autorii reanalizei se află cei trei principali critici ai testului asocierilor implicite: Philip E. Tetlock, Hart Blanton și Gregory Mitchell. Pe aceștia îi vom întâlni în dezbaterile care urmează. Practic lupta în literatura științifică s-a dus între creatorii testului (Greenwald, Banaji, Nosek) și acești trei critici (plus diverși co-autori).

IAT. Tetlock, Blanton, Mitchell.png
Fig. 2: Principalii critici ai testului: Philip E. Tetlock, Hart Blanton, Gregory Mitchell.

Cele două studii care au propulsat IAT-ul nu sunt impresionante, ba chiar unul dintre ele s-ar putea să aibă erori în interpretarea datelor, dar în condițiile în care există multe altele cum putem ști cât de util este IAT-ul?

Dacă ne uităm la studii individuale riscăm să nu vedem imaginea completă. De exemplu, pe lângă multe studii care arată utilitatea IAT-ului, există și studii care arată că dacă oamenii fac un test IAT rasial le crește prejudecata rasială implicită;16 sau că cei care au o preferință implicită pentru albi au un comportament care îi favorizează pe negri;45 sau că simplul fapt că participanților li se spune că un grup fictiv e oprimat, o să îi facă să aibă scoruri IAT mai mari; sau că preferința pentru explicațiile externe sau interne (ex.: „grupul este discriminat” vs. „grupul este mai puțin capabil”) poate inversa scorurile la IAT; sau că persoanele cu un proces cognitiv mai lent au avut scoruri mai mari la IAT. Blanton a zis că aceste rezultate pot de exemplu să îi facă automat pe cei mai bătrâni să pară mai afectați de prejudecăți implicite decât cei mai tineri sau pe cei care fac integrame sau joacă jocuri video să pară mai puțin afectați decât cei care nu fac asta.17

De asemenea, din criza replicării18,19,20,21 am aflat că studiile individuale pot foarte ușor să aibă rezultate greșite care poate sunt obținute prin tehnici chestionabile de cercetare sau sunt doar un artefact statistic (rezultate fals-pozitive), iar când cineva le repetă nu știm dacă o să mai obțină același rezultat sau nu.

Soluția la aceste probleme este complexă, dar ideal ar fi ca studiile individuale să fie pre-înregistrate,22 adică autorii să publice un protocol în care să descrie cum o să facă experimentele și cum o să analizeze datele și abia apoi să facă experimentele (iar după ce le-au făcut, să publice rezultatele cum au promis în protocol). Am vrut să văd dacă există vreun studiu pre-înregistrat relevant pentru legătura dintre IAT-ul rasial și comportamentul discriminatoriu, așa că am căutat pe Curate Science, dar nu am găsit nimic. M-am uitat și pe paginile lui Brian Nosek și nici acolo nu am găsit aproape nimic (Brian Nosek e unul dintre creatorii testului și în același timp unul dintre cei care au evidențiat criza replicării). Am găsit niște sinteze sistematice pre-înregistrate (pe care o să le menționez mai târziu) și un studiu despre schimbarea preferințelor implicite care n-a găsit rezultate pozitive (și pe acesta o să îl menționez mai târziu).

Un alt lucru important e să existe analize care iau în considerare toate studiile: sinteze sistematice. Există câteva astfel de analize și, după cum era de așteptat, sunt un motiv de contradicție între promotorii și criticii testului. Ca să clarificăm utilitatea IAT-ului trebuie să intrăm în mai multe detalii.

Poate prezice acest test comportamentul discriminatoriu?

Prima sinteză a studiilor despre IAT a fost făcută în 2009 de promotorii testului (Greenwald, Bananji și alți colegi) și a avut concluzii pozitive.23 Cam așa sună o parte dintre concluzii (într-un limbaj tehnic):

Această sinteză justifică recomandarea de a folosi IAT-ul și măsurile auto-raportate împreună ca predictori ai comportamentului. […] Sinteza a arătat că pentru subiecte sensibile din punct de vedere social validitatea predictivă a măsurilor auto-raportate a fost remarcabil de scăzută și validitatea incrementală a IAT-ului a fost relativ ridicată. […] În aceste domenii [inclusiv comportamentul rasial], validitatea predictivă a măsurilor IAT a depășit în mod semnificativ validitatea predictivă a măsurilor auto-raportate.

Dacă traducem într-un limbaj mai accesibil, autorii spun că rezultatele IAT-ului sunt utile pentru a prezice cum se comportă albii față de negri și că IAT-ul e chiar mai bun decât dacă i-am întreba direct pe oameni ce atitudini au. O astfel de concluzie justifică, într-adevăr, folosirea IAT-ului pentru a descoperi cât de rasiști suntem fiecare.

Problema este că o astfel de concluzie exagerează rezultatele sintezei. Este important să știm că IAT-ul poate prezice comportamentul, dar este la fel de important să știm și cât de mult. Prezice 90% din comportament? 50%? 1%? Acest „cât de mult” e măsurat în psihologie prin ceva ce se numește „mărimea efectului”. În acest caz, Greenwald și Bananji au găsit un efect de 0,236. Acum dacă nu sunteți obișnuiți cu cercetarea din psihologie o să întrebați ce înseamnă numărul ăsta. Dacă sunteți obișnuiți o să întrebați cum a fost calculat și la ce se referă.

Valoarea este o corelație între scorul la IAT-ul rasial și comportamentul discriminatoriu și este o valoare foarte mică. Valoarea ne spune că doar în jur de 5,8% din comportamentul discriminatoriu este explicat de scorul IAT-ului rasial.

IAT. Greenwald corelație 2
Fig. 3: Conform creatorilor testului, scorul la IAT-ul rasial explică mai puțin de 5,8% din comportamentul discriminatoriu. Sursa: adaptare după R Psychologist.

Puteți obține această valoare (și graficul fără text) dacă mergeți pe R Psychologist la secțiunea de corelații și alegeți valoarea 0,24 (cea mai apropiată de 0,236). Și tot acolo mai găsiți un grafic util. Punctele sunt generate aleator automat pentru a corespunde cu corelația aleasă, așa că n-o să vedeți exact graficul de mai jos. Am pus niște detalii pentru a fi mai ușor de înțeles. Fiecare punct reprezintă o persoană ipotetică. Cu cât deviază mai mult de la axa de 45° care unește colțul din stânga-jos cu cel din dreapta-sus (nu cea desenată), cu atât discrepanța între scorul IAT și comportament e mai mare. Cei peste axă discriminează mai mult decât indică scorul, iar cei sub axă mai puțin și sunt acuzați pe nedrept că ar fi rasiști dacă ne luăm după ce spune IAT-ul.

IAT. Greenwald corelație 1.PNG
Fig. 4: O posibilă distribuție care corespunde cu corelația de 0,24 găsită de Greenwald și Banaji. Punctele roșii și punctul verde sunt în original pe grafic, doar că nu erau colorate. Sursa: adaptare după R Psychologist.

Dacă ne uităm cum arată testul aplicat în lumea reală laborator, n-avem de ce să fim entuziasmați pentru că puterea sa de predicție este foarte mică. Iar asta e cea mai optimistă evaluare, făcută de creatorii testului.

În 2013, criticii (printre care Tetlock, Blanton și Mitchell) au făcut propria sinteză sistematică și au obținut rezultate mai proaste pentru IAT, iar argumentele lor sunt convingătoare.24

De exemplu, când Greenwald și Banaji au pus toate studiile împreună, nu au ținut cont de direcția efectului. Știu că sună tehnic, dar e de fapt simplu de înțeles. Să zicem că avem două studii cu participanți albi. În primul, scorul mare la IAT-ul rasial este strâns legat de (adică prezice) comportamentul discriminatoriu față de negri. În al doilea, scorul mare este strâns legat de (prezice) comportamentul discriminatoriu față de albi, nu față de negri. Aceste două rezultate sunt contradictorii, dar Greenwald și Banaji le-au tratat ca și când ar fi același lucru. Tetlock și colegii săi, în schimb, le-au considerat cum trebuie considerate: contradictorii.24

O problemă și mai mare în sinteza lui Greenwad și Banaji este că au fost puse la grămadă studii care preziceau comportamentul cu studii care preziceau altceva. De exemplu, studii care arătau o legătură între scorul IAT și niște scanări cerebrale. Deși poate fi interesant pentru cercetători să găsească o astfel de legătură, ea nu are nicio relevanță practică pentru că nu știm cum să legăm activitatea în anumite zone din creier cu diverse comportamente. Și chiar dacă am ști, tot ar fi discutabil cât de relevant mai e dacă am corelat întâi scorul IAT cu activitatea în anumite zone din creier și apoi activitatea în acele zone cu anumite comportamente. Prin urmare, Tetlock și colegii au făcut analize separate: una în care au măsurat legătura dintre IAT și activitatea cerebrală și alta în care au măsurat legătura dintre IAT și comportament.24 Iar pentru legătura dintre IAT și comportament au găsit o corelație și mai mică decât Greenwald & Banaji: doar 0,149. Dacă mergem din nou pe R Psychologist și punem valoarea 0,15 (cea mai apropiată de 0,149) vedem că această corelație ne spune că de fapt scorul la IAT-ul rasial explică cel mult 2,3% din comportamentul discriminatoriu.

IAT. Oswald. Corelație
Fig. 5: Conform criticilor, scorul la IAT-ul rasial explică în jur de de 2,3% din comportamentul discriminatoriu. Sursa: adaptare după R Psychologist.

După 2 ani, în 2015, creatorii testului (de data asta toți trei: Greenwald, Banaji și Nosek) au publicat un articol în care au răspuns la sinteza criticilor. Deși au găsit niște detalii cu care n-au fost de acord, au fost nevoiți să cedeze în fața datelor și au scris următoarele lucruri:25

Măsurile IAT au două proprietăți care fac problematică folosirea lor pentru a clasifica persoanele ca probabile în a se angrena în comportamente discriminatorii. Aceste două proprietăți sunt stabilitatea la retestare […] și mărimea efectului mică-spre-moderată pentru validitatea predictivă. Încercările de a folosi aceste măsuri pentru diagnosticarea indivizilor riscă, prin urmare, rate indezirabil de mari de clasificări eronate.

În traducere: testul IAT nu e util pentru a afla dacă o persoană e rasistă sau discriminează.

Totuși, autorii insistă că deși testul IAT nu ne poate spune nimic despre persoana care îl face, el ne poate arăta nivelul de prejudecată la nivel de societate.25 Această afirmație este ciudată. După cum remarcă Blanton: „Dacă sunt dispus să le dau la 100 de copii un test IQ, dar nu sunt dispus să spun ce înseamnă scorul unui copil individual, cum pot să spun pe urmă că 75% dintre ei sunt genii sau că au probleme de dezvoltare?”.17 Cred că are mult mai mult sens ce spune Blanton decât ce spun creatorii testului. Criticii (inclusiv Blanton) au contestat această interpretare într-un alt articol științific. Din punctul lor de vedere, concluziile potrivite ar fi că scorul IAT nu este un bun predictor al discriminării rasiale și etnice, iar semnificația sa la nivel de societate este necunoscută.26

În 2016, doi cercetători norvegieni fără legătură cu promotorii sau cu criticii testului au publicat o sinteză sistematică independentă care a confirmat rezultatele criticilor și au recomandat împotriva oricărei aplicații practice a IAT-ului rasial.27

În 2019, promotorii (Greenwald și Banaji și alți colegi de-ai lor) au publicat o altă sinteză sistematică, de data asta care a inclus de șase ori mai mulți participanți (36 de mii) și au găsit rezultate asemănătoare (corelație de 0,14), dar au analizat datele în mai multe feluri și au descoperit că un un grup de studii cu anumite caracteristici pot da o corelație mai mare (0,37). Prin urmare, au făcut niște recomandări pentru cercetarea viitoare.28

Pe de altă parte, o altă sinteză sistematică la care a participat Brian Nosek (dar nu și Banaji sau Greenwald) a investigat cât de mult pot fi schimbate prejudecățile implicite și menționează în trecere că a fost găsită o corelație de doar 0,09 între scorurile IAT-ului rasial și comportament.29 Această corelație corespunde cu o putere a scorului IAT de a explica doar 0,8% din comportamentul discriminatoriu. Avantajul acestei sinteze este că a fost pre-înregistrată, adică autorii au publicat un protocol în care au descris cum o să facă analizele și cum o să selecteze studiile și abia apoi le-au făcut. Pre-înregistrarea reduce gradul de libertate pe care îl au cercetătorii când văd rezultatele, astfel că dacă nu le convin nu mai pot să caute alte moduri de a analiza datele.

Personal prefer studiile pre-înregistrate, dar chiar dacă echipa lui Greenwald și Banaji are dreptate, IAT-ul rasial nu este încă gata pentru aplicații practice. Și problemele IAT-ului nu se opresc aici.

Dacă îl repeți mai obții același rezultat?

Pentru ca un instrument de măsurare să fie folositor este foarte important ca rezultatele pe care le dă să fie la fel și a doua oară. Pentru că n-am inspirație, o să ilustrez asta cu exemplele pe care le-a dat Jesse Singal.17 Un instrument de măsurare foarte bun e o ruletă. Dacă îți măsori înălțimea azi și o mai măsori o dată mâine (sau peste o lună), o să obții aproximativ același rezultat. Dacă, în schimb, încerci să îți măsori înălțimea folosind cuburi de gheață proaspăt scoase din congelator, sunt slabe șanse ca a doua oară să mai obții aceeași înălțime. Măsurarea înălțimii în număr de cuburi de gheață nu este un instrument bun.

În psihologie (și în alte domenii) există o procedură care se numește stabilitatea/fiabilitatea la retestare (sau procedura testare-retestare) și măsoară într-un mod mai formal cât de bine se potrivesc rezultatele originale cu cele de la retestate (sau re-măsurare). Dacă stabilitatea e 1 înseamnă că valorile conicid perfect. Dacă e zero înseamnă că nu e nicio legătură între ele (sunt la întâmplare).

În general pentru ca un test să fie folositor se consideră că trebuie să aibă stabilitate la retestare de peste 0,7 (asta ar însemna că rezultatele sunt la fel în cel puțin 49% din cazuri). Această valoare e doar o convenție și unii autori acceptă și valori mai mici. Ca să ne facem o idee ne putem uita la niște teste folosite în psihologie.

Unul dintre cele mai utile instrumente pentru măsurarea personalității este BigFive-ul. Diverse studii au găsit că stabilitatea la retestare, în medie, este de 0,81-0,84 după două săptămâni, 0,76-0,83 după patru și între 0,62 și 0,70 după trei ani (timp în care personalitatea se mai poate schimba).30 Unul dintre cele mai folosite instrumente pentru a măsura inteligența este Wechsler Adult Intelligence Scale (WAIS). Stabilitatea la retestare pare să fie în medie între 0,85 și 0,90 dacă sunt combinate estimări foarte variate (perioada de la testare la retestare a variat în studii de la o săptămână la 13 ani).31

O scară pentru măsurarea depresiei (Beck Depression Inventory) are o stabilitate de 0,86 la două săptămâni într-o populație cu boala Parkinson.32 Chiar și testul Rorschach (celebrul test cu petele de cerneală) pare să aibă o stabilitate acceptabilă la retestare: 0,70 după șase luni.33

Cât de bine se descurcă IAT-ul? Nu prea bine. IAT-ul general are o stabilitate de 0,54, iar cel rasial are chiar mai puțin (0,44) pe o perioadă de 1-2 luni, în timp ce măsurile explicite (adică dacă oamenii sunt întrebați direct) au o performanță mai bună (0,75).34,35 O valoare de 0,44 înseamnă că rezultatele de la prima testare influențează doar 19,4% din rezultatele de la a doua testare, ceea ce e foarte puțin.

IAT. Corelație 0,44.PNG
Fig. 6: Cât de mult sunt corelate rezultatele de la prima testare cu cele de la retestare după 1-2 luni. Sursa: adaptare după R Psychologist.

Care este legătura dintre scorul IAT și realitate?

După cum am văzut, IAT-ul rasial nu are stabilitate la retestare suficient de mare să fie practic, dar și dacă ar avea nu ar fi destul: trebuie să aibă și validitate. Există mai multe tipuri de validitate, dar cea mai importantă este cea conceptuală (sau de construct). Un test are validitate conceptuală dacă măsoară ceea ce afirmă că măsoară. Un exemplu foarte simplu este ruleta. Producătorii ruletelor afirmă că ruletele măsoară lungimea și putem verifica ușor asta pentru că lungimea este o noțiune pe care o înțelegem intuitiv, iar folosirea ruletei este directă și o putem compara cu alte instrumente de măsurare.

Dar în loc de ruletă să ne imaginăm că avem un aparat complicat pe care îl îndreptăm spre un obiect și care ne dă înapoi un număr. Cum știm că acel aparat a măsurat lungimea obiectului și nu greutatea lui? A, o să spuneți, măsurăm și cu ruleta și vedem dacă corespunde! Într-adevăr, așa e simplu. Dar dacă nu există nicio ruletă și niciun alt obiect de măsurare a lungimii? Și, mai mult de atât, rezultatele pe care le dă aparatul dacă măsurăm de mai multe ori se potrivesc doar câteodată.

Cam în această situație e IAT-ul: produce un număr pe baza altor numere (timpi de răspuns), iar dacă e repetat de aceeași persoană sunt mai multe șanse să dea un alt rezultat decât același (am experimentat chiar eu acest lucru când l-am încercat de patru ori). Iar cum e interpretat acel număr ține de preferințele arbitrare ale celor care au creat testul. Ce vreau să spun prin asta? Creatorii testului au ales fără nicio justificare valoarea de 0,65 ca prag peste care oamenilor li se spune că au „o puternică preferință automată pentru albi față de negri”. Cineva ar putea spune că cel mai simplu mod de a scădea prejudecățile rasiale implicite este să ridicăm acest prag. Dacă punem pragul la 0,90 nu mai avem atât de mulți oameni cu prejudecăți, nu? Pare absurd, dar ceva asemănător s-a întâmplat deja. Până în 2002, procentul celor care se încadrau la „o puternică preferință pentru albi” era de 48%, iar din 2002 a devenit 27%. Ce s-a întâmplat? Ceva foarte simplu: autorii au schimbat criteriile de notare.38 Ce îi oprește să le mai schimbe o dată mâine?

Studiile care afirmă că demonstrează validitatea conceptuală se împiedică în diverse greșeli, ceea ce îi face pe unii cercetători să afirme că IAT-ul nu are validitate conceptuală și nu e clar ce măsoară: prejudecăți implicite sau doar prejudecăți explicite dar mai prost decât un simplu chestionar?36,37 Bineînțeles, apărătorii testului nu sunt de acord,39 dar în cel mai bun caz putem spune că nu există un consens în legătură cu validitatea conceptuală a testului asocierilor implicite.

Dacă la toate aceste probleme mai punem și faptul că pentru o persoană care face testul IAT rasial, legătura între scorul obținut și comportamentul discriminatoriu este cel mult trivială, validitatea nu arată prea bine. Ca să folosesc un exemplu de-al lui Blanton: să ne imaginăm că în loc de un om cu scor mic la IAT-ul rasial care se comportă discriminatoriu am avea un om care insistă că e curajos, dar se comportă ca un laș. „N-ai spune că e curajos în mod explicit, dar laș în mod implicit. Ai spune că e laș”.40

Având în vedere toate problemele IAT-ului, Blanton îl compară cu un test de pe Facebook care îți spune ce prințesă Disney ești, „doar că ăla are ceva date de marketing în spate”.46

Apropo, un astfel de test chiar există și puteți să-l faceți aici. Mi-e mi-a ieșit că sunt Jasmine din Aladdin.

IAT. Disney Princess
Fig. 7: Ce prințesă Disney ești? Sursa: Brainfall.

Pot fi reduse prejudecățile implicite?

La început am menționat că unele universități, companii sau departamente de poliție au programe de educare pentru a combate prejudecățile implicite. Funcționează? Știind că legătura dintre scorul la IAT-ul rasial și comportamentul discriminatoriu este trivială, ar fi surprinzător dacă un program care încearcă să schimbe prejudecățile implicite ar avea un efect asupra comportamentului, dar să vedem ce spun studiile.

Primul studiu care a arătat că prejudecățile implicite pot fi modificare a fost un studiu de-al lui Greenwald din 2001 care a inclus două experimente. Aceste experimente au arătat că dacă participanților le sunt arătate poze cu persoane negre admirabile, preferința lor automată pentru albi scade.41 Ca multe studii din acea perioadă, și acesta are probleme ce țin de numărul mic de participanți (48+26) sau de p-hacking, ceea ce face rezultatele puțin credibile.5

În 2010, Brian Nosek a făcut o replicare mult mai mare, cu 4.600 de participanți și a găsit un efect de zece ori mai mic față de original (0,08 versus 0,82 în original).42 Acest efect e prea mic pentru a avea o semnificație practică, iar autorii menționează în concluzii că ar fi chiar surprinzător dacă o intervenție de câteva minute ar avea un efect asupra atitudinilor acumulate de o persoană de-a lungul vieții.

În 2016, o echipă din care a făcut parte și Nosek a făcut două studii pre-înregistrate cu un total de 6.300 de participanți. Au fost testate nouă intervenții pentru a schimba preferințele implicite. Deși imediat după aplicarea intervențiilor preferințele rasiale implicite au fost reduse, efectul n-a mai fost vizibil după câteva ore sau câteva zile.43 Cu alte cuvinte, intervențiile au fost degeaba.

Iar în 2019, o sinteză sistematică pre-înregistrată (unde, din nou, Nosek e printre autori) a analizat toate studiile care au evaluat astfel de intervenții. Rezultatele au fost la fel de dezamăgitoare: deși unele schimbări limitate sunt posibile în ce privește prejudecățile implicite, ele nu se reflectă în schimbări ale prejudecățile explicite, iar comportamentul e schimbat doar într-un mod trivial (adică nu are relevanță practică).29 De asemenea, o altă sinteză sistematică făcută de cercetători fără legătură cu promotorii sau criticii IAT-ului conformă că lipsesc datele care să arate că aceste intervenții sunt utile.44

Ținând cont de aceste rezultate, până și creatorii testului spun acum că programele de educare pentru reducerea prejudecăților implicite sunt inutile. Mă rog, mai puțin Banaji.

Brian Nosek a criticat pe Twitter decizia luată de Starbucks de a arunca bani pe astfel de programe pentru care nu există dovezi că ar funcționa, iar Anthony Greenwald într-un interviu a spus că „nu există justificare științifică pentru utilitatea acestor tehnici”.40

În schimb, Mahzarin Banaji confinuă să ofere astfel de programe7 și zice că ele nu funcționează doar în cazul în care oamenii sunt obligați să participe la ele. Dacă participă în mod voluntar, iar cea care face trainingul se pricepe (îl face interesant și captivant), atunci pot foarte bine să funcționeze. Astfel de declarații mă fac să cred că Banaji e într-o stare de negare și că nimic nu o poate face să-și schimbe părerea. Atitudinea nu e deloc potrivită pentru un cercetător. Și asta ne aduce la ultima parte din articol.

Cum răspund apărătorii testului dincolo de dezbaterea științifică?

Creatorilor testului nu le place deloc când oamenii au îndoieli în legătură cu utilitatea IAT-ului rasial. De exemplu, când o jurnalistă, Olivia Goldhill, a vrut să scrie un articol despre IAT, Greenwald în mod explicit a descurajat-o pentru că „dezbaterile despre interpretarea științifică își au locul în jurnale științifice, nu în presa populară” și toți trei au refuzat să vorbească cu ea la telefon, preferând să îi răspundă doar prin email.40

Probabil cea mai neprietenoasă atitudine o are Mahzarin Banaji. Într-o discuție pe care a avut-o cu un alt jurnalist (tot prin email), i-a asemănat pe cei care au dubii despre IAT cu cei care neagă încălzirea globală, iar despre (criticul) Blanton a zis că e convinsă că el „crede că salvează umanitatea de pericolele IAT-ului”.46 Când un alt jurnalist i-a scris să o întrebe despre anumite critici care au fost aduse IAT-ului, Banaji a răspuns într-un mod care mie îmi sună arogant:

Ca regulă, operez pe principiul că trebuie să fiu atentă la criticile REALE ale IAT-ului. Criticile care vin de la oameni care sunt experți – adică oameni care înțeleg presupunerile științei despre măsurile latenței la răspuns. Oameni care fac muncă originală cu aceste metode. Îmi pare rău să zic asta, dar suntem toți atât de departe în munca noastră că eu cel puțin citesc doar critici de la oameni care sunt experți. Nu citesc comentarii de la non-experți. Sunt atât de multe lucruri interesante de făcut și prea mulți oameni minunați care fac asta pentru mine pentru a justifica să îmi fac griji pentru un mic grup de indivizi mâhniți care cred că negrilor le e ușor în societatea americană

Dar fetișul cu relațiile rasiale albi-negri la unii oameni este ceva la care știința nu va putea răspunde pentru că nu pare să fie despre dovezi. Vor trebui să se ocupe singuri [de fetiș] în prezența unui psihoterapeut sau a liderilor religioși.17

Aveți dubii legate de IAT? Banaji nu se coboară la nivelul ăsta să discute cu voi chiar dacă sunteți jurnaliști (pe de altă parte dacă vreți să scrieți un articol în care să lăudați IAT-ul, vorbește cu cea mai mare plăcere). Sunteți critici față de IAT? Știe Banaji de ce sunteți critici: pentru că sunteți niște rasiști mâhniți cu probleme mentale. Cel puțin eu asta înțeleg din declarațiile ei. De ce să recomande cuiva care e critic față de IAT să își vadă de fetiș în prezența psihoterapeutului? Afirmațiile sunt complet nepotrivite și ar fi trebuit să-și ceară scuze pentru ele.

Pe lângă că obișnuiesc să fie ostili cu cei care exprimă dubii, creatorii testului sunt și neclari când comunică la ce e bun. Am menționat deja la început că în cartea Blindspot (2013) au scris foarte clar că rezultatul IAT-ului rasial prezice comportamentul discriminatoriu. Apoi în 2015, într-un articol științific au cedat și au zis că testul nu poate fi folosit pentru a afla cine e probabil să aibă comportament discriminatoriu. Dar în 2017 au revenit la vechile afirmații. Într-un interviu, Greenwald spunea așa: „IAT-ul poate fi folosit pentru a selecta oamenii care ar fi mai puțin predispuși decât alții să manifeste comportament discriminatoriu”.40 Pare că una spun în literatura științifică și alta când vorbesc cu publicul larg.

Nosek și Greenwald insistă însă că nu există nicio contradicție pentru că în acel articol științific au zis că IAT-ul nu e util ca instrument de diagnosticare și că de fapt e util pentru „a da feedback” (Nosek). „Nu privim IAT-ul ca diagnosticând ceva ce inevitabil rezultă în comportament rasist sau cu prejudecăți”46 (Greenwald). Aceste explicații mi se par nerezonabile pentru că nu e clar ce se califică drept diagnostic și ce e doar feedback. Nosek a fost întrebat pe Twitter în ce sens e util acel feedback și n-a răspuns, iar pe Greenwald l-am citat mai sus spunând că testul e util pentru a selecta persoane (în categorii). Care e diferența dintre a selecta și a diagnostica în acest caz? Putem face o comparație cu scara lui Hamilton, despre care Hamilton a zis că n-ar trebui folosită pentru diagnosticare, dar care este folosită de facto în majoritatea studiilor clinice care evaluează efectul antidepresivelor.47 Când cercetătorii folosesc scorul pe scara lui Hamilton pentru a selecta participanții în grupuri (cu/fără depresie), îi diagnostichează sau doar îi selectează? Eu aș zice că îi diagnostichează. La fel, când publicul larg aude că IAT-ul rasial ne poate selecta în persoane mai probabil să fie discriminatorii și mai puțin probabil să fie, ce înțelege? Distincția între a selecta și a diagnostica mi se pare forțată, iar efectul ei e un public confuz.

Iar până la apariția articolelor lui Jesse Singal și Olivia Goldhill în 2017 care au scos în evidență contradicția, site-ul Proiectului Implicit (unde se poate face și testul) informa vizitatorii că scorul la IAT-ul rasial prezice comportamentul (ex.: „când [persoanele cu preferințe automate către albi] își relaxează eforturile active, aceste persoane fără prejudecăți e probabil să manifeste discriminare în gânduri sau comportament”) sau că dacă există diferențe între atitudinile implicite și cele explicite, sunt mai de încredere cele implicite pentru că ele nu pot fi ascunse, cum se întâmplă cu cele explicite (Project Implicit, FAQ, #13 și #16, versiunea arhivată în 2017). În versiunea curentă, afirmațiile sunt mai moderate, dar timp de aproape 20 de ani au oferit informații greșite publicului. De asemenea, înainte de a face testul, ni se prezintă un text mai lung care spune și că „universitățile și cercetătorii care au contribuit la acest site nu fac nico afirmație în legătură cu validitatea acestor interpetări sugerate”.

Ce să înțeleagă publicul din aceste afirmații contradictorii? Exact ce am văzut că înțelege: IAT-ul e bun pentru a descoperi rasismul implicit, rasismul implicit duce la comportament rasist, iar educarea împotriva prejudecăților implicite reduce rasismul. Singura problemă e că acest mesaj e fals.

Concluzii

În acest articol am văzut că IAT-ul e prezentat de cele mai multe ori pozitiv către public, ca și cum ar putea descoperi și combate rasismul, deși nu poate face aceste lucruri. Știința din spatele testului e complicată și nu confirmă încă utilitatea sa. Există două grupuri de cercetători care au avut o dezbatere în literatura științifică de vreo 15 ani și s-au contrazis constant. Testului îi lipsesc lucruri esențiale precum puterea de a prezice comportamentul rasist într-un mod relevant în lumea reală, validitatea (nu știm exact ce măsoară) și stabilitatea la retestare (sunt mari șanse să dea rezultate diferite dacă aceeași persoană îl face de mai multe ori). De asemenea, nu există motive științifice să credem că programele care promit reducerea prejudecăților implicite au un efect real.

Recomandări:

Există trei articole din 2017 care tratează IAT-ul pe larg și din care am citat în mod repetat. Două sunt scrise de jurnaliști și unul de către criticii testului. Toate sunt foarte bune.

Jesse Singal (2017). Psychology’s Favorite Tool for Measuring Racism Isn’t Up to the Job. Almost two decades after its introduction, the implicit association test has failed to deliver on its lofty promises. The Cut.

Olivia Goldhill (2017). The world is relying on a flawed psychological test to fight racism. Quartz.

Mitchell, G., & Tetlock, P. E. (2017). Popularity as a poor proxy for utility: The Case of Implicit Prejudice. In Lilienfeld, S. O., & Waldman, I. D. (Eds.). (2017). Psychological science under scrutiny: Recent challenges and proposed solutions. John Wiley & Sons, Cap. 10, pg. 164.

Referințe:

1: Gladwell, M. (2005). Blink: The power of thinking without thinking. Back Bay Books. Cap. 3: The Warren Harding Error: Why We Fall For Tall, Dark, and Handsome Men.

2: Mitchell, G., & Tetlock, P. E. (2017). Popularity as a poor proxy for utility: The Case of Implicit Prejudice. In Lilienfeld, S. O., & Waldman, I. D. (Eds.). (2017). Psychological science under scrutiny: Recent challenges and proposed solutions. John Wiley & Sons, Cap. 10, pg. 164.

3: Vedantam, S. (2010). The Hidden Brain: How our unconscious minds elect presidents, control markets, wage wars, and save our lives. Random House Digital, Inc. Cap. 9: Disarming the Bomb: Politics, Race and the Hidden Brain.

4: Banaji, M. R., & Greenwald, A. G. (2013). Blindspot: Hidden biases of good people. Bantam. Cap. 3: Into the Blindspot.

5: Schimmack, U (2018). Implicit Racism, Starbucks, and the Failure of Experimental Social Psychology. Replication Index.

6: Kirwan Institute for the Study of Race and Ethnicity (2017). State of the Science: Implicit Bias Review 2017. The Ohio State University.

7: Candice Wang (2020). Can implicit bias training help cops overcome racism?. Popular Science.

8: Blanton, H., & Jaccard, J. (2008). Unconscious racism: A concept in pursuit of a measure. Annu. Rev. Sociol, 34, 277-297.

9: Schimmack, U (2018). The Implicit Association Test in a Social Psychology Textbook. Science or Propaganda? Replication Index.

10: Greenwald, A. G., McGhee, D. E., & Schwartz, J. L. (1998). Measuring individual differences in implicit cognition: the implicit association test. Journal of personality and social psychology, 74(6), 1464.

11: Noorden, R. V., Maher, B., & Nuzzo, R. (2014). The top 100 papers: Nature explores the most-cited research of all time. Nature News.

12: McConnell, A. R., & Leibold, J. M. (2001). Relations among the Implicit Association Test, discriminatory behavior, and explicit measures of racial attitudes. Journal of experimental Social psychology, 37(5), 435-442.

13: Blanton, H., Jaccard, J., Klick, J., Mellers, B., Mitchell, G., & Tetlock, P. E. (2009). Strong claims and weak evidence: Reassessing the predictive validity of the IAT. Journal of applied Psychology, 94(3), 567.

14: McConnell, A. R., & Leibold, J. M. (2009). Weak criticisms and selective evidence: Reply to Blanton et al.(2009). Journal of Applied Psychology, Vol. 94, No. 3, 583–589.

15: Blanton, H., Jaccard, J., Klick, J., Mellers, B., Mitchell, G., & Tetlock, P. E. (2009). Transparency should trump trust: Rejoinder to McConnell and Leibold (2009) and Ziegert and Hanges (2009). Journal of Applied Psychology, Vol. 94, No. 3, 598-603.

16: Hussey, I., & De Houwer, J. (2018). Completing a Race IAT increases implicit racial bias. PsyArXiv Preprints.

17: Jesse Singal (2017). Psychology’s Favorite Tool for Measuring Racism Isn’t Up to the Job. Almost two decades after its introduction, the implicit association test has failed to deliver on its lofty promises. The Cut.

18: Nosek, B. A., Aarts, A. A., Anderson, J. E., Kappes, H. B., & Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716-aac4716.

19: Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-positive psychology: Undisclosed flexibility in data collection and analysis allows presenting anything as significant. Psychological science, 22(11), 1359-1366.

20: Klein, R. A., Ratliff, K. A., Vianello, M., Adams Jr, R. B., Bahník, Š., Bernstein, M. J., … & Cemalcilar, Z. (2014). Investigating variation in replicability: A “Many Labs” Replication Project. Social Psychology, 45(3), 142-152.

21: Klein, R. A., Vianello, M., Hasselman, F., Adams, B. G., Adams Jr, R. B., Alper, S., … & Batra, R. (2018). Many Labs 2: Investigating variation in replicability across samples and settings. Advances in Methods and Practices in Psychological Science, 1(4), 443-490.

22: Lindsay, D. S. (2015). Replication in psychological science. Psychological Science, Vol. 26, Issue 12, pg. 1827-1832.

23: Greenwald, A. G., Poehlman, T. A., Uhlmann, E., & Banaji, M. R. (2009). Understanding and using the Implicit Association Test: III. Meta-analysis of predictive validity. Journal of Personality and Social Psychology, 97, 17–41.

24: Oswald, F. L., Mitchell, G., Blanton, H., Jaccard, J., & Tetlock, P. E. (2013). Predicting ethnic and racial discrimination: A meta-analysis of IAT criterion studies. Journal of Personality and Social Psychology, 105, 171–192. http://dx.doi.org/10.1037/a0032734.

25: Greenwald, A. G., Banaji, M. R., & Nosek, B. A. (2015). Statistically small effects of the Implicit Association Test can have societally large effects. Journal of Personality and Social Psychology, 108, 553–561. http://dx.doi.org/10.1037/pspa0000016.

26: Oswald, F. L., Mitchell, G., Blanton, H., Jaccard, J., & Tetlock, P. E. (2015). Using the IAT to predict ethnic and racial discrimination: small effect sizes of unknown societal significance. Journal of personality and social psychology, 108(4), 562–571. https://doi.org/10.1037/pspa0000023.

27: Carlsson, R., & Agerström, J. (2016). A closer look at the discrimination outcomes in the IAT literature. Scandinavian journal of psychology, 57(4), 278-287.

28: Kurdi, B., Seitchik, A. E., Axt, J. R., Carroll, T. J., Karapetyan, A., Kaushik, N., … & Banaji, M. R. (2019). Relationship between the Implicit Association Test and intergroup behavior: A meta-analysis. American psychologist, 74(5), 569.

29: Forscher, P. S., Lai, C. K., Axt, J. R., Ebersole, C. R., Herman, M., Devine, P. G., & Nosek, B. A. (2019). A meta-analysis of procedures to change implicit measures. Journal of personality and social psychology, 117(3), 522.

30: Gnambs, T. (2014). A meta-analysis of dependability coefficients (test–retest reliabilities) for measures of the Big Five. Journal of Research in Personality, 52, 20-28.

31: Matarazzo, J. D., Carmody, T. P., & Jacobs, L. D. (1980). Test-retest reliability and stability of the WAIS: A literature review with implications for clinical practice. Journal of Clinical and Experimental Neuropsychology, 2(2), 89-105. [Sci-Hub]

32: Huang, S. L., Hsieh, C. L., Wu, R. M., & Lu, W. S. (2017). Test-retest reliability and minimal detectable change of the Beck Depression Inventory and the Taiwan Geriatric Depression Scale in patients with Parkinson’s disease. PLoS One, 12(9).

33: McGrath, R. E., & Carroll, E. J. (2012). The current status of „projective” „tests”. In H. Cooper, P. M. Camic, D. L. Long, A. T. Panter, D. Rindskopf, & K. J. Sher (Eds.), APA handbooks in psychology®. APA handbook of research methods in psychology, Vol. 1. Foundations, planning, measures, and psychometrics (p. 329–348). American Psychological Association. [Sci-Hub]

34: Gawronski, B. (2019). Six lessons for a cogent science of implicit bias and its criticism. Perspectives on Psychological Science, 14(4), 574-595.

35: Gawronski, B., Morrison, M., Phills, C. E., & Galdi, S. (2017). Temporal stability of implicit and explicit measures: A longitudinal analysis. Personality and Social Psychology Bulletin, 43(3), 300-312.

36: Schimmack, U. (2019). The implicit association test: a method in search of a construct. Perspectives on Psychological Science, doi:10.1177/1745691619863798.

37: Schimmack, U (2019). The race IAT: A Case Study of The Validity Crisis in Psychology. Replication Index.

38: Blanton, H., & Jaccard, J. (2008). Unconscious racism: A concept in pursuit of a measure. Annu. Rev. Sociol, 34, 277-297.

39: Kurdi, B., Ratliff, K. A., & Cunningham, W. A. (2020). Can the Implicit Association Test serve as a valid measure of automatic cognition? A response to Schimmack (2020). Perspectives on Psychological Science, 1745691620904080.

40: Olivia Goldhill (2017). The world is relying on a flawed psychological test to fight racism. Quartz.

41: Dasgupta, N., & Greenwald, A. G. (2001). On the malleability of automatic attitudes: combating automatic prejudice with images of admired and disliked individuals. Journal of personality and social psychology, 81(5), 800.

42: Joy-Gaba, J. A., & Nosek, B. A. (2010). The surprisingly limited malleability of implicit racial evaluations. Social Psychology; Vol. 41(3):137–146, DOI: 10.1027/1864-9335/a000020.

43: Lai, C. K., Skinner, A. L., Cooley, E., Murrar, S., Brauer, M., Devos, T., … & Simon, S. (2016). Reducing implicit racial preferences: II. Intervention effectiveness across time. Journal of Experimental Psychology: General, 145(8), 1001.

44: FitzGerald, C., Martin, A., Berner, D., & Hurst, S. (2019). Interventions designed to reduce implicit prejudices and implicit stereotypes in real world contexts: a systematic review. BMC Psychology, 7(1), 29.

45: Axt, J. R., Ebersole, C. R., & Nosek, B. A. (2016). An unintentional, robust, and replicable pro-Black bias in social judgment. Social Cognition, 34(1), 1-39.

46: Tom Bartlett (2017). Can We Really Measure Implicit Bias? Maybe Not. The Chronicle of Higher Education.

47: Cipriani, A., Furukawa, A. T., Salanti, G., Chaimani, A., & Atkinson, Z. L. (2018). Comparative efficacy and acceptability of 21 antidepressant drugs for the acute treatment of adults with major depressive disorder: A systematic review and network meta-analysis. Lancet 391: 1357-66.

48: Tello, N., Harika-Germaneau, G., Serra, W., Jaafari, N., & Chatard, A. (2020). Forecasting a fatal decision: Direct replication of the predictive validity of the Suicide–Implicit Association Test. Psychological science, 31(1), 65-74.

49: Kidwell, M. C., Lazarević, L. B., Baranski, E., Hardwicke, T. E., Piechowski, S., Falkenberg, L. S., … & Nosek, B. (2016). Badges to acknowledge open practices: A simple, low-cost, effective method for increasing transparency. PLoS biology, 14(5), e1002456.

Meta-știință II: Publicarea selectivă

În articolul trecut am discutat despre problemele din cercetare pornind de la un studiu celebru de-al lui John Ioannidis și concentrându-ne pe importanța replicării rezultatelor. O altă problemă la fel de mare sunt și erorile sistematice de publicare –publication bias–, la care o să ne uităm mai în detaliu în acest articol.

Cuprins

Publication bias

Medicină

Psihologie și științe sociale

Neuroștiință

Psihiatrie

Alte domenii

Exemple

Wishful seeing

Ego depletion

Reboxetina

Soluții

Detecție

Prevenție

Concluzii

 

Publication bias

În luna martie în 2006, șase voluntari au ajuns la un spital din Londra ca să participe la un studiu clinic. Era prima dată când un medicament numit TGN1412 era dat oamenilor și fiecare a primit câte 2.000£ pentru a participa. După o oră, cei șase au început să aibă dureri de cap și mușchi, să aibă temperatură ridicată și să uite temporar cine și unde sunt. În scurt timp toți aveau frisoane, pulsuri foarte mari și tensiune foarte scăzută. Apoi unul dintre ei a intrat în insuficiență respiratorie și plămânii i s-au umplut cu lichid. Altul a ajuns să aibă o tensiune foarte mică, n-a mai respirat și a fost dus inconștient la urgențe. N-a trecut nici o zi și toți aveau probleme de acest tip. Până la urmă, cu mari eforturi din partea medicilor, toți au scăpat cu viață.1

Întrebarea pe care și-a pus-o toată lumea a fost: putea fi anticipat acest dezastru? TGN1412 era un tratament experimental ce interacționa cu sistemul imunitar într-un mod puțin înțeles și greu de testat pe animale. Dar în acest caz exista o experiență cu o intervenție similară, doar că n-a fost publicată. Un cercetător a făcut un studiu pe o singură persoană înainte cu 10 ani, studiu în care a folosit un anticorp ce se ataşa de trei receptori, printre care şi CD28, cel de care se ataşa TGN1412. Şi participantului din acest studiu i s-a făcut rău, însă aceste rezultate n-au fost publicate. Cel care a condus experimentul s-a gândit că nu are rost să publice – până la urmă medicamentul testat n-a fost bun, deci cine ar putea fi interesat de el? În plus toată lumea făcea asta, nimeni nu publica toate experimentele. Și chiar dacă ar fi vrut să le publice, ce jurnal le-ar fi acceptat? Un studiu din 2009 a verificat câte dintre aceste experimente în care medicamentele sunt testate prima dată pe oameni sunt publicate. După ce autorii au luat în considerare toate experimentele aprobate de o comisie de etică într-un an, s-au uitat câte erau publicate după 4 ani: 9 din 10 erau nepublicate. După 8 ani? 4 din 5 erau încă nepublicate.1

Continuă să citești Meta-știință II: Publicarea selectivă

Mit sau Real? Psi: Cele 5 etape ale durerii

Poveste:

La cei mai mulți oameni trecerea printr-o suferință intensă se realizează în cinci etape: negare, furie, târguială, depresie și acceptare.

Kübler-Ross series

Ce este?

Se spune că atunci când suferim o pierdere, de exemplu a unei persoane dragi, calea normală pe care o urmăm este formată din cinci etape:1

  1. Negare: nu putem să credem că n-o să mai vedem persoana dragă niciodată. Negarea ne ajută să trecem peste pierdere. Pe măsură ce pierderea e acceptată începe vindecarea;
  2. Furie: poate fi îndreptată înspre persoana decedată pentru că n-a avut grijă de ea, înspre doctori sau înspre noi înșine. Putem fi furioși că am fost părăsiți, lăsați singuri. Alte sentimente ce pot să apară împreună cu furia sunt panica, tristețea, învinuirea sau singurătatea, ce devin mai puternice pe măsură ce ne apropiem din nou de funcționarea normală;
  3. Târguială: apare când conștientizăm pierderea și începem să ne imaginăm mai multe scenarii de tip „dacă… atunci…” încercând să o aducem înapoi pe persoana pierdută. De exemplu, vrem să descoperim cauza bolii pentru a o preveni, sau vrem să împiedicăm accidentul, sau… ;
  4. Depresie: sentimentul pierderii devine dominant și ne simțim pustii, nu găsim rostul niciunui lucru și nici motivația pentru a face ceva. Depresia este o reacție prin care evităm (sau cel puțin amânăm) obișnuirea cu situația;
  5. Acceptare: este capacitatea de a accepta că persoana pierdută nu mai există, că acest lucru este permanent și că viața trebuie trăită în aceste condiții de acum încolo.

În engleză sunt numite the five stages of grieving, iar în română au fost traduse în mai multe feluri, printre care cele cinci etape ale durerii sau ale suferinței sau ale doliului; sau mai simplu, modelul Kübler-Ross.

Aceste cinci etape au fost propuse de Elizabeth Kübler-Ross în 1969 în urma experienței sale cu persoane care aveau boli incurabile și care au aflat acest lucru înainte de a muri. Kübler-Ross încerca să ajute aceste persoane să își accepte propria moarte. Modelul lui Kübler-Ross a fost inspirat dintr-un model anterior propus de John Bowlby. Niciunul dintre modele n-a fost, însă, dezvoltat ca urmare a studierii oamenilor care au pierdut pe cineva, ci a oamenilor care aveau boli în stadiu terminal.

De când au fost propuse, cele cinci etape au intrat în înțelepciunea populară. E suficientă o  căutare pe Google pentru a găsi aceste etape descrise. Un blog spune că „etapele durerii și ale doliului sunt universale, iar fiecare om le experimentează la un moment dat pe parcursul vieții”, deși mai apoi clarifică faptul că aceste etape nu se petrec într-o anumită ordine. Un alt blog le descrie, dar precizează ceea ce chiar Kübler-Ross a spus: etapele nu reprezintă un cadru rigid și fiecare răspuns la pierdere este unic. În episodul 11 din sezonul 2 din The Simpsons, Homer trece prin toate cele cinci etape după ce mănâncă sushi stricat și află că o să moară (n-am găsit un videoclip mai bun). Mai mult decât atât, aceste etape apar chiar și în cărțile de specialitate destinate asistenților sociali și le sunt predate și în general sunt acceptate în comunitățile medicale și psihologice.2

Așa că am devenit curios.

 

E un mit sau e real?

Ca să ne dăm seama dacă aceste etape sunt reale, înainte de toate trebuie să stabilim care este modelul. Ca să aibă utilitate ar trebui să nu fie o definție prea largă și să se refere la majoritatea oamenilor. O descriere de genul „fiecare trece peste suferință în felul său, unii trec prin etape, alții nu, unii trec prin unele etape, alții prin altele” nu ajută prea mult. O astfel de descriere nu poate fi falsificată pentru că orice s-ar întâmpla se potrivește cu descrierea și nu ne spune nimic nou. Așa că în acest articol o să consider următoarea descriere: la cei mai mulți oameni trecerea printr-o suferință majoră se realizează prin cele cinci etape.

Problema cu cele cinci etape este că nu au fost dezvoltate în mod empiric, adică nu au fost făcute experimente. Ele au fost propuse de Elizabeth Kübler-Ross ca urmare a experienței sale cu pacienți bolnavi în stare terminală. Dacă psihologia dorește să fie văzută ca o știință, ea trebuie să fie bazată pe dovezi.

Modelul celor cinci stadii n-a fost studiat foarte mult în mod științific, cea mai veche încercare de validare pe care am găsit-o fiind din 1980. Atunci, 193 de persoane văduve au fost intervievate și au fost colectate 151 de variabile despre ele. În urma analizei acestor variabile autorii au ajuns la concluzia că stresul asociat cu văduvia rămâne ani întregi uneori și nu par să existe etape separate de adaptare.3 Cu alte cuvinte, modelul Kübler-Ross nu este justificat.

Mai recent, în 2007, a fost făcut un studiu care a concluzionat că aceste etape există și a fost numit prima confirmare empirică a modelului.4 E foarte probabil să fie și singura confirmare empirică, așa că merită atenție specială. Au fost analizate 233 de persoane care au avut un membru al familiei care a murit din cauze naturale. Durata analizei a fost de doi ani. Rezultatele au arătat că fiecare dintre cele cinci etape are un punct în care, în medie, este la nivel maxim, iar apoi scade, cu excepția acceptării, care crește în continuu pe măsură ce trece timpul. Graficul care prezintă rezultatele arată cam așa:

Din Maciejewski et al. (2007)

Rezultatele studiului: prima etapă este neîncrederea, a doua este dorul, a treia este furia, a patra este depresia, iar a cincea este acceptarea.

Dacă ne uităm la grafic, pare impresionant. Este modelul Kübler-Ross cu mici diferențe (târguiala a fost înlocuită cu dorul și a schimbat locul cu furia). Deci modelul se confirmă, nu?

În realitate e un pic mai complicat. În imaginea de mai sus etapele au fost „normalizate” să aibă valori între 0 și 1. Înainte de normalizare, de exemplu, acceptarea creștea de la 4 la 5 în timp ce neîncrederea varia între 1,5 și 2. Cu alte cuvinte, acceptarea este întotdeauna mai mare, în medie, decât neîncrederea. De fapt, decât toate celelalte. Acceptarea e etapa predominantă. Graficul de mai sus induce în eroare. Există și alte critici. De exemplu, aproape o cincime dintre participanți care nu se potriveau modelului Kübler-Ross (aveau complicated grief disorder) au fost excluși de la început. Iar 168 dintre cei care au refuzat să participe au făcut asta pentru că „se simțeau bine” sau pentru că nu au fost interesați. Cu alte cuvinte, nu au fost luați în considerare cei care n-au trecut prin aceste etape. În total, în jur de 40% dintre posibilii participanți n-au fost luați în considerare în analiza finală. Mai mult, autorii n-au ținut cont de existența unor alte probleme de sănătate mentală (cum ar fi tulburarea depresivă majoră sau demența) și nu au luat în considerare factorii sociali (religiozitatea participanților, așteptările societății occidentale de la un văduv). În plus, mai există și probleme în felul în care autorii au ales să analizeze datele.5

Așadar, studiul pare să aibă probleme importante ce pun semne de întrebare asupra rezultatelor. Pentru clarificarea lucrurilor e nevoie ca studiul să fie replicat. Din fericire, acest lucru s-a întâmplat în 2010 când Holland și Neimeyer au analizat 614 indivizi, din medii etnice diverse, care au ajuns în doliu și din cauze naturale și din cauze violente. Rezultatele au fost următoarele: susținerea pentru modelul celor cinci etape este limitată, în timp ce atribuirea unui sens (sensemaking) a prezis mult mai bine rezultatul. Capacitatea oamenilor de a își înțelege situația și de a învăța din experiență este ceea ce îi face să treacă mai ușor peste suferință, nu trecerea timpului.6 Această descoperire a fost confirmată un an mai târziu.7

Alte studii au arătat că multă lume nu trece prin toate etapele, iar ordinea etapelor variază, existând chiar oameni care le parcurg invers.8 La toate acestea se adaugă și cercetarea care nu și-a propus să analizeze cele cinci etape, ci direct suferința în urma unei pierderi. De exemplu, un studiu a descoperit că susținerea din partea familiei și prietenilor reduce depresia dar nu dorul, în timp ce o relație mai bună cu persoana decedată înseamnă un dor mai mic, dar nu are efect asupra depresiei.9 De asemenea, există o relație între suferință și acceptare: dacă una crește, cealaltă scade;10 ceea ce nu e surprinzător.

Există oameni care nu trec prin depresie în urma unei pierderi și asta nu înseamnă că e ceva în neregulă cu ei.11 De fapt, ceea ce modelul celor cinci etape nu ia în considerare este reziliența – capacitatea oamenilor de a își reveni, de a se redresa după o lovitură emoțională. Din cauză că majoritatea cunoștințelor despre doliu vin din observarea oamenilor care caută tratament, reziliența a trecut neobservată pentru multă vreme și este, e fapt, mai comună decât se credea.12

Reacțiile oamenilor în fața unei pierderi variază substanțial. George Bonanno a dezvoltat în mod empiric patru traiectorii: disfuncție cronică, recuperare, reziliență și reacții întârziate. Factorii ce promovează reziliența sunt diversificați, de la temperament și personalitate, la factori demografici (vârstă, sex, nivel de educație) și până la factori sociali (susținerea din partea familiei).13 Un astfel de model este mult mai util decât cele cinci etape. Și dacă tot suntem la subiect, în cazul celor ce ajung pe traiectoria disfuncției cronice (complicated grief) s-a dovedit a fi utilă terapia cognitiv-comportamentală.14

În prezent, modelul celor cinci etape este considerat un mit,15 prin urmare și concluzia mea.

 Kübler-Ross Mit

 

Recomandări:

The Science of Resilience: Exploring the Process of Grieving from a New Perspective. A Conversation with George A. Bonanno

Five Fallacies of Grief: Debunking Psychological Stages de Michael Shermer în Scientific American, 2008.

Capitolul despre cele cinci etape ale durerii din 50 Great Myths of Popular Psychology de Scott O. Lilienfeld.

The Other Side of Sadness (2009) de George Bonanno;

 

Note:

1: Kübler-Ross (1969); Grover & Fowler (2011): pg. 11-12;
2: Holman et al. (2010); Lilienfeld et al. (2009): Myth #10;
3: Barrett & Schneweis (1980);
4: Maciejewski, Zhang, Block & Prigerson (2007);
5: Silver & Wortman (2007);
6: Holland & Neimeyer (2010);
7: Neimeyer (2011);
8: Bello-Hass et al. (2002); Copp (1998);
9: Stroebe et al. (2010);
10: Prigerson & Maciejewski (2008);
11: Wortman & Silver (1989);
12: Bonanno (2004);
13: Bonanno & Mancini (2008);
14: Boelen et al. (2007);
15: Wortman & Boerner (2007); Friedman & James (2008);

 

Referințe:

Barrett, Carol J and Schneweis, Karen M (1980). An Empirical Search for Stages of Widowhood. OMEGA–Journal of Death and Dying, Vol 11, No. 2, pp. 97-104, DOI: 10.2190/T9GT-QJCU-ADJP-37ER (Abstract)

Bello-Hass, V. D., Bene, M. D., & Mitsumoto, H. (2002, December). End of life: Challenges and strategies for the rehabilitation professional. Neurology Report. (Abstract)

Boelen, Paul A.; de Keijser, Jos; van den Hout, Marcel A.; van den Bout, Jan (2007). Treatment of complicated grief: A comparison between cognitive-behavioral therapy and supportive counseling. Journal of Consulting and Clinical Psychology, Vol 75(2), Apr, 277-284. http://dx.doi.org/10.1037/0022-006X.75.2.277 (Abstract)

Bonanno, George A. (2004). „Loss, trauma, and human resilience: have we underestimated the human capacity to thrive after extremely aversive events?„. The American Psychologist 59 (1): 20–8. doi:10.1037/0003-066X.59.1.20. PMID 14736317.

Bonanno, George A. (2009). The Other Side of Sadness: What the New Science of Bereavement Tells Us About Life After Loss. Basic Books, A Member of the Perseus Books Group;

Bonanno, George A, Mancini, Anthony D (2008). The Human Capacity to Thrive in the Face of Potential Trauma. PEDIATRICS Vol. 121 No. 2 February 1, pp. 369-375, doi: 10.1542/peds.2007-1648 (Abstract)

Copp, G. (1998). A review of current theories of death and dying. Journal of Advanced Nursing, 28, 382–390. (Abstract)

Friedman, Russell; James, John W (2008). „The Myth of the Stages of Dying, Death and Grief„. Skeptic Magazine 14 (2): 37–41.

Grover, Rovert J., Fowler, Susan G. (2011). Helping Those Experiencing Loss: A Guide to Grieving Resources. Libraries Unlimited, 1st Edition, ISBN-10: 1598848267. (Online)

Holland JM, Neimeyer RA (2010). An examination of stage theory of grief among individuals bereaved by natural and violent causes: a meaning-oriented contribution. Omega (Westport); 61(2):103-20. (Abstract)

Holman, E. A., Perisho, J., Edwards, A. and Mlakar, N. (2010), The myths of coping with loss in undergraduate psychiatric nursing books. Res. Nurs. Health, 33: 486–499. doi: 10.1002/nur.20407 (Abstract)

Kübler-Ross, Elizabeth (1969), On Death & Dying. Simon & Schuster/Touchstone (Online);

Lilienfeld, Scott O., Steven Jay Lynn, John Ruscio, Barry L. Beyerstein (2009). 50 Great Myths of Popular Psychology: Shattering Widespread Misconceptions about Human Behavior. Wiley-Blackwell, ISBN-10: 1405131128. (Online EPUB version).

Maciejewski, Paul K.; Zhang, Baohui; Block, Susan D.; Prigerson, Holly G. (2007). „An Empirical Examination of the Stage Theory of Grief„. JAMA 297 (7): 716–23. doi:10.1001/jama.297.7.716. PMID 17312291.

Neimeyer RA (2011). Reconstructing meaning in bereavement. Riv Psichiatr. Sep-Dec; 46(5-6):332-6. doi: 10.1708/1009.10982. (Abstract)

Prigerson, Holly G., Maciejewski, Paul K. (2008) Grief and acceptance as opposite sides of the same coin: setting a research agenda to study peaceful acceptance of loss. The British Journal of Psychiatry 193: 435-437 doi: 10.1192/bjp.bp.108.053157

Silver RC, Wortman CB. The stage theory of grief. JAMA 2007; 297: 2692.

Stroebe W, Abakoumkin G, Stroebe M (2010). Beyond depression: yearning for the loss of a loved one. Omega (Westport); 61(2):85-101. (Abstract)

Wortman, C.B., & Boerner, K. (2007). Beyond the myths of coping with loss: Prevailing assumptions vs. scientific evidence. In: H.S. Friedman, & R.C. Silver(Eds.), Foundations of health psychology (pp. 285–324). Oxford, UK: Oxford University Press.

Wortman, C. B., & Silver, R. C. (1989). The myths of coping with loss. Journal of Consulting and Clinical Psychology, 57, 349–357 (Abstract)

 

Mit sau Real? Psi: Tehnica Rorschach

Poveste:

Felul în care interpretăm petele de cerneală din planșele lui Rorschach dezvăluie detalii despre personalitatea noastră.

Rorschach_blot_04

Planșa nr. 4 din testul Rorschach

Ce este?

Testul Rorschach (citit /ˈʁoːʁʃax/ sau /ˈʁoːɐʃax/, aproximativ rorșah) constă în 10 planșe cu pete de cerneală simetrice, unele colorate, altele alb-negre. Persoanele evaluate sunt puse să spună ce văd în aceste imagini ambigue. Asta, pe scurt. În continuare mai în detaliu.

Cele 10 figuri („pete de cerneală”) au fost date publicului în 1921 de către Hermann Rorschach și în următoarele decenii au devenit foarte populare printre psihoterapeuți pentru a evalua și diagnostica. De-a lungul timpului au existat mai multe variante ale testului, majoritatea fiind de tip proiectiv (cum este și testul desenează-o-persoană, de exemplu), iar începând cu anul 1970 John Exner a dezvoltat „sistemul comprehensiv”. Pentru că sistemul lui Exner este cel mai folosit în prezent și nu este de tip proiectiv, o să încerc să-l tratez separat. Dar, mai întâi, să vedem variantele proiective.

 Rorschach_blot_09

Planșa nr. 9

Cele 5 variante

Inițial, Herman Rorschach a încercat să găsească corelații între condiții psihologice (cum ar fi depresia, schizofrenia) și felul în care sunt interpretate figurile de cerneală. Din cauză că a murit la un an după ce a publicat cartea în care descria tehnica și pentru că psihanaliza începea să fie populară, evoluția tehnicii Rorschach a fost spre interpretări proiective. Până în 1957 au fost dezvoltate cinci sisteme diferite de interpretare, denumite după autorii lor. Varianta lui S.J. Beck a fost foarte apropiată de principiile inițiale ale lui Rorschach în ce privește codarea și punctarea. În schimb, varianta lui B. Klopfer era foarte apropiată de filozofiile lui Freud și Jung, insistând pe natura simbolică a răspunsului pacientului. Celelalte trei variante, dezvoltate de Piotrowski, Hertz și Rapaport s-au situat undeva între variantele extreme ale lui Beck și Klopfer.1

În ce privește folosirea acestor variante, un sondaj făcut de Exner în 1972 a arătat că aproape 3 din 5 clinicieni aveau specializare în sistemul lui Klopfer, iar 1 din 2 în sistemul lui Beck. Doar 1 din 5 aveau specializare în sistemul lui Piotrowski și doar 1 din 10 în celelalte. De menționat că mulți clinicieni făceau specializări în mai multe variante. Cea mai importantă diferență între aceste variante de Rorschach o reprezintă sistemul de notare. Ceea ce este interesant este că 22% dintre clinicieni au abandonat complet ideea de notare și interpretau doar în mod subiectiv. Mai mult, 75% dintre clinicieni au recunoscut că „personalizează” sistemul de notare, integrând modele de notare dintr-un sistem în altul și adăugând sisteme de notare dezvoltate din experiența personală. De asemenea, cei mai mulți au recunscut că nu folosesc întotdeauna modul de administrare din sistemul în care s-au specializat. Un alt sondaj, făcut de Jackson și Wohl în 1966, a arătat că 12%  dintre universitățile în care se predă o formă de evaluare Rorschach nici măcar nu predau sisteme de notare, iar în celelalte variază foarte mult ceea ce se predă.3 Pe de altă parte, metoda Rorschach era a treia între cele mai folosite metode de către clinicieni în 1969. Iar popularitatea n-a scăzut decât puțin (de la locul trei la locul cinci) în 1982 și 1995.4

 

Interpretarea proiectivă

Persoana care face testul primește câte o planșă cu pete de cerneală și este rugată să spună „cu ce seamănă”. Această întrebare e intenționat vagă pentru a-l lăsa pe participant să răspundă la întreaga figură, la părți mari din ea sau la detalii mărunte și să își bazeze răspunsul pe forma, umbra, textura și/sau culorea părții alese. Participantul este liber să răspundă și la părțile albe din jurul petelor sau din interiorul lor. De asemenea, este liber să rotească sau să întoarcă planșele (dar doar după ce a dat un răspuns inițial). După fiecare răspuns, examinatorul îl roagă să explice răspunsurile, întrebându-l lucruri cum ar fi „De ce arată ca un fluture?” sau, mai simplu, „Spune-mi mai multe”. În plus, participanții sunt încurajați să vadă mai multe lucruri într-o singură pată. În mod ideal, examinatorul nu trebuie să aibă nicio reacție evidentă la răspunsuri.

Teoria din spatele acestui test este că lumea conține situații ambigue, iar oamenii răspund la ambiguități în moduri specifice ce țin de personalitățile lor. Petele de cerneală sunt ambigue, deci răspunsurile participanților ar trebui să dea indicii despre ce gândesc și n-ar recunoaște în mod obișnuit. Preocupările și conflictele psihologice „adânci” ar trebui să fie „proiectate” pe figurile ambigue de cerneală – de aici și denumirea de „test proiectiv”. Participantul interpretează figurile, iar psihologul interpretează răspunsurile participantului, folosindu-se de experiența sa profesională.

Unul dintre lucrurile interpretate este dacă participantul încearcă să integreze toată pata într-o singură imagine sau este atent doar la detalii mărunte. Folosirea întregii imagini este un indicator al nevoii de a forma o „imagine de ansamblu”. Cu excepția cazurilor în care toată pata poate fi în mod rezonabil privită ca o singură imagine, situație în care un astfel de răspuns indică tendințe către grandiozitate și chiar paranoia și tendința de a nu lua în considerare aspectele realității care nu se potrivesc în „imaginea de ansamblu” a acelei persoane. Pe de altă parte, răspunsurile bazate pe detalii mărunte ale petei indică o personalitate obsesivă, o persoană care se ocupă de detalii în detrimentul aspectelor mai importante ale vieții, eventual pentru a le evita. Câteodată, participantul o să formeze o imagine din spațiile goale (albe) din jurul petelor. Pentru că această „inversare” trece dincolo de cerințele de a analiza petele, câteva răspunsuri legate de spațiile goale sunt indicatoare ale creativității, în timp ce prea multe astfel de răspunsuri (și asta ține de interpretarea psihologului) pot indica o personalitate opunătoare, sfidătoare. Integrarea mai multor trăsături ale petelor (ex.: culoare și formă) este semn al unui eu (ego) puternic, dar doar dacă integrarea nu este una ad hoc (cum ar fi „zebră verde”). Dacă participantul nu este în stare să dea un răspuns după ce vede prima planșă colorată înseamnă că e instabil din punct de vedere emoțional sau că are tendința de a reacționa emoțional în situații în care alții nu ar face-o. Rotirea planșei după câteva răspunsuri indică flexibilitate, dar doar dacă e după câteva răspunsuri – dacă, în schimb, participantul rotește planșa imediat, înseamnă că are capacitate redusă de a testa realitatea. Și așa mai departe.­2

Nu doar forma, ci și conținutul imaginilor generate de participant e important. Mulți văd animale, dar prea multe animale indică imaturitate și lipsă de imaginație. Oamenii în mișcare sunt un lucru bun de văzut pentru că indică putere de caracter și creativitate; organele sexuale nu sunt un lucru așa bun. Răspunsurile „anale” (prea rigide sau prea dezordonate) din partea bărbaților indică homosexualitate. Figurile care sunt parțial umane și parțial ne-umane (centauri, vrăjitoare, personaje din desene animate) sunt semne ale alienării și ale începerii retragerii schizofrenice. Cei care văd scene confabulate (care sunt formate din mai multe imagini aruncate împreună, indiferent de coerență; sau cele care conțin ceva ce nu este în pata de cerneală) nu se pricep la testarea realității. Iar cei care văd multe lucruri pe care alte persoane nu le văd sunt posibil schizofrenici (dar cei care nu văd nimic ieșit din comun au nevoi exagerate de control).2

Răspunsurile cele mai comune pot fi găsite uşor pe internet, ceea ce face falsificarea foarte ușoară. Câteva dintre ele sunt chiar în articolul de pe Wikiedia despre testul Rorschach.

Rorschach_blot_03

Planșa nr. 3.

 

Sistemul Comprehensiv al lui Exner

În anii ’60, John Exner a încercat să sistematizeze interpretările, procedurile și variabilele din versiunile existente la acea vreme pentru testul Rorschach, încercând să găsească corelații statistice între răspunsuri și ceea ce ar trebui să indice. Cu alte cuvinte, dacă majoritatea celor testați văd în prima planșă un fluture sau un liliac, acela este răspunsul „popular”. Dacă majoritatea persoanelor cu schizofrenie văd organe umane, atunci acela este răspunsul care indică schizofrenia. Nu contează ce explicații sunt date de psihanaliză sau de alte ramuri ale psihologiei, pentru Exner contează doar corelația statistică. Rezultatul a fost un sistem destul de complicat, cu notații specifice pe care, pentru a-l explica, e nevoie de o carte întreagă. Totuși, cum ar decurge notarea unui răspuns simplu?40

 Să luăm ca exemplu planșa nr. 3 și următorul răspuns:

Participant: Aici e o persoană, probabil un bărbat.
Evaluator: Unde, mai exact?
Participant: (indică spre D9)
Evaluator: Nu reușesc să văd, puteți să-mi detaliați?
Participant: Aici e capul, aici corpul și aici picioarele.

Toate planșele au fost împărțite de către Exner în regiuni. Regiunea D9 este următoarea:

Rorschach_blot_03 (D9)

Regiunea D9 a planșei III, evidențiată.41

Acest răspuns ar fi codat în felul următor:

Locație și DQ Determinant & FQ Conținut Popular
Do Fo H P

Codarea Do Fo H înseamnă că participantul a folosit o regiune comună a petei (D) și a identificat în aceasta un singur obiect unitar (o). Determinantul F arată că doar forma petei din acea regiune a justificat răspunsul. Codul pentru calitatea formei (o din Fo) indică folosirea convențională a formei, iar conținutul răspunului (H) indică un om (human). Iar P arată că este un răspuns dat frecvent (adică popular).40

Pentru răspunsuri mai complicate și codarea se complică pentru a indica sub-regiuni, mișcare, culoare, textură etc. Iar după codare, pentru a ajunge la indecșii relevanți (cum ar fi SCZI) e nevoie de combinarea codurilor obținute. Prin urmare, pregătirea pentru a putea administra un test Rorschach este laborioasă.

 

Este un mit sau e real?

Înainte de toate, trebuie să reamintesc că nu există un test Rorschach, ci există mai multe variante dezvoltate de-a lungul timpului. Acestea pot fi separate în două categorii: sistemele cu interpretare proiectivă și sistemul comprehensiv dezvoltat de John Exner. Prin urmare, o să le evaluez în mod separat. Să începem cu variantele proiective.

Variantele proiective

Versiunile existente înainte ca John Exner să încerce sintetizarea lor în Sistemul Comprehensiv erau foarte puțin studiate în mod științific. Bruno Klopfer, un student de-al lui Carl Jung și proponentul celei mai populare variante a testului Rorschach, chiar considera că nu este important ca testul să aibă norme (adică un set de reguli după care să fie interpretate rezultatele) și nici nu era preocupat de validitatea testului, importantă fiind integrarea intuitivă a informației. Mai mult, considera că testele de validitate sunt inutile și tot ce ar putea să facă ar fi să confirme ceea ce specialiștii în tehnica Rorschach știu deja.7 Cu toate astea, Klopfer, Piotrowski și alți experți au examinat scorurile Rorschach ale unor cadeți ai unei școli de aviație, încercând să-i identifice pe cei cu „tulburări clare de personalitate”. Precizia acestor experți a fost la fel de bună ca și dacă ar fi dat cu banul.8 După câțiva ani în care a fost pus în fața unor rezultate asemănătoare, adresând criticile, Klopfer declara «Poate că nu este necesar să ne preocupăm de validitate în sensul obișnuit; sau poate o nouă tehnică de validare este necesară».9 De asemenea, insista că expertiza este cel mai important lucru. Cercetarea ulterioară a demonstrat că și această noțiune este falsă, experții nefiind mai preciși în evaluări decât alți evaluatori (ex.: studenți care tocmai au învățat să folosească tehnica Rorschach).10 Mai mult, Klopfer recomanda clinicienilor să valideze tehnica pentru ei înșiși.7 Și se pare că psihologii clinicieni care foloseau această tehnică l-au luat în serios pentru că un sondaj făcut de Exner în 1972 a arătat că aproximativ unul din cinci specialiști nu notează scorul răspunsurilor, iar patru din cinci dintre cei care notează scorul, îl „personalizează”. Cei mai mulți au fost antrenați să folosească ori sistemul lui Klopfer, ori cel al lui Beck, însă cei mai mulți le alterează, le combină și adaugă și observații din experiența personală.11

Pentru a verifica dacă rezultatele metodei Rorschach sunt utile în realitate (și nu doar în declarațiile lui Klopfer), soții Chapman s-au gândit la un test. Unul dintre lucrurile pe care proponenții Rorschach le afirmau era că metoda Rorschach poate identifica persoanele homosexuale. Pentru a verifica acest lucru au urmat mai mulți pași. Prima dată au trimis chestionare mai multor psihologi clinicieni, cerându-le să spună care cred că sunt cele mai des asociate semne cu homosexualitatea. Rezultatele au corespuns cu cele mai frecvente semne convenționale folosite în testele Rorschach (referințe la anus, îmbrăcăminte feminină, organe sexuale, persoane de sex neclar sau persoane hermafrodite). Deși niciunul dintre aceste răspunsuri nu este dat de persoanele homosexuale mai des decât cele heterosexuale, psihologii erau convinși că au ajuns la aceste răspunsuri prin experiență clinică. Observând acest lucru, soții Chapman au formulat o ipoteză: aceste semne sunt doar ceea ce ne așteptăm în mod naiv să vadă homosexualii în petele de cerneală, nu sunt descoperite în urma „experienței clinice”. Așa că au întrebat niște studenți fără experiență clinică să aleagă ce simboluri sunt –pentru ei– asociate cel mai mult cu homosexualitatea. Deloc surprinzător, au făcut aproape aceleași asocieri ca și psihologii cu experiență. Mai mult decât atât, un alt set de studenți a primit 30 de planșe conținând o pată de cerneală, o descriere făcută de un pacient imaginar și două tulburări emoționale de care acesta suferea și după ce au examinat mai multe astfel de planșe, li s-a cerut să spună dacă au observat vreun răspuns dat mai des de homosexuali. Studenții au crezut în mod greșit că semnele false (îmbrăcăminte feminină și toate cele amintite mai sus) indică homosexualitate, dând astfel dovadă de corelație iluzorie. Acest test a fost făcut și „invers”, alți participanți primind semne valide, dar nereușind să facă evaluări corecte.12

Bun, ăsta e doar un test (cu mai multe variații). Există și evaluări mai cuprinzătoare? Există. Una dintre cele mai vechi este cea a lui Lee Cronbach, care concluzionează că eficiența evaluării prin metoda Rorschach nu este susținută în mod empiric.13 În anii care au urmat, au fost făcute evaluări ale metodei Rorschach de către Mental Measurements Yearbok, o carte standard publicată din 6 în 6 ani ce conține evaluări și recenzii ale principalelor metode de evaluare psihologică. Metoda Rorschach a fost evaluată în 1949, 1953, 1959, 1965, 1972 și 1978. În edițiile următoare nici nu a mai fost evaluată pentru că a fost considerată discreditată. În anii în care a fost evaluată, însă, obiceiul era să fie prezentate cel puțin două evaluări, una pro și una contra. Surprinzătoare sunt evaluările pro și „argumentele” aduse, ca de exemplu încercarea lui Morris Krugman în 1949 de a substitui dovezile cu retorica: „Tehnica Rorschach a rezistat testelor clinice de-a lungul anilor și a devenit mai puternică; pe de altă parte, încercările de validare atomistică au eșuat și probabil vor continua să eșueze” (italicele mele). Cu alte cuvinte, știm noi că funționează, așa că de ce să ne mai batem capul cu teste? În ediția următoare, din 1953, povestea se repetă, evaluarea pozitivă oferind doar retorică: „testul Rorschach este o tehnică clinică, nu o metodă psihometrică”. În 1959, Hans Eysenck reafirmă ceea ce a spus Lee Cronbach, iar Raymond J. McCall adaugă că majoritatea ipotezelor n-au fost niciodată validate empiric, deși au fost publicate peste 2000 de studii.6 În 1965, A. Jensen concluzionează că „testul Rorschach este un test foarte slab și nu are nicio valoare practică pentru vreunul dintre scopurile pentru care este recomandat de proponenții săi”.14 În 1978, Richard Davis concluzionează că lipsa validării empirice ridică mari semne de întrebare legate de folosirea în continuare a testului.6

Așa că în ceea ce privește interpretarea proiectivă a testului Rorschach, concluzia este simplă.

Rorschach Mit

 

Sistemul comprehensiv

Dacă în cazul interpretărilor proiective lucrurile sunt mai clare, când vine vorba de sistemul comprehensiv există o controversă. Funcționează sau nu? La o primă vedere răspunsul ar fi: depinde pe cine citești. Irving Weiner scrie că testul Rorschach este foarte bun, iar criticii nu au argumente de luat în seamă.15 Robert Kaplan scrie că testul nu este suficient de bine susținut de studii și că are probleme care trebuie rezolvate înainte să poată fi folosit.16 Iar acestea sunt doar două exemple. Prin urmare, e nevoie să urmărim controversa, așa că această secțiune va avea următoarea structură: prezentarea dezbaterii din anii 1998-2003 când a avut loc așa-numitul Rorschach Wars în Psychological Assessment, apoi prezentarea unor articole din anii de după dezbatere.

 

Pentru că la sfârșitul anilor ’90 au început să apară mai multe articole critice față de sistemul comprehensiv și a apărut o controversă, jurnalul științific Psychological Assessment, specializat în tehnici de evaluare psihologică, a propus o dezbatere structurată între critici și proponenți. La vremea respectivă, Gregory Meyer era redactor șef la acest jurnal, așa că a moderat dezbaterea. Au fost publicate mai multe articole, dintre care primul detaliază și structura dezbaterii:17

  • Partea I cuprinde 5 articole publicate în Secțiunea Specială. Autorii acestor articole au primit 445 de articole despre tehnica Rorschach, publicate în ultimii 20 ani (1977-1997) în cinci dintre cele mai importante jurnale științifice. Folosind aceste articole (și eventual și altele), au trebuit să analizeze starea curentă a sistemului comprehensiv. Cele cinci articole din prima parte sunt următoarele:
    • Dawes, R.M. (1999). Two methods for studying the incremental validity of a Rorschach variable, Psychological Assessment, 11, 297-302. Afirmă că variabila numită Ego Impairment Index din sistemul comprehensiv are validitate incrementală scăzută (validitatea incrementală se referă la puterea de predicție a unei variabile atunci când este adăugată unor informații deja cunoscute);
    • Hiller, J.B., Rosenthal, R., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (1999). A comparative meta-analysis of Rorschach and MMPI validity, Psychological Assessment, 11, 278-296. Afirmă că sistemul comprehensiv și MMPI (Minesota Multiphasic Personality Inventory) sunt la fel de valide;
    • Hunsley, J. & Bailey, J.M. (1999). The clinical utility of the Rorschach: Unfulfilled promises and an uncertain future, Psychological Assessment, 11, 266-277. Afirmă că sistemul integrat are utilitate clinică foarte scăzută și nu există suficiente dovezi care să justifice folosirea acestuia în continuare;
    • Stricker, G., Gold, J.R. (1999). The Rorschach: Toward a nomothetically based, idiographically applicable configurational model, Psychological Assessment, 11, 240-250. Afirmă că sistemul comprehensiv poate fi folosit pentru evaluarea personalității;
    • Viglione, D.J. (1999). A review of recent research addressing the utility of the Rorschach, Psychological Assessment, 11, 251-265. Afirmă că multe dintre variabilele Rorschach sunt utile în contexte clinice, judiciare și educaționale;
  • Partea a II-a cuprinde câte un articol din fiecare tabără (critici și susținători), care au rolul de a analiza, dezbate și disputa concluziile articolelor din partea I. Cele două articole sunt următoarele:
    • Garb, H.N., Wood, J.M., Nezworski, M.T., Grove, W.M., Stejskal, W.J. (2001). Toward aresolution of the Rorschach controversy, Psychological Assessment, 13, 433-448;
    • Weiner, I.B. (2001). Advancing the science of psychological assessment: The Rorschach Inkblot Method as exemplar, Pychological Assessment, 13, 423-432;
  • Partea a III-a. Articolele din partea a II-a au fost trimise către autorii principali ai articolelor din partea I pentru a răspunde criticilor aduse meta-analizelor. De asemenea, Hunsley & Bailey și Viglione & Hilsenroth au avut oportunitatea de a răspunde și articolelor din partea I, fiind principalii critici și susținători ai dezbaterii. Au fost publicate trei articole:
    • Rosenthal, R., Hiller, J.B., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (2001). Meta-analytic methods, the Rorschach and the MMPI, Psychological Assessment, 13, 449-451;
    • Viglione, D.J., & Hilsenroth, M.J. (2001). The Rorschach: Facts, fictions and future, Psychological Assessment, 13, 452-471;
    • Hunsley, J., & Bailey, J.M. (2001). Whither the Rorschach? An analysis of the evidence, Psychological Assessment, 13, 472-485;
  • Partea a IV-a. Toate articolele precedente au fost analizate de ultima serie de autori, care au scris și un sumar al dezbaterii:
    • Meyer, G.J., & Archer, R.P. (2001). The hard science of Rorschach research: What do we know and where do we go? Psychological Assessment, 13, 486-502;

Rorschach_blot_07

Planșa nr. 7

Pentru a înțelege mai bine dezbaterea, o să prezint și rezumatele articolelor din partea a II-a și partea a III-a (cu excepția celui al lui Rosenthal et al. care conține doar niște calcule refăcute ca urmare a criticilor primite).

A fost greu să mă decid dacă să includ rezumatele în acest articol, așa că m-am gândit la următorul compromis: le-am inclus, dar știu că este mult de citit, așa că puteți sări direct la partea a IV-a (articolul lui Meyer și Archer, după planșa nr. 5) dacă nu vă interesează detaliile dezbaterii.

Așadar, partea a II-a. Să începem cu articolul lui Howard Garb și să continuăm cu cel al lui Irving Weiner.

Garb et al. (2001)

  • Despre articolul lui Striecker & Gold (1999): prezintă afirmații exagerate în timp ce rezultatele studiilor sunt modeste. Variabila S-Con (Suicide Constellation) nu reușește să diferențieze pacienții cu tendințe de sinucidere de cei fără. Deși este adevărat că utilitatea variabilei RPRS (Rorschach Prognostic Rating Scale) este susținută de o meta-analiză recentă,18 este la fel de adevărat că majoritatea studiilor despre RPRS sunt mai vechi de 20 ani și nu au folosit sistemul comprehensiv. Garb și colaboratorii mai remarcă și că Striecker & Gold înceracă să găsească raționalizări în cazurile în care nu le convin rezultatele.
  • Despre articolul lui Viglione (1999): deși Viglione afirmă că majoritatea variabilelor au fost testate pentru fiabilitate, în realitate doar 51 au fost testate, iar când analizele au fost făcute de alte persoane, nu de John Exner (autorul sistemului comprehensiv), rezultatele au fost mai slabe.19 În ce privește fiabilitatea concordanței la notare, Viglione citează o meta-analiză (pe care Garb o consideră „forțată”), dar uită să citeze critica acelei meta-analize.20 De asemenea, Garb et al. prezintă singurul studiu bine realizat pe acest subiect și arată că rezultatele a 50% dintre variabile sunt sub ceea ce chiar Exner sau Groth-Marnat consideră acceptabil.21 În ce privește diversitatea culturală, există riscul ca în cazul non-americanilor să existe o supra-patologizare și prezintă mai multe studii care au observat acest fenomen.37 În ceea ce privește judecățile clinice, Garb et al. afirmă că majoritatea studiilor citate de Viglione sunt din anii ’60 și 70’ și nu folosesc sistemul comprehensiv și că, de asemenea, Viglione ignoră în mod consecvent descoperirile negative. În ce privește variabila DEPI (Depression Index), studiile prezentate sunt neconvingătoare, iar pentru SCZI (Schizophrenia Index) rezultatele sunt moderate.
  • Despre articolul lui Dawes (1999): Garb et al. sunt de acord că există validitate incrementală modestă când se folosește sistemul comprehensiv împreună cu MMPI.
  • Despre articolul lui Hiller et al. (1999): meta-analiza făcută de Hiller are erori statistice importante și folosește datele dintr-o altă meta-analiză22 ce a fost la rândul ei criticată pentru erori statistice,23 iar după corectarea acestora, rezultatele au fost că MMPI este superior testului Rorschach. Hiller a fost de acord cu critica acestei meta-analize, dar a descoperit alte erori statistice în meta-analiza originală, ceea ce face rezultatele ambelor meta-analize greu de evaluat. O altă problemă a meta-analizei lui Hiller este că evaluatorii nu au fost orbiți.
  • În concluzie, Garb susține că studiile individuale incluse în meta-analize au erori care nu au fost corectate, multe descoperiri nu au fost replicate (iar Viglione neglijează acest fapt). Variabila SCZI corelează puternic cu schizfrenia, iar R (numărul de răspunsuri) în mod invers cu dizabilitățile intelectuale. O listare a fiecărei variabile din sistemul comprehensiv, cu datele aferente (validitate, fiabilitate etc.) ar clarifica lucrurile. În meta-analize ar trebui incluse si studii nepublicate (ex.: disertații), iar o parte dintre studiile făcute de Rorschach Workshops sunt citate în favoarea testului, dar nu sunt disponibile pentru a fi verificate și ar trebui să fie făcute publice.

Weiner (2001)

  • Încă din abstract, Weiner adoptă o atitudine puternic în favoarea metodei Rorschach, afirmând că articolele pro au prezentat dovezi extensive, tehnica a fost standardizată, validată și a devenit fiabilă, fiind un exemplu robust de aplicare a principiilor științifice. În același timp, caracterizează articolele anti-Rorschach ca fiind superficiale, incomplete și neechilibrate și prezintă un scepticism care nu trebuie luat prea mult în serios.
  • În ce privește standardizarea, Weiner afirmă că Exner a făcut eforturi mari pentru a produce un set de reguli, iar în prezent sistemul comprehensiv este folosit de foarte multă lume. Criticii însă –susține Weiner– au ales exemple care nu folosesc sistemul lui Exner sau situații în care cei care au administrat testul nu l-au administrat bine și de aici rezultatele negative (țin să repet cu alte cuvinte: când sunt observate rezultate pozitive e pentru că testul e bun, iar când sunt rezultate negative e pentru că n-a fost administrat cum trebuie).
  • Concordanța la notare este în general mare (Meyer a obținut K = 0,88, iar Hunsley & Bailey n-au abordat problema pentru că orice sistem cu o consistență internă e de așteptat să aibă o concordanță mare). Fiabilitatea la retestare este relativ mare pentru multe dintre variabilele din sistemul comprehensiv (Weiner citează meta-analiza lui Viglione, 1999), chiar și Hunsley & Bailey fiind de acord cu asta.
  • Problema datelor normative de referință nu a fost abordată de celelalte articole, iar Weiner amintește faptul că Exner a folosit un grup de 700 de persoane pentru a obține aceste date.
  • În ce privește validitatea, Weiner amintește articolele lui Striecker & Gold (1999) și Viglione (1999), care susțin că sistemul comprehensiv are o validitate mare, amintește și de articolul lui Hiller (1999) care susține că validitatea SC este la fel de mare ca pentru MMPI, apoi prezintă dezbaterea dintre Hunsley & Bailey și Garb et al. pe de o parte și Parker et al. și Atkinson pe de altă parte. De asemenea, critică articolul lui Hunsley & Bailey din partea I, concentrându-se doar pe meta-analiza lui Hiller et al. (1999), tot din partea I.
  • În ce privește validitatea incrementală, Weiner critică articolul lui Hunsley & Bailey (1999) pe motiv că studiile citate nu foloseau sistemul comprehensiv. Referitor la celălalt studiu citat,24 Weiner se concentrează pe SCZI (care are validitate incrementală mare) și ignoră celelalte variabile (menționând, totuși, DEPI). Citându-l pe Dawes (1999), Weiner îi exagerează concluziile și menționează doar trei variabile care, întâmplător sau nu, au validitate incrementală mare.

Rorschach_blot_10

Planșa nr. 10

Și articolele din partea a III-a.

Viglione & Hilsenroth (2001)

  • Afirmă că există concordanță mare la notare pentru 95% dintre variabilele din sistemul comprehensiv. Fiabilitatea la retestare este, în general, bună, lucru cu care sunt de acord și Wood sau Lilienfeld. De asemenea, autorii critică două studii prezentate de Garb în articolul din partea a II-a.25
  • În ce privește datele normative și diversitatea culturală, autorii recunosc că există probleme (datele sunt învechite, nu există suficienți participanți non-caucazieni), iar unele unele game de interpretare ar trebui modificate (de exemplu pentru variabilele X-% și X+%).
  • Autorii susțin că meta-analizele oferă în general susținere pentru validitatea sistemului comprehensiv. Și validitatea incrementală este bună, iar motivul pentru care în meta-analiza lui Hunsley & Bailey (1999) nu au fost obținute valori ridicate este pentru că n-au luat în considerare toate studiile. Și Garb, și Weiner confirmă validitatea incrementală a variabilelor EII, Rorschach Oral Dependency Scale și RPRS. În plus, autorii prezintă și alte studii care au găsit validitate incrementală pentru mai multe variabile din sistemul comprehensiv, atunci când au fost folosite împreună cu MMPI. Chiar și studiul lui Dawes (1999) din prima parte, afirmă Viglione și Hilsenroth, susține validitatea incrementală, deși concluzile lui Dawes sunt mai rezervate.
  • Thought Disorder Index este strâns legat de psihoză, schizofrenie și tulburări de gândire (autorii citează mai multe studii care susțin acest lucru), iar S-Con (Suicide Constellation) poate indica risc de sinucidere, dar nu poate fi folosit pentru a-l exclude (are problema erorilor fals-pozitive).
  • Concluzia este că sistemul comprehensiv are limitările sale și este nevoie de mai multe studii care să evidențieze punctele slabe și punctele forte, însă scepticii (în special Hunsley & Bailey) cer standarde mult prea ridicate.

Hunsley & Bailey (2001)

  • Consideră că studiile existente sunt insuficiente pentru a justifica folosirea tehnicii Rorschach în domeniul clinic, remarcă neclaritatea din jurul acesteia (de exemplu, Exner îl consideră test psihometric, în timp ce Weiner nu) și critică studiile prezentate în favoarea folosirii sale.
  • Autorii consideră că meta-analiza lui Viglione (1999) a exclus în general datele self-reported, dar le-a inclus atunci când au avut rezultate pozitive, deși proponenții Rorschach susțin aceste date nu trebuie incluse în evaluare (ex: Weiner, Striecker, Gold). Cu toate acestea, Viglione nu este singurul care le-a folosit; Bornstein, Meyer și Hiller le-au folosit în meta-analizele lor.26
  • În urma concluziilor negative ale unor meta-analize27 care au analizat capacitatea testelor Rorschach de a identifica tulburările mentale, unii proponenți afirmă că scopul testului nu a fost niciodată diagnosticarea (ex.: Hiller, Weiner), ceea ce nu pare decât o raționalizare post-hoc (mai ales că până în 1997, Weiner susținea opusul). De asemenea, Weiner ignoră și alte critici și răspunde prin retorică.
  • Hunsley și Bailey ridică problema felului în care sunt administrate testele Rorschach, iar Weiner susține că aceasta nu este o problemă pentru că nici în cazul altor teste nu a fost analizat acest lucru. Hunsley și Bailey oferă un contraexemplu, WAIS (Wechsler Adult Intelligence Scale), și arată că s-a studiat problema felului în care este administrat. O altă problemă, descoperită de Wood et al., e tendința testului Rorschach de a supra-patologiza, lucru care ar putea explica opinia susținătorilor că testul Rorschach e atât de bun încât descoperă tulburările mentale chiar și atunci când alte teste nu pot face asta. Susținătorii mai afirmă și că eficiența testului este mai mare atunci când se fac interpretări „individualizate”, ceea ce nu este susținut de dovezi empirice și sună asemănător cu afirmațiile astrologilor.
  • În concluzie, autorii consideră că nu există suficiente dovezi obținute din studii de calitate pentru a stabili că sistemul comprehensiv este util în condiții clinice, legale sau de altă natură.

Rorschach_blot_05

Planșa nr. 5

În partea a IV-a a fost publicat un singur articol care a reanalizat niște date contestate în părțile anterioare și a tras concluziile. Articolul este scris de Meyer & Archer (2001):

  • Meyer, Archer și Parker au reanalizat datele lui Parker et al. (1988), folosind și date excluse inițial și au corectat greșelile statistice, iar rezultatele sunt asemănătoare cu cele originale, adică au arătat că există validitate asemănătoare între sistemul comprehensiv și MMPI. Autorii remarcă, totuși, compararea acestor metode este problematică pentru că acestea nu conțin predictori echivalenți și nu au fost evaluate relativ la un set comun de variabile. De asemenea, studiile folosite în meta-analiză nu au fost corectate de anumite aspecte de proiectare cunoscute ca având impact asupra rezultatelor și nu au fost aduse la același nivel de rigoare metodologică. Meta-analiza globală arată, însă, că și testul Rorschach (Sistemul Comprehensiv) și MMPI și WAIS (Wechsler Adult Intelligence Scale) au aspecte positive asemănătoare în ce privește validitatea.
  • Printre concluzii: indexul SCZI este util pentru identificarea schizofreniei, indexul DEPI nu este util pentru a identifica depresia. De asemenea, autorii menționează că nu există suficiente dovezi sistematice legate de virtuțiile și limitările răspunsurilor Rorschach, dar cu toatea astea testul e suficient de bun pentru a fi folosit.

Cred că e important să menționez că Gregory Meyer este unul dintre principalii proponenți ai testului Rorschach (și în prezent continuatorul muncii lui John Exner), iar Robert Archer s-a specializat în alte tehnici psihometrice (în special MMPI). Nu pare o practică foarte bună acordarea ultimului cuvânt unei părți dintr-o dezbatere. Ar fi fost mult mai potrivit ca în locul lui Meyer să fie ales un cercetător neutru. Tocmai de aceea am ales să prezint pe scurt dezbaterea pentru că nu cred că concluziile ultimului articol oferă o imagine echilibrată. De exemplu, articolul nu scoate în evidență principala critică a taberei „contra”, și anume că pentru variabilele (indecșii, scorurile) sistemului comprehensiv nu există suficiente studii care să arate în ce măsură funcționează (sau nu funcționează) fiecare. Există studii care arată că SCZI este foarte bun și că DEPI nu este bun, dar pentru foarte multe dintre variabile aceste date lipsesc. Și sunt în jur de 150 de astfel de variabile.

După cum era de așteptat, controversa nu s-a terminat după această dezbatere din revista Psychological Assessment, iar părerile au continuat să fie împărțite. Unii dintre proponenți (de exemplu, Weiner) au considerat disputa încheiată, dar din fericire alții au continuat să facă studii despre eficiența sistemului comprehensiv (Meyer, Exner, Mihura) și au contribuit la îmbunătățirea lui. Criticii au continuat să indice punctele slabe ale testului. A existat și o controversă legată de folosirea testului în justiție,28 au existat și cărți pentru publicul nespecialist.29

Rorschach_blot_02

Planșa nr. 2

În 2005, Garb și asociații30 au prezentat situația din punctul lor de vedere, rezumată în continuare (acesta fiind doar unul dintre articolele apărute după Rorschach Wars):

  • Mai multe studii arată că testele Rorschach au tendința de a supra-patologiza, dar proponenții testului vin doar cu explicații post-hoc (de exemplu, Weiner afirmă că persoanele evaluate inițial de Exner pentru stabilirea normelor sistemului comprehensiv erau mai sănătoase decât populația generală, ceea ce este fals, chiar Exner confirmând că între 15 și 20% au apelat la ajutor psihologic pentru diverse probleme).
  • Și criticii, și proponenții sunt de acord că unele scoruri din sistemul comprehensiv sunt valide, cum ar fi cele legate de detectarea tuburărilor de gândire, a dependenței sau a rezultatului tratamentului. Există de asemenea consens că unele scoruri nu au fost studiate suficient (ex.: Coping Deficit Index, Obsessive Style Index, Hypervigilance Index, raportul dintre mișcarea activă și cea pasivă, D-score, conținutul de mâncare, elemente anatomice și de raze X, Intellectualization Index, Isolation Index).
  • Rezultatele pozitive ale unor meta-analize arată că cel puțin unele scoruri sunt valide, dar nu nu spun care. Pe de altă parte, relevanța unor meta-analize este exagerată uneori de proponenți (ex.: Weiner, referindu-se la meta-analiza făcută de Parker, Hanson & Hunsley (1998), a susținut că coeficienții de validitate de 0,41 pentru Rorschach și 0,46 pentru MMPI sunt obținuți în urma a 411 studii, dar în realitate aceștia au fost obținuți în urma a doar 5 studii (pentru Rorschach), respectiv 30 (pentru MMPI).
  • Criteriile folosite de autori (Garb et al.) pentru a evalua validitatea sunt: studiile trebuie să fie calitative din punct de vedere metodologic, rezultatele semnificative să fie replicate independent, iar rezultatele trebuie să fie consecvente. Conform acestor criterii, următoarele scoruri au fost găsite a fi valide: Thought Disorder Index pentru evaluarea tulburărilor de gândire; Rorschach Prognostic Rating Scale pentru predicția rezultatului tratamentului; Rorschach Oral Dependency Scale pentru comportamente legate de dependență; și verbalizările deviante și calitatea slabă a formelor (precum și SCZI și alți indcși derivați din acestea) pentru detectarea schizofreniei. La acestea, autorii mai adaugă semnele lui Piotrowski pentru leziuni cerebrale și scalele de ostilitate și anxietate a lui Elizur.

Din păcate, John Exner a murit în 2006, iar ultima carte pe care a publicat-o despre sistemul comprehensiv a fost în 2005,31 dar ultima revizuire a sistemului a fost în 2003. Prin urmare, toate descoperirile făcute de atunci înainte nu sunt reflectate în metodologia sistemului comprehensiv, iar de atunci au fost făcute mai multe studii. Unele au întărit validitatea unor variabile (ex.: Perceptual Thinking Index pentru diagnosticarea schizofreniei32), altele au sugerat includerea unor variabile care nu sunt în sistemul comprehensiv (ex.: scala de ostilitate a lui Elizur sau variabilele de agresivitate ale lui Holt33), iar altele excluderea unor predicții ineficiente (ex.: analiza mai multor variabile pentru detectarea psihopatiei34). De asemenea, au fost propuse și modificări ale metodologiei pentru a repara unele probleme legate de administrare35 și a fost recomandat să nu se facă diagnosticări pentru copii și adolescenți din societăţi diferite de America pentru că datele sunt neclare.36

Având în vedere problemele existente, nu pot să pun eticheta „real” pe sistemul comprehensiv, dar nici „mit” nu pot să spun că este, pentru că unele părți funcționează, iar unele meta-analize (chiar dacă disputate) arată că are validitate asemănătoare cu alte teste din psihologie. Așadar, sistemul este bun, dar mai trebuie îmbunătățit, trebuie separate variabilele bune de cele inutile. Până n-o să se facă acest lucru, o să existe dubii în legătură cu precizia predicțiilor. Prin urmare, o să spun că este plauzibil.

Rorschach Plauzibil

 

A New Hope: Rorschach Performance Assessment System® (R-PAS®)

Înainte de a încheia, trebuie să scriu ceva și despre viitorul testului Rorschach. Cum am scris mai sus, John Exner a murit în 2006 și nu a desemnat în mod oficial pe nimeni să îi continue cercetarea. Deși inițial familia sa a fost de acord cu modificarea sistemului comprehensiv de către Consiliul de Cercetare Rorschach, pe urmă a decis ca sistemul comprehensiv să rămână așa cum l-a lăsat Exner, în semn de omagiu. Prin urmare, cei din consiliul de cercetare au decis să creeze un nou sistem, bazat în mare parte pe sistemul comprehensiv și l-au numit Rorschach Performance Assessment System® (R-PAS®). R-PAS își propune să își adapteze variabilele și criteriile de evaluare în funcție de cercetare și astfel să devină un instrument psihologic bazat pe dovezi. Un exemplu de astfel de modificare este renunțarea la unele variabile (ex.: Hx, PSV), reconfigurarea altora (ex.: umbrele nu mai indică dominanță) sau adăugarea unora noi (ex.: SR, SI, AGC). De asemenea, au fost colectate date noi pentru populații ne-americane.38 Din grupul de cercetare fac parte, printre alții, Gregory Meyer, Joni Mihura, Donald Viglione sau Robert Bornstein.

În 2013 a fost publicată o meta-analiză care –în sfârșit– prezintă informații despre relevanța fiecărei variabile în parte (așa cum încă din 1999 criticii indicau că este necesar).39 Pe lângă tabelele cu informații despre variabile, articolul discută pe larg unele aspecte. Sunt aduse critici la meta-analiza lui Hiller et al. (1999) și la re-analiza lui Meyer & Archer (2001) din care rezulta că sistemul comprehensiv are validitate asemănătoare cu MMPI, concluzionând că există prea multe erori și prea multe necunoscute pentru a considera rezultatele valide. Este scos în evidență și faptul că pentru unele variabile din sistemul comprehensiv nu există cercetare solidă sau rezultatele sunt negative, iar datele lui Exner sunt cel mai probabil exagerate. Sunt prezentate și alte studii (Jørgensen, Andersen, & Dam, 2000; 2001) care confirmă rezultatele lui Wood et al. (2010) conform cărora psihopații nu pot fi descoperiți folosind testul Rorschach. Așa că în viitorul apropiat s-ar putea să avem un test Rorschach care să funcționeze suficient de bine.

Rorschach_blot_06

Planșa nr. 6

 

Linkuri utile:

Giving up cherished ideas: The Rorschach Inkblot Test (Robyn Dawes despre interpretarea proiectivă);
Rorschach Comprehensive System: Current Issues;
Listă cu articole despre Rorschach;
Invisible ink? What the Rorschach really tells us (Association for Psychological Science);
An Introduction to Rorschach Assessment (Capitol scris de Meyer și Viglione în 2008);
What’s Right with the Rorschach? (la ce este folositor testul Rorschach);
Introducing Key Features of the Rorschach Performance Assessment System (R-PAS);
Articole despre R-PAS.

 

 

Note:

1: Gary Groth-Marnat (2003), pg. 409;
2: Robyn Dawes (1994), pg. 147-148;
3:John Exner (2003), pg. 22-26;
4: Lubin, Wallis, & Paine (1971); Lubin, Larsen, & Matarazzo (1984); Watkins, Campbell, Nieberding, & Hallmark (1995);
5: John Exner (2003), cap. 3 „Controversy, Criticism and Decisions”;
6: Robyn Dawes (1994, pg. 150-152; sau Extract din carte;
7: Garb, Wood, Lilienfeld, Nezworski (2005);
8: Holtzman & Sells (1954);
9: „Perhaps it is not necessary to be concerned with validity in the usual sense; or perhaps a new technique of validation is necessary” (Klopfer & Davidson, 1962, p. 24): citat în Garb, Wood, Lilienfeld, Nezworski (2005);
10: Garb (1989), Whitehead (1985): citate în Garb, Wood, Lilienfeld, Nezworski (2005);
11:Exner & Exner (1972);
12: Chapman & Chapman (1969);
13: Cronbach (1949), citat în Dawes (1994), pg. 151: „The test has repeatedly failed as a prediction of practical criteria. There is nothing in the literature to encourage reliance on Rorschach interpretation.„;
14: Jensen (1965), citat în Meyer (1999a);
15: Weiner & Roger (2008),  Cap. 11: Rorschach Inkblot Method; sau Weiner & Freedheim (2003), pg. 304;
16: Kaplan & Saccuzzo (2008), Cap. 14: Projective Personality Tests;
17: Meyer (1999b);
18: Meyer & Handler (1997);
19: Garb et al. citează disertația lui Erstad (1996) și studiul lui Adair & Wagner (1992);
20: Garb et al. citează pe Wood, Nezworski, & Stejskal (1997);
21: Garb et al. citează pe Acklin, McDowell, Verschell, & Chan (2000);
22: Garb et al. citează pe Parker, Hanson, & Hunsley (1988);
23: Garb et al. citează pe Garb, Florio, Grove (1998);
24: Archer & Krishnamurthy (1997);
25: articolele criticate sunt Erstad (1996) și Adair & Wagner (1992);
26: Bornstein (1996); Meyer (1999b); Hiller et al. (1999);
27: Hiller et al. (1999); Wood & Lilienfeld (1999); Wood, Lilienfeld, Garb, Nezworski (2000);
28: de exemplu, în favoarea folosirii: Ritzler, Erard, & Pettigrew (2002) și contra folosirii: Grove, Barden, Garb, Lilienfeld (2002);
29: Wood, Nezworski, Lilienfeld, & Garb (2003): What’s Wrong With The Rorschach?;
30: Garb, Wood, Lilienfeld, Nezworski (2005); alt articol asemănător: Wood (2006);
31: John Exner, Philip Erdberg (2005);
32: Dao, Prevatt (2006);
33: Katko, Meyer, Mihura, & Bombel (2009);
34: Wood, Lilienfeld, Nezworski, Garb, Allen, Wildermuth (2010);
35: Dean, Viglione, Perry, & Meyer (2007);
36: Meyer, Erdberg, & Shaffer (2007);
37: vezi și Wood, Nezworski, Garb, Lilienfeld (2001); și răspunsul ulterior la critici: Wood, Teresa, Garb, & Lilienfeld (2001);
38: Meyer & Viglione (2011);
39: Mihura, Meyer, Dumitrascu, Bombel (2013);
40: John Exner (2003), pg. 71-72;
41: John Exner (2003), pg. 598;

 

 

Referințe:

Acklin, M. W., McDowell, C. J., Verschell, M. S., & Chan, D. (2000). Interobserver agreement, intraobserver reliability, and the Rorschach Comprehensive System. Journal of Personality Assessment, 74, 15-47. (Abstract);

Adair, H. E., & Wagner, E. E. (1992). Stability of unusual verbalizations on the Rorschach for outpatients with schizophrenia. Journal of Clinical Psychology, 48, 250-256. (Abstract);

Archer, R. P., & Krishnamurthy, R. (1997). MMPI-A and Rorschach indices related to depression and conduct disorder. Journal of Personality Assessment, 69, 517-533. (Abstract);

Bornstein, R.F. (1996). Construct validity of the Rorschach Oral Dependency Scale: 1967-1995. Psychological Assessment, 8, 200-205. (Abstract);

Chapman, L. J., and Chapman. J. P. (1969). Illusory correlation as an obstacle to the use of valid psychodiagnostic signs, Journal of Abnormal Psychology, 74, 271-280. (Abstract);

Cronbach, L. J. (1949). Statistical methods applied to Rorschach scores: A review. Psychological Bulletin, 46, 393–429. doi:10.1037/h0059467. (Abstract);

Dao T.K., Prevatt F. (2006). A psychometric evaluation of the Rorschach comprehensive system’s perceptual thinking index. J Pers Assess.;86(2):180-9. (Abstract);

Dawes, Robyn. House of Cards: Psychology and Psychotherapy Built on Myth [1994], Free Press;

Dawes, R.M. (1999). Two methods for studying the incremental validity of a Rorschach variable, Psychological Assessment, 11, 297-302. (Abstract);

Dean, K. L., Viglione, D. J., Perry, W., & Meyer, G. J. (2007). A method to optimize the response range while maintaining Rorschach comprehensive system validity. Journal of Personality Assessment, 89(2), 149-161. (Abstract);

Erstad, D. (1996). An investigation of older adults’ less frequent human movement and color responses on the Rorschach (Doctoral dissertation, Marquette University, 1995). Dissertation Abstracts International, 57, 4084B.

Exner, John. The Rorschach, A Comprehensive System: Volume 1. Basic Foundations and Principles of Interpretation, 4th Edition (2003), John Wiley & Sons, Inc.;

Exner, John E., Erdberg, Philip. The Rorschach, A Comprehensive System: Volume 2. Advanced Interpretation, 3rd Edition (2005). Wiley;

Exner, J.E., Exner, D.E. (1972). How clinicians use the Rorschach. Journal of Personality Assessment (Impact Factor: 1.29). 11/1972; 36(5):403-8. DOI:10.1080/00223891.1972.10119784. (Abstract);

Garb, H. N., Florio, C. M., & Grove, W. M. (1998). The validity of the Rorschach and the Minnesota Multiphasic Personality Inventory: Results from meta-analyses, Psychological Science, 9, 402-404.

Garb, H.N., Wood, J.M., Nezworski, M.T., Grove, W.M., Stejskal, W.J. (2001). Toward aresolution of the Rorschach controversy, Psychological Assessment, 13, 433-448. (Abstract);

Garb H.N., Wood J.M., Lilienfeld S.O., Nezworski M.T. (2005). Roots of the Rorschach controversy. Clin Psychol Rev. 2005 Jan; 25(1):97-118. (Abstract);

Groth-Marnat, Gary. Handbook of Psychological Assessment, 4th Ed. (2003), John Wiley & Sons;

Grove, William M.; Barden, R. Christopher; Garb, Howard N.; Lilienfeld, Scott O. (2002). Failure of Rorschach-Comprehensive-System-based testimony to be admissible under the Daubert-Joiner-Kumho standard. Psychology, Public Policy, and Law, Vol 8(2), Jun 2002, 216-234. doi: 10.1037/1076-8971.8.2.216. (Abstract);

Hiller, J.B., Rosenthal, R., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (1999). A comparative meta-analysis of Rorschach and MMPI validity, Psychological Assessment, 11, 278-296. (Abstract);

Holtzman, W. H.; Sells, S. B. (1954). Prediction of flying success by clinical analysis of test protocols. The Journal of Abnormal and Social Psychology, Vol 49(4, Pt.1), Oct 1954, 485-490. doi: 10.1037/h0059895. (Abstract);

Hunsley, J. & Bailey, J.M. (1999). The clinical utility of the Rorschach: Unfulfilled promises and an uncertain future, Psychological Assessment, 11, 266-277. (Abstract);

Hunsley, J., & Bailey, J.M. (2001). Whither the Rorschach? An analysis of the evidence, Psychological Assessment, 13, 472-485. (Abstract);

Jensen, A. R. (1965). Review of the Rorschach Inkblot Test. In O. K. Buros (Ed.), The sixth mental measurements yearbook (pp. 501–509). Highland Park, NJ: Gryphon;

Jørgensen, K., Andersen, T. J., & Dam, H. (2000). The diagnostic efficiency of the Rorschach Depression Index and the Schizophrenia Index: A review. Assessment, 7, 259 –280. doi:10.1177/107319110000700306. (Abstract);

Jørgensen, K., Andersen, T. J., & Dam, H. (2001). „The diagnostic efficiency of the Rorschach Depression Index and the Schizophrenia Index: A review”: Erratum. Assessment, 8, 355. doi:10.1177/107319110100800311;

Kaplan, Robert M., & Saccuzzo, Dennis P., Psychological Testing: Principles, Applications and Issues, 7th Edition (2008),  Wadsworth Cengage Learning;

Katko, N. J., Meyer, G. J., Mihura, J. L., & Bombel, G. (2009). The interrater reliability of Elizur’s hostility systems and Holt’s aggression variables: A meta-analytical review. Journal of Personality Assessment, 91, 357-364. doi: 10.1080/00223890902936116 (Abstract);

Lubin, B., Larsen, R.M., & Matarazzo, J.D. (1984). „Patterns of psychological test usage in the United States 1935-1982”. American Psychologist, 39, 451-454. (Abstract);

Lubin, B., Wallis, R.R., & Paine, C. (1971). „Psychometric instruments in psychological clinics”. Journal of Consulting Psychology, 11, 49-54. (Abstract);

Meyer, G.J. (1999a). Introduction to the Special Series on the Utility of the Rorschach for Clinical Assessment. Psychological Assessment, Vol 11(3), Sep 1999, 235-239. doi: 10.1037/1040-3590.11.3.235. Special Section: I. The Utility of the Rorschach in Clinical Assessment. (Abstract);

Meyer, G.J. (1999b). The convergent validity of the MMPI and Rorschach scales: An extension using profile scores to define response and character styles on both methods and a re-examination of simple Rorschach response frequency. Journal of Personality Assessment, 72, 1-35. (Abstract);

Meyer, G.J. (2001). Introduction to the final Special Section in the Special Series on the utility of the Rorschach for clinical assessment, Psychological Assessment, 13(4), 419-422. (Abstract);

Meyer, G.J., & Archer, R.P. (2001). The hard science of Rorschach research: What do we know and where do we go? Psychological Assessment, 13, 486-502. (Abstract);

Meyer, G. J., Erdberg, P., & Shaffer, T. W. (2007). Towards international normative reference data for the Comprehensive System. Journal of Personality Assessment, 89, S201-S216. (Abstract);

Meyer, G.J., & Handler, L. (1997). The ability of the Rorschach to predict subsequent outcome: A meta-analysis of the Rorschach Prognostic Rating Scale. Journal of Personality Assessment, 69, 1-38. (Abstract);

Meyer, Gregory J. & Viglione, Donald J. (2011). New Developments in Rorschach-Based Behavioral Assessment. (prezentare);

Mihura J.L., Meyer G.J., Dumitrascu N., Bombel G. (2013). The validity of individual Rorschach variables: systematic reviews and meta-analyses of the comprehensive system. Psychol Bull. 2013 May;139(3):548-605. doi: 10.1037/a0029406. (Abstract);

Parker, K. C. H., Hanson, R., & Hunsley, J. (1988). MMPI, Rorschach, and WAIS: A meta-analytic comparison of reliability, stability, and validity. Psychological Bulletin, 103, 367-373. (Abstract);

Ritzler, B., Erard, R., & Pettigrew, G. (2002). Protecting the integrity of Rorschach expert witnesses: A reply to Grove and Barden (1999) re: The admissibility of testimony under Daubert/Kumho analyses, Psychology, Public Policy and Law, 8, 201-215. (Abstract);

Rosenthal, R., Hiller, J.B., Bornstein, R.F., Berry, D.T.R., & Brunell-Neuleib, S. (2001). Meta-analytic methods, the Rorschach and the MMPI, Psychological Assessment, 13, 449-451. (Abstract);

Stricker, G., Gold, J.R. (1999). The Rorschach: Toward a nomothetically based, idiographically applicable configurational model, Psychological Assessment, 11, 240-250. (Abstract);

Viglione, D.J. (1999). A review of recent research addressing the utility of the Rorschach, Psychological Assessment, 11, 251-265. (Abstract);

Viglione, D.J., & Hilsenroth, M.J. (2001). The Rorschach: Facts, fictions and future, Psychological Assessment, 13, 452-471. (Abstract);

Watkins, C.E., Jr., Campbell, V.L., Nieberding, R., & Hallmark, R. (1995). „Contemporary practice of psychological assessment by clinical psychologists”. Professional Psychology: Research and Practice, 26, 54-60. (Abstract);

Weiner, I.B. (2001). Advancing the science of psychological assessment: The Rorschach Inkblot Method as exemplar, Pychological Assessment, 13, 423-432. (Abstract);

Weiner, Irving B., Freedheim, Donald K. Handbook of Psychology, Volume 1: History of Psychology(2003), John Wiley & Sons;

Weiner, Irving B. & Greene, Roger L., Handbook of Personality Assessment (2008), John Wiley & Sons;

James M. Wood. „The Controversy Over Exner’s Comprehensive System for the Rorschach: The Critics Speak” Independent Practitioner (2006). (Abstract);

Wood, J.M., & Lilienfeld, S.O. (1999). The Rorschach inkblot test: A case of overstatement? Assessment, 6, 341-349. (Abstract);

Wood, J.M., Lilienfeld, S.O., Garb, H.N., & Nezworski, M.T. (2000). The Rorschach test in clinical diagnosis: A critical review, with a backward look at Garfield (1947). Journal of Clinical Psychology, 56, 395-430. (Abstract);

Wood, James M.; Lilienfeld, Scott O.; Nezworski, M. Teresa; Garb, Howard N.; Allen, Keli Holloway; Wildermuth, Jessica L. (2010). Validity of Rorschach Inkblot scores for discriminating psychopaths from nonpsychopaths in forensic populations: A meta-analysis. Psychological Assessment, Vol 22(2), Jun 2010, 336-349. (Abstract);

James M. Wood, M. Teresa Nezworski, Howard N. Garb, and Scott O. Lilienfeld. „The Misperception of Psychopathology: Problems With the Norms of the Comprehensive System for the Rorschach” Clinical Psychology: Science and Practice (2001). (Abstract);

Wood, J., Nezworski, M., Lilienfeld, S., & Garb, H. (2003). What’s Wrong with the Rorschach? Science Confronts the Controversial Inkblot Test. San Francisco, CA: Jossey-Bass.

Wood, J. M., Nezworski, M. T., & Stejskal, W. J. (1997). The reliability of the Comprehensive System for the Rorschach: A comment on Meyer (1997). Psychological Assessment, 9, 490-494. (Abstract);

Wood, J. M., Teresa, M., Garb, H. N. and Lilienfeld, S. O. (2001), Problems With the Norms of the Comprehensive System for the Rorschach: Methodological and Conceptual Considerations. Clinical Psychology: Science and Practice, 8: 397–402. doi: 10.1093/clipsy.8.3.397. (Abstract);

 

 

Superstiția și iluzia controlului I

Să vă povestesc o superstiție de-a mea.

Câteodată ascult muzică folosind Winamp și tot câteodată îmi place să ascult melodiile amestecate (adică pe Shuffle). În mod normal, asta ar însemna că Winamp-ul o să aleagă de fiecare dată următoarea melodie în mod întâmplător. Totuși, parcă unele melodii apar mai des decât altele. N-ar fi fain să apară mai des melodiile care îmi plac și mai rar sau deloc cele care nu îmi plac? N-ar fi fain să pot influența alegerile programului? Așa că după multă vreme în care am ascultat muzică în Winamp am început să manifest diverse comportamente. De exemplu, dacă ascultam o melodie și la sfârșit avea o parte de liniște mai lungă (sau, pur și simplu, o parte mai neinteresantă), treceam la următoarea melodie (foloseam tastele globale, astfel că nu trebuia să aduc Winamp-ul în prim plan; era destul să apăs trei taste). Dar vroiam să mai aud acea melodie în viitor, însă n-o mai auzeam (sau cel puțin nu așa de des pe cât aș fi vrut). În schimb, auzeam alte melodii pe care le mai ascultasem. Așa că m-am gândit că sigur trebuie să fie un algoritm mai complicat care să aleagă ce melodie urmează. Nu poate fi doar alegere la întâmplare. Cu siguranță algoritmul ține cont de ceea ce ascult, iar în modul shuffle acele melodii vor apărea mai des.

Winamp-logo

Așadar, cum pot să influențez subtil acest algoritm? Poate că dacă las melodia să cânte până la capăt, o să o aud mai des în viitor. Poate că Winamp-ul „crede” că dacă trec la următoarea înainte să se termine curenta, nu îmi place… curenta. Nu e logic? Adică, de ce să treci la următoarea dacă îți place cea pe care o auzi? Prin urmare, dacă dau next chiar și înainte cu 5 secunde de final, probabil melodia e marcată undeva printr-o bază de date cu atributul „n-o mai pune pe asta, că-i urâtă” și în viitor algoritmul o să o aleagă mai rar decât pe altele pe care le ascult până la capăt. Am făcut așa pentru o vreme și n-am mai sărit la următoarea chiar dacă la sfârșit erau câteva secunde de liniște. O singură problemă a fost: nu funcționa cum vroiam. Asta-i ciudat, nu? Dar am găsit soluția: sigur algoritmul folosit de Winamp este atât de complex încât ține cont și de alte lucruri. Am observat că făceam altceva: când nu îmi plăcea o parte dintr-o melodie săream peste partea care nu-mi plăcea (dădeam melodia cu câteva secunde în față), dar la sfârșit nu dădeam next, ca să nu ajungă pe lista neagră. Sigur algoritmul observă asta și dacă sar chiar și peste 5 secunde dintr-o melodie, o pune automat pe lista neagră. Așa că pentru o vreme am rezistat tentației și n-am mai sărit peste nicio parte din melodiile pe care vroiam să le aud mai des. Toate bune și frumoase până … până după un timp când am început să observ că parcă nu funcționează cum mă așteptam. Am început să mă gândesc cât de complicat au putut să facă algoritmul? Să țină oare cont și de alte lucruri? De exemplu, când îmi place mult o parte dintr-o melodie și sar înapoi câteva secunde să o ascult din nou… poate că algoritmul înregistrează orice salt ca semn că nu îmi place melodia și o pune automat pe lista neagră (o fi vreun bug). În momentul ăsta parcă aș fi descoperit Secretul: poate că Universul nu știe să citească „nu”-urile și le vede pe toate ca „da”.

Simțeam că melodiile nu sunt alese întâmplător și am ajuns să raționalizez asta încercând să găsesc un mod de control. Din cauză că superstiția mea este una strâns legată de tehnologie, probabil că n-o să o întâlnesc la multă lume, dar dacă înlocuiesc „algoritmul” cu o forță supranaturală și Winamp-ul cu natura parcă sună mai cunoscut. Eu am fost surprins când am observat că aveam tendințele pe care le-am descris mai sus pentru că mă așteptam să fiu mai atent la comportamentele superstițioase pentru că le observ repede pe ale altora. O să revin la sfârșit la algoritmul din Winamp.

Ce e cu superstiția asta?

Să începem cu celebrul experiment al lui B.F. Skinner.1 Aveți mai jos o descriere concisă:

Adică Skinner i-a învățat pe porumbei să dea cu ciocul într-un buton ca să primească mâncare. Apoi a schimbat un pic regulile, astfel că mâncarea venea la intervale aleatoare, indiferent de ceea ce făceau porumbeii. Acum porumbeii au început să repete diverse lucruri pe care se nimerea să le facă atunci când primeau mâncare, iar cum mâncarea venea aleator, comportamentul lor este asemănător superstiției.

Bine, dar ăștia-s porumbei! Oamenii s-ar prinde. Nu?

O cercetătoare japoneză s-a gândit să verifice asta, așa că a făcut un experiment2 în care a pus câte un participant într-o cabină unde erau trei mânere. Independent de ceea ce făcea participantul (dar fără ca el să știe asta), în fața lor apărea un numărător care le dădea câte un punct. După fiecare punct pâlpâia o lumină și se auzea un bâzâit. Punctele erau acordate după un interval variabil de 30 secunde în medie (cu o variație între 3 și 57 secunde) sau de 60 secunde în medie (cu o variație între 25 și 95 secunde). Înainte de experiment participanților li s-a spus că nu trebuie să facă nimic, dar dacă fac ceva s-ar putea să primească puncte și ar trebui să adune cât mai multe. Din moment ce participanții nu puteau prezice când o să fie acordate punctele (pentru că intervalul de livrare varia) și oamenii au o tendință naturală să tragă de mânere, unii dintre ei au făcut legătură între (A) tragerea mânerelor și (B) primirea punctelor. Și de aici începe să devină și mai interesant. Participantul 1, de exemplu, s-a întâmplat să primească un punct după ce a tras de mânere în ordinea stânga, mijloc, dreapta, dreapta, mijloc, stânga, așa că a repetat modelul încă de trei ori. Participantul nr. 5 a început trăgând ușor de fiecare mâner, iar punctele se acumulau indiferent de ceea ce făcea el. Dar apoi, din întâmplare, ținea mânerul din mijloc când a primit un punct, așa că de atunci încolo a executat ritualul superstițios de trei trageri scurte urmate de ținerea mânerului din mijloc. Bineînțeles, cu cât ținea mai mult de el, șansele să primească un punct creșteau. După 9 minute din cele 30 (cât dura experimentul), acest participant a devenit convins că a găsit metoda potrivită. Participanta 15 a găsit un ritual și mai ciudat: după 5 minute s-a întâmplat să atingă numărătorul de puncte și exact în acel moment s-a întâmplat să primească un punct. De atunci înainte a început să atingă tot ce putea prin jurul ei, iar cum punctele oricum veneau, și-a întărit încrederea în acest ritual. Pe la minutul 10 s-a întâmplat să primească un punct când a sărit, moment în care a schimbat ritualul de atingere cu ritualul de sărituri. Apoi a primit un punct când s-a întâmplat să atingă tavanul, motiv pentru care n-a rezistat cele 30 minute și a renunțat din cauza oboselii.

three levers

Trei mânere (nu cele din experiment) (sursa)

Un experiment asemănător, dar nu la fel de obositor a fost făcut în 1963 de doi colegi de-ai lui Skinner. Ei s-au gândit să verifice dacă și oamenii devin superstițioși ca porumbeii, așa că le-au zis participanților să apese un buton (dintre cele două pe care le aveau la dispoziție) de fiecare dată când se aprinde o lumină galbenă în fața lor, iar scopul era să acumuleze cât mai multe puncte. Când câștigau un punct, se aprindea și se stingea o lumină verde. Fără ca participanții să știe, doar butonul din dreapta dădea puncte, care erau acordate la un interval variabil (cu o medie de 30 secunde). Rezultatul a fost că oamenii sunt la fel de superstițioși ca porumbeii. Cei mai mulți și-au format câte o combinație între cele două butoane și au rămas cu ea până la sfârșit, deoarece dacă se întâmpla, să zicem, să apese pe butonul din stânga, apoi pe cel din dreapta și apoi să primească puncte, comportamentul era întărit.3

În experimentul de mai sus, cercetătorii au încercat să oprească formarea superstițiilor și au introdus un timp de „răcire”, astfel că dacă butonul din stânga era apăsat, cel din dreapta devenea inactiv pentru o perioadă de timp (adică degeaba îl apăsau, că nu primeau niciun punct). Într-adevăr, ritualurile superstițioase nu s-au mai format, dar la oameni a fost nevoie de un timp de „răcire” mai mare decât la porumbei. Oamenii țin minte mai mult timp. Oamenii sunt foarte buni la găsirea modelelor. Le găsesc chiar și unde nu sunt. Stuart Vyse i-a pus pe participanții la un studiu de-al său să joace un joc video în care tot ce aveau de făcut era să navigheze printr-un labirint și să găsească o ieșire.4 Unii dintre ei (primul grup) primeau puncte dacă găseau o ieșire din partea de jos a labirintului, iar alții (al doilea grup) primeau puncte la întâmplare. La sfârșit au fost întrebați cum cred că au fost distribuite punctele. Cei mai mulți din primul grup au găsit metoda de notare. Și cei din al doilea grup au găsit diverse metode de notare… doar că niciuna nu era corectă.

Toți avem tendința să căutăm modele pe care să le putem folosi pentru a controla lucrurile. Puși să adunăm puncte, căutăm regula după care sunt acordate și încercăm să o folosim. Asta e bine, de cele mai multe ori, doar că atunci când nu există nicio regulă, când ceea ce se întâmplă e doar întâmplător, găsim reguli care nu există și, mai mult de atât, devenim tot mai siguri că le-am găsit pe cele corecte. Eram sigur că am găsit cum să influențez algoritmul din Winamp! Aveam control asupra lui. Câți nu ne gândim că avem control asupra unor lucruri mult mai importante? Nu vrem să locuim la numărul 13 și nu facem lucruri importante într-o vineri, 13, facem trei pași înapoi dacă ne-a trecut o pisică neagră prin față, batem în lemn când am auzit ceva rău, apelăm la vrăji, rugăciuni și talismane norocoase. Totul ca să controlăm câte puncte o să primim, ca să ne controlăm norocul. Și ne dă o senzație plăcută iluzia controlului.

Iluzia controlului

Iluzia controlului apare când avem senzația că putem controla ceva ce nu putem. De exemplu, într-o serie de experimente din anii ’70, Ellen Langer i-a pus pe studenți de la Yale să joace un joc de cărți contra unui adversar. Jocul era simplu: fiecare trage o carte la întâmplare, iar cine a tras cartea mai mare câștigă. La fiecare rundă studenții puteau să pună pariu pe o sumă de la 0 la 25¢. Interesanți erau adversarii: unii dintre studenți au jucat contra unui adversar îmbrăcat frumos care emana încredere, iar alții au jucat contra unui adversar îmbrăcat neglijent în trening?. În ambele situații șansa de a câștiga era aceeași (pachetului de cărți nu-i pasă cu cine joci, nu?). Dar studenții se pare că n-au gândit la fel. Când au jucat contra celui îmbrăcat neglijent au fost mult mai încrezători și au făcut pariuri mai mari, adică s-au simțit în control, chiar dacă era clar că e un joc de noroc.

Un efect asemănător a fost găsit când studenților li s-a cerut să prezică rezultatul unei aruncări cu banul. Aruncarea era trucată: un „coleg” dădea cu banul, dar zicea rezultatele într-o anumită ordine, nu le zicea pe cele reale. Unor studenți li se spunea că au nimerit la primele încercări, altora că nu au nimerit. Succesul inițial a avut o foarte mare influență asupra încrederii studenților că pot prezice rezultatele. Cei care au ghicit la început câteva au devenit convinși că au talentul necesar să facă predicții corecte pentru mai mult de 50% dintre aruncări (cât e de așteptat din întâmplare). Și mai interesante au fost comentariile de după ale studenților: 40% dintre ei credeau că pot să-și îmbunătățească performanța prin antrenament și aveau impresia că sunt mai buni decât ceilalți, chiar dacă în realitate au ghicit la fel de rău.5

Oamenilor le place să exercite control asupra mediului din jurul lor. De aceea oameni care se urcă la volan după o sticlă de wiskey, tremură când avionul în care sunt are turbulențe minore. Senzația de control este însă foarte importantă pentru noi. Psihologul Bruno Bettelheim a observat, de exemplu, că supraviețuirea în lagărele de concentrare naziste „a depins de capacitatea de a aranja și păstra câteva zone de acțiune independentă, pentru a menține controlul asupra unor aspecte importante din viața fiecăruia, în ciuda unui mediu care părea copleșitor”. Alte studii au arătat că senzația de neajutorare și de lipsa de control corelează cu stresul. Într-un studiu șobolanii au fost deprivați de orice control asupra mediului lor și după scurt timp au încetat să mai încerce și au murit. Într-un alt studiu, niște studenți au dat o serie de teste. Chiar și puterea de a controla ordinea testelor le-a redus anxietatea. Ellen Langer, despre care am mai scris mai sus, a mai făcut un experiment cu persoane din căminele de bătrâni. Celor dintr-un grup li s-a spus că pot să decidă cum să-și aranjeze camera și să aleagă o plantă de care să aibă grijă. Cei din alt grup au avut camerele deja aranjate și plantele deja alese și îngrijite de altcineva. După câteva săptămâni cei din primul grup aveau scoruri mai mari la un test de bunăstare. După 18 luni, cei din primul grup aveau o rată a mortalității de doar 15% comparativ cu cei din grupul al doilea (30%).6 Iluzia controlului poate chiar să diminueze durerea percepută. Oamenii tolerează mai multă dacă li se spune că o pot opri oricând, decât dacă cred că nu o pot opri.7

Nevoia noastră de control ne aduce beneficii, însă ne poate și încurca atunci când avem de-a face cu procese întâmplătoare. Ne poate face să încurcăm norocul cu talentul sau acțiunile inutile cu controlul. Cere-le oamenilor să controleze niște lumini apăsând un buton (care nu face nimic) și vor crede că au reușit, deși luminile se aprind la întâmplare. Arată-le oamenilor un cerc de lumini care pâlpâie la întâmplare și spune-le că dacă se concentrează vor reuși să le facă să pâlpâie în direcția acelor de ceas și vor fi uimiți că au reușit. Pune simultan două grupuri de oameni să se concentreze să controleze ordinea în care se aprind luminile (un grup într-o direcție, celălalt în direcția opusă) și li se va părea tuturor că au reușit.6

Cum rămâne cu muzica?

Senzația că în Winamp sunt alese unele melodii mai des decât altele a fost foarte puternică, așa că am încercat să găsesc codul-sursă al programului. Din nefericire, n-am găsit, pentru că Winamp este software proprietar, însă am găsit alte informații. Nu pot să nu observ că de cele mai multe ori la fel se întâmplă și în cazul superstiției: e imposibil să găsești dovada supremă că un comportament este superstițios pentru că întotdeauna pot fi găsite raționalizări bazate pe „forțe supranaturale misterioase”.

Ziceam că am găsit, totuși, ceva. Nu sunt singurul care a ajuns să creadă că redarea aleatoare a melodiilor nu este aleatoare. Oameni pe forumuri ziceau că funcția shuffle din Winamp nu este bună. Dar cel mai interesant e că imediat după ce a fost lansat iPod-ul, foarte mulți utilizatori s-au plâns că melodiile nu sunt redate aleator cu adevărat. Un utilizator zicea:

Primul meu iPod îl iubea pe Steely Dan. La fel și eu. Dar nu așa de mult ca iPod-ul. În 2003, printre cele vreo 3000 melodii din librăria mea iTunes, aveam cam 50 de melodii de la Steely Dan. Dar de fiecare dată când ascultatm «aleator», parcă Steely Dan era ultra-prezent.8

Atât de puternică a fost reacția utilizatorilor încât Steve Jobs a declarat „O să o facem [redarea] mai puțin întâmplătoare, ca să pară mai întâmplătoare”.9 Așa că cei de la Apple au scris un algoritm mai complicat care să facă redarea aleatoare să pară mai aleatoare decât dacă ar fi fost în totalitate… aleatoare. Toate astea pentru că noi, oamenii, nu înțelegem întâmplarea. Ca lucrurile să pară întâmplătoare, trebuie să nu se repete prea des. Dacă dăm de patru ori cu banul și pică pe aceeași parte încercăm să găsim o „explicație” pe care n-am căuta-o dacă am obține, să zicem, BSSB (B=ban, S=stemă). La fel se întâmplă și cu melodiile: dacă auzim mai des o melodie, în timp ce pe alta n-o auzim niciodată, nu pare deloc o întâmplare. Dar este.

Din dorința mea de a mă convinge că algoritmul este aleator, mi-am scris propriul program care ia numele fișierelor dintr-un director (directorul meu cu muzică) și simulează redarea aleatoare folosind funcția Random() din C#. După ce a rulat un pic am observat câteva melodii care au fost „redate” de 6-7 ori, în timp ce multe altele doar 1 dată sau chiar deloc. Mai târziu, aveam melodii redate de 13-14 ori și încă mai existau melodii care n-au fost redate niciodată. După și mai multă vreme, aveam melodii redate de 70 ori, dar și melodii redate doar de 40 ori. Prin acest program nu am redat efectiv melodiile ci doar am vrut să aflu rezultatele funcției random. Așa că probabil algoritmul ăla super-complex din Winamp pe care mi-l imaginam eu este mult mai simplu.

 random_number

(Sursa: xkcd)

Referințe:
1: B.F. Skinner, ”’Superstition’ in the pigeon”, Journal of Experimental Psychology 38 (1948): 168-172;
2: Koichi Ono, “Superstitious Behavior in Humans,” Journal of the Experimental Analysis of Behavior 47 (1987): 261–71.;
3: Charles Catania and David Cutts, “Experimental Control of Superstitious Responding in Humans,” Journal of the Experimental Analysis of Behavior 6, no. 2 (1963): 203–8;
4: Michael Shermer, Why Darwin Matters: The Case Against Intelligent Design [2007], EPUB, Holt Paperbacks, pg. 52;
5: Langer, Ellen. 1975. The Illusion of Control. Journal of Personality and Social Psychology 32 (2), pp. 311-28.;
6: Leonard Mlodinow, The Drunkard’s Walk: How Randomness Rules Our Lives [2008], Pantheon Books, pg. 185-187;
7: T. V. Salomons, T. Johnstone, M.-M. Backonja, and R. J. Davidson, “Perceived controllability modulates the neural response to pain,” Journal of Neuroscience, 24 (2004), 7199–7203. In Hood, Bruce (2012-04-25). The Self Illusion: How the Social Brain Creates Identity (Kindle Locations 5042-5043). Oxford University Press. Kindle Edition.;
8: Articol pe Gagetopedia: Steely Dan and the perceived randomness of the iPod Shuffle;
9: Articol în DailyMail: And now for something completely random;
Info: Generatoarele software de numere aleatoare nu sunt cu adevărat aleatoare și sunt denumite pseudo-random pentru că se bazează pe diverși algoritmi. Funcția (de fapt clasa) Random() din C# folosește un algoritm de-al lui Donald Knuth (subtractive number generator). Mai multe despre algoritm aici (pg. 28) și aici, iar despre Random() aici.

Mit sau Real? Psi: Efectul de catharsis

Poveste:

E mai bine să te „descarci” când ești nervos decât să ții în tine.

AngryWoman

Ce este?

Cuvântul „catharsis” vine din greacă, de pe vremea lui Aristotel și înseamnă „a curăța” sau „a purifica”. Însă efectul de catharsis a devenit popular odată cu Sigmund Freud care era de părere că furia reprimată se adună în mintea unui om la fel cum crește presiunea într-o oală de gătit și când este prea multă răbufnește și provoacă tot felul de probleme. Una dintre soluțiile la care s-a gândit Freud este eliberarea treptată a furiei într-un mod controlat astfel încât să nu se adune niciodată „prea multă”. El doar s-a gândit la asta, n-a făcut niciun experiment prin care să teseze dacă are dreptate sau nu. Și nu este singurul care crede că e mai bine să te descarci. Un sondaj făcut în 1983 asupra studenților la psihologie din primul an a arătat că 66% dintre studenți credeau acest lucru.1

Uitându-ne în cultura populară găsim destule filme în care apare ideea efectului de catharsis. De exemplu, în Cu nașu’ la psihiatru (1999) un gangster (jucat de Robert De Niro) este sfătuit de psihiatrul său să dea cu pumnul într-o pernă de fiecare dată când e nervos; în Network (1976), un prezentator de știri își îndeamnă telespectatorii să își elibereze frustrările strigând pe geam; iar în Al naibii tratament! (2003) personajul jucat de Adam Sandler, sfătuit de un doctor ajunge să arunce cu bile după copii și cu crose de golf. Iar Hulk este o metaforă pentru efectul de catharsis: când liniștitul Bruce Banner adună suficientă mânie se transformă într-un monstru pe care nimeni nu-l poate controla.2

hulk 2Hulk

Nu doar în filme, ci și în cărți de dezvoltare personală (self-help) găsim ideea că e mai bine să ne descărcăm când suntem nervoși. Un autor, John Lee, ne spune să dăm cu pumnii într-o pernă sau într-o geantă și să înjurăm și să strigăm dacă suntem nervoși. Iar dacă suntem nervoși pe o persoană anume, să ne imaginăm fața acelei persoane pe pernă. Alți autori, dr. George Bach și Herb Goldberg, propun o metodă numită Vezuviu (după vulcanul din Italia), în care „indivizii pot să se descarce de frustrări, resentimente, răni emoționale, ostilități și furie printr-o explozie de strigăte”. De asemenea, există produse care să ajute astfel de manifestări. Un astfel de produs este „Puiul de sufocat” (Choke the Chicken) pe care cei care îl cumpără pot să îl strângă de gât ca să se elibereze de furie. Pentru cei care nu au nimic cu puii, există și o jucărie numită „Choking Strangler Boss” (un fel de „Strangulează-ți șeful”) care începe să ceară utilizatorului să stea peste program și alte lucruri enervante, iar când este strâns de gât îi sar ochii din orbite, devine moale și spune că angajatul merită o mărire de salariu.2 Există chiar şi o terapie care face uz din plin de efectul de catharsis. Se numește terapie primală (primal scream therapy) și a fost propusă de Arthur Janov prin anii ’70.

Pe lângă toate astea, pare o metodă logică de a scăpa de furie și cred că foarte multă lume crede că este eficientă. Chiar și eu am crezut mai demult. Până la urmă, mânia aia trebuie să se ducă undeva, nu? Și decât să o ținem în noi, mai bine să o dăm afară.

Haideți să vedem, însă, dacă a fost testată ipoteza aceasta și care au fost rezultatele.

E un mit sau e real ?

Să începem cu un experiment făcut în anii ’90 de un psiholog pe nume Bushman pentru că nu știa dacă furia chiar se eliberează prin manifestarea ei.3 La experimentul său au participat 180 de studenți împărțiți în trei grupuri. Un grup a citit un articol neutru, alt grup un articol care spunea că eliberarea furiei este eficientă, iar al treilea grup a citit un articol care spunea că eliberarea furiei este inutilă. Apoi studenții au fost puși să scrie eseuri pro sau contra unui subiect sensibil și li s-a spus că eseurile lor vor fi corectate de studenți (dar n-a fost așa). După ce studenții și-au primit eseurile înapoi, jumătate aveau pe ele scris „Superb”, iar jumătate „Ăsta-i unul dintre cele mai proaste eseuri pe care le-am citit!”. Apoi Bushman le-a cerut să aleagă o activitate pe care să o facă în continuare, printre care să se uite la o comedie, să joace un joc, să citească o poveste sau să dea cu pumnii într-un sac. Rezultatele: a fost mult mai probabil ca aceia care au citit că efectul de catharsis funcționează și apoi s-au enervat, să aleagă să lovească un sac, decât cei din celelalte grupuri. Așadar, credința în efectul de catharsis ne face să îl și practicăm dacă avem ocazia.

Asta nu e surprinzător, însă Bushman s-a gândit să schimbe un pic experimentul și să îi lase pe studenți să se răzbune. Mai exact, a vrut să vadă dacă furia scade dacă studenții se „descarcă”. Experimentul modificat a fost la fel până la un punct (când au primit eseurile corectate), moment în care studenții care au primit eseurile cu „Ăsta-i unul dintre cele mai proaste eseuri pe care le-am citit!” au fost împărțiți în două grupuri. Participanților din ambele grupuri li s-a spus că va trebui să concureze cu persoana care le-a corectat eseul. Cei din primul grup au dat cu pumnii într-un sac înainte, iar cei din al doilea au stat și au așteptat. Pe urmă a început competiția: apasă un buton cât de repede poți; dacă pierzi o să suporți un zgomot oribil; când câștigi, adversarul tău o să audă acel zgomot. Studenții au fost lăsați să aleagă volumul zgomotului pe care îl va auzi adversarul lor (volum între 0 și 10, unde 10 = 105 dB). Ce credeți că au descoperit? În medie, cei care înainte au dat cu pumnii în saci (să se descarce) au ales un volum de 8,5. Cei care au așteptat liniștiți în loc să dea cu pumnii au ales în medie un volum de 2,47.  Ce înseamnă asta? Înseamnă că aceia care s-au „descărcat” au rămas nervoși după ce s-au „descărcat”, iar celor care au stat liniștiți le-a cam trecut dorința de răzbunare. În studii ulterioare au fost găsite aceleași rezultate (când zgomotul a fost înlocuit cu sos iute, cei care s-au „descărcat” i-au pus pe adversarii lor să mănânce mai mult sos iute, iar când cele două grupuri au fost puse să completeze cuvinte precum ch__e, cei care s-au „descărcat” au ales mult mai des cuvinte precum choke (sufocă) decât chase (urmărește)).

Într-un studiu, oamenii care au bătut cuie după ce i-a insultat cineva, au fost mult mai critici față de acea persoană decât cei care nu au bătut.4 Iar alt studiu a arătat că oamenii care au jucat un sport agresiv (cum ar fi fotbalul american) –care ar trebui să promoveze efectul de catharsis– nu s-au „descărcat”, ci au devenit și mai agresivi.5 Chiar și jucând jocuri video cu violență în ele efectul a fost asemănător: jucătorii nu s-au „descărcat”, ci și-au mărit agresivitatea.6

Într-un alt experiment participanții au fost puși să aleagă ce muzică să asculte în timp ce o să joace un joc în care trebuiau să împuște niște oameni (Soldier of Fortune). Muzica era din trei categorii: neutră, „nervoasă” și energică (dar nu nervoasă). Rezultatele au fost că participanții au ales de cele mai multe ori muzica agresivă și chiar au jucat mai bine ascultând astfel de muzică.8 Asta sugerează că muzica le-a menținut starea de agresivitate sau chiar le-a crescut-o, dar în niciun caz nu i-a ajutat să se descarce. Ipoteza că „descărcarea” cathartică scade furia a fost infirmată de multe studii.7 Așadar, dacă vreți să fiți mai buni la shooter-e vă ajută să fiți nervoși, însă în cele mai multe situații e mai bine să lăsați mânia de-o parte.

De ce pare că funcționează?

Păi, în primul rând, toți ne simțim mai bine după ce ne descărcăm, chiar dacă agresivitatea nu dispare. Când ne descărcăm rămânem nervoși și e mai probabil să ne manifestăm ca niște oameni nervoși ceea ce ne poate aduce și mai multă furie și procesul se repetă. Efectul este asemănător unui drog. Descărcându-ne ne simțim foarte bine (pe moment), păstrăm starea de nervozitate (mascată temporar) și avem impresia că efectul de catharsis funcționează.9 În plus, nu rămânem prea des nervoși pentru foarte multă vreme. Furia și nervozitatea trec de la sine după un timp, iar dacă în acest timp ne-am descărcat putem avea impresia că asta e cauza pentru care nu mai suntem nervoși. Presupunem că dacă un lucru vine după altul, primul este cauza celui de-al doilea (eroare numită post hoc, ergo propter hoc), deși nu este întotdeauna așa.

În al doilea rând, suntem influențați de cei din jur și, văzând că multă lume crede presupunem că este o noțiune ce ține de bunul simț. Iar dacă oamenii din jur nu sunt suficienți, mai vedem și prin filme cum personaje psihiatri recomandă să ne descărcăm și mai aflăm și că psihologi cunoscuți susțin asta (vezi Freud).

Iar în al treilea rând, metafora pe care o folosim este greșită. Lumea vorbește despre furie ca despre o oală în care fierbe apa și din cauza aburului crește presiunea, iar cândva o să răbufnească. Gândindu-ne așa, are foarte mult sens „să lăsăm să iasă” furia afară, pentru că dacă n-o lăsăm să iasă unde o să se ducă? O să se adune atât de multă încât n-o să mai încapă. Așa s-a gândit Freud, așa ne gândim și noi. Însă am văzut că atunci când verificăm prin experimente, rezultatele sunt opuse. Așa că probabil metafora nu este cea mai potrivită, furia nu este ca presiunea dintr-o oală. În schimb ar trebui să privim un pic mai jos – spre foc. Furia funcționează mai mult ca un foc: dacă îi dăm material de ars, arde și chiar cresc flăcările; dacă nu îl întreținem, se stinge de la sine după o vreme. Folosind această metaforă are mai mult sens să nu ne manifestăm agresiv. În special nu în mod intenționat. Manifestările cathartice doar pun lemne pe foc.

fire, coal

Ce-ar fi mai bine să facem?

Dacă nu avem un meci de Call of Duty sau de box ar fi mai bine să nu fim nervoși. Bushman (cel cu experimentele) sugerează să ne amânăm răspunsul, să încercăm să ne relaxăm sau, pentru că uneori e greu să facem asta, să găsim activități care ne distrag atenția de la lucruri agresive. Chiar și distragerea atenției e uneori grea, dar cel mai important e să nu facem în mod intenționat lucruri care ne mențin nervoși.

Studiile sugerează că furia poate fi de ajutor dacă o exprimăm într-un mod constructiv încercând să ajungem la sursa ei.10 De exemplu, dacă m-a enervat prietena că tot întârzie, n-o să rezolv problema începând să urlu la ea, ba chiar o să înrăutățesc situația. Cel mai bine ar fi ca în mod calm dar cu încredere să îmi exprim nemulțumirea („Îmi dau seama că probabil nu faci asta intenționat, dar când întârzii devin supărat.”).

Concluzii

Am văzut că în cultura populară este înfiptă adânc ideea că trebuie să ne descărcăm când suntem nervoși. Am văzut că această idee provine doar din presupuneri, iar când ne uităm la experimentele făcute, lucrurile par să stea exact invers. Pe scurt, ce înseamnă aceste experimente: luăm oameni la întâmplare, îi enervăm, îi punem întâmplător în două grupuri, pe unii îi punem să se „descarce”, iar pe ceilalți să stea liniștiți. La sfârșit observăm că cei care s-au descărcat sunt încă nervoși (poate chiar mai nervoși decât înainte să se descarce), iar celor care au stat liniștiți le-a cam trecut supărarea. Observând aceste lucruri nu putem ajunge decât la concluzia că metafora oalei sub presiune este greșită și că mult mai potrivită ar fi metafora focului: cu cât ne enervăm mai mult sau ne comportăm agresiv, cu atât devenim mai nervoși și mai agresivi, pentru că „punem paie pe foc”. În concluzie, efectul de catharsis este…

Mit sau Real?

Mit

Note:
1: Brown, L. T. (1983). Some more misconceptions about psychology among introductory psychology students. Teaching of Psychology, 10, 207–210;
2: Scott O. Lilienfeld, Steven Jay Lynn, John Ruscio, Barry L. Beyerstein, 50 Great Myths of Popular Psychology: Shatering Widespread Misconceptions about Human Behavior [2010], Wiley-Blackwell, Myth #30: It’s Better to Express Anger to Others than to Hold It in;
3: Bushman, B. J., Stack, A. D., & Baumeister, R. F. (1999). Catharsis,  aggression, and persuasive influence: Self-fulfilling or self-defeating prophecies?, Journal of Personality and Social Psychology 76(3), 367–376.;
4: în Scott O. Lilienfeld: Hornberger, R. H. (1959). The differential reduction of aggressive responses as a function of interpolated activities. American Psychologist, 14, 354.;
5: în Scott O. Lilienfeld: Patterson, A. H. (1974). Hostility catharsis: A naturalistic quasi experiment. Personality and Social Psychology Bulletin, 1, 195 197.;
6: în Scott O. Lilienfeld: Anderson, C. A., & Bushman, B. J. (2002). Media violence and the American Public revisited. American Psychologist, 57, 448–450.; Anderson, C. A., Gentile, D. A., & Buckley, K. E. (2007). Violent video game effects on children and adolescents. New York: Oxford University Press.;
7: Lohr, J. M., Olatunji, B. O., Baumeister, R. F., & Bushman, B. J. (2006). The psychology of anger venting and empirically supported alternatives that do no harm. Scientific Review of Mental Health Practice, 4, 54 65.;
8: Maya Tamir, Christopher Mitchell, and James J. Gross, “Hedonic and Instrumental Motives in Anger Regulation,” Psychological Science 19 (2008): 324–328;
9: Bushman, B. J. (2002). Does venting anger feed or extinguish the flame? Catharsis, rumination, distraction, anger, and aggressive responding. Personality and Social Psychology Bulletin, 28, 724–731;
10: Littrell, J. (1998). Is the re-experience of painful emotion therapeutic? Clinical Psychology Review, 18, 71–102.;
Extra: Daniel David, Steven Jay Lynn, Albert Ellis, Rational and Irrational Beliefs: Research, Theory and Clinical Practice [2010], Oxford University Press, Cap. 15: The Five Great Myths of Popular Psychology: Implications for Psychotherapy, The Myth of Catharsis, disponibilă aici;

Mit sau Real? Psi: Testul „Desenează-o-persoană”

Poveste:

Din felul în care desenezi o persoană, un psiholog poate să afle multe lucruri despre tine.

Exemplu de persoane desenate

Ce este?

Unul dintre testele folosite de unii psihologi pentru a afla caracteristici ale personalității cuiva sau dacă are vreo problemă psihologică este așa-numitul test „desenează-o-persoană” (sau testul Omulețului, desenul omului, testul Machover etc.; în engleză: Draw-a-person Test), care a ajuns și în cultura populară (ex.: în emisiuni TV). Cea mai răspândită utilizare este ca test proiectiv.

În ce constă?

Se prezintă subiectului o foaie de hârtie, un creion și o gumă de șters și i se cere să deseneze o persoană. Între timp, examinatorul notează diverse indicii (ordinea de desenare a părților, comentarii etc.), apoi îi cere subiectului să mai deseneze o persoană, de sex opus pe o altă foaie de hârtie. Apoi, examinatorul interpretează desenele pentru a afla caracteristici de personalitate, stări emoționale, prezența unor tulburări (psihopatologie), inteligența ș.a. despre cel care a desenat.

Cum se interpretează?1

Pentru interpretare, trebuie analizate mai multe lucruri:

a). Imaginea de ansamblu

Examinatorul își formează o imagine de ansamblu încercând să răspundă la întrebări despre desen precum: este mare sau mic? Schematic sau complex? Armonios sau nearmonios? Ce exprimă postura? Este vesel sau trist? Este tânăr sau bătrân? Conține elemente bizare? Ce diferențe există între cele două persoane desenate? Ce elemente au fost scoase în evidență și ce elemente omise? Câteva exemple:

  • Poziția sau atitudinea persoanei desenate: siluetele  în mișcare sugerează o fire dinamică, energică; siluetele înclinate sugerează nesiguranță; siluetele în profil sugerează tendințe evazive, prudență;
  • Diferențe mari între silueta masculină și cea feminină: dacă silueta de același sex este desenată mare, detaliat, iar cea de sex opus este schematică și mică, sugerează o atitudine narcisistă;
  • Accentuarea sau îngroșarea unor elemente: sugerează importanța acestora; de exemplu, accentuarea buzelor, sânilor sau părului sugerează dorințe erotice intense sau exhibiționism sexual;
  • Tratarea superficială a unor elemente: sugerează conflicte;
  • Elemente bizare (copite, cap triunghiular, organe interne): sugerează anormalitate;

b). Analiza formală

Constă în analiza trăsăturilor și a spațiului grafic. De exemplu, liniile zimțate sau ascuțite la extremități reprezintă agresivitate, liniile întrerupte reprezintă nesiguranță, iar cele abia schițate lipsă de energie. Un desen mic în partea de jos a foii reprezintă inhibare și neadaptare; în partea de sus a foii sugerează ancorare solidă în realitate sau nevoie de putere ori expansiune. Un desen făcut în partea stângă sugerează retragere în trecut, atitudine pasivă, teamă, orientare spre interior. Unul făcut în partea dreaptă sugerează orientare spre viitor sau spre exterior. Un desen mare sugerează megalomanie sau centrarea pe sine.

c). Analiza de conținut

Constă, în mare parte, în analiza părților corpului persoanei desenate. Pe scurt, elementele analizate sunt:

  • Capul: este principalul element de expresivitate emoțională, prin urmare are un rol foarte important în recunoașterea atitudinii și dispoziției celui care a desenat. Câteva interpretări: cap mare comparativ cu restul corpului înseamnă o supravalorizare a funcțiilor cerebrale; cap mic = complex de inteligență sau inabilitatea de a-și controla impulsurile; gură deschisă = atitudine pasivă, așteaptă să primească; gură strâmbă = depresie sau dezamăgire; dinți ascuțiți = agresivitate; ochi fără pupile = blocaj emoțional, depresie; ochi foarte mici = închidere față de lume; ochi foarte mari = paranoia; păr mare/abundent = preocupări sexuale sau agresivitate; barbă la bărbați = masculinitate; urechi mari = suspiciune, teamă de bârfe; nas mare = virilitate, dominanță; nas turtit = prezența unei traume;
  • Gâtul: prezența unei strangulări (guler, cravată) sugerează inhibiții afective sau control în exprimarea emoțiilor;
  • Trunchiul: masiv = dorință de putere, masculinitate; subțire = fragilitate, sentimente de inferioritate; sâni la femei = maturitate, sexualitate; talie scoasă în evidență = inhibare sau reprimare a impulsurilor sexuale;
  • Membrele: lipsa mâinilor = sentimente de neadaptare sau neîndemânare; gheare la mâini = agresivitate; mâinile desenate la spate = dorința de a ascunde ceva; picioare lungi și groase = independență; picioare subțiri = lipsă de autonomie; coapse exagerate = tendința de exprimare erotică; siluete stând pe vârfuri = ambiție;
  • Accesoriile: rochii decoltate sau transparente = impuls sexual; șapcă = dorința de prestigiu; bijuterii sau tatuaje prea multe = narcisism, dorința de a ieși în evidență;

Dacă doriți să aflați mai multe detalii, puteți citi articolul Testul desenul omului, de unde am preluat și unele elemente de mai sus.

Versiuni

Există mai multe versiuni ale acestui test. Pe lângă varianta prezentată mai sus există și testul „Casă-Copac-Persoană” (House-Tree-Person Test), „Desenarea kinetică a familiei” (Kinetic Family Drawing) (desenarea unei familii „făcând ceva”) sau DAP: SPED (Draw-A-Person: Screening Procedure of Emotional Disturbance).

Exemplu de desen Casă-Copac-Persoană

Citind despre aceste teste și în special despre felul în care se interpretează, am un sentiment că trebuie să funcționeze, pentru că sună bine, are sens. Unii oameni se opresc aici și nu mai verifică dacă acest tip de test funcționează. Însă, ar fi greșit să ne oprim aici. Multe lucruri sună bine, dar nu toate funcționează. Hai să vedem ce spun dovezile.

E un mit sau e real ?

Căutând mai adânc, lucrurile par să stea altfel. O să încep cu un studiu simplu (să vedem ce rezultate a avut) și apoi o să prezint rezultatele unei meta-analize. O meta-analiză e o analiză a mai multor studii pe același subiect, comparând rezultatele lor. Astfel beneficiem de rezultatele unui număr mare de studii sintetizate într-unul singur.

În 1967, doi psihologi, soții Chapman, s-au gândit să verifice cât de bine funcționează testele ce presupun desenarea unei persoane, pentru că erau la modă în acea vreme (și mai sunt și acum). Multe dintre elementele acestui tip de test par să se potrivească destul de bine cu stereotipurile pe care le au oamenii și e posibil să fie doar atât: niște stereotipuri. Pentru a testa această idee, cei doi psihologi le-au dat studenților dintr-un grup desene făcute de niște pacienți din instituții psihiatrice, împreună cu scurte descrieri ale simptomelor (ex.: „Este suspicios” sau „Îi este teamă că nu este destul de bărbat”). După ce s-au uitat pe desene, participanții au fost întrebați dacă au descoperit modele. În mod interesant, ei au găsit aceleași tipuri de modele pe care profesioniștii le-au folosit ani de zile. Au descoperit, de exemplu, că paranoicii desenează ochi atipic de mari, cei ce se tem că nu sunt destul de bărbați desenează persoane cu umerii foarte mari sau că organele sexuale mici în desene sunt indicatori ai impotenței.2

Să fie japonezii? mai paranoici decât restul?!

Stai un pic! Niște amatori au re-descoperit modelele pe care profesioniștii le foloseau de mai multă vreme? Asta înseamnă că modelele acelea trebuie să fie reale. E o confirmare că profesioniștii știu ce fac. Deci testul „desenează-o-persoană” funcționează?! Așa pare, dar cel mai surprinzător lucru doar acum urmează: perechile desen-descriere au fost făcute… la întâmplare! Participanții au văzut invizibilul, au descoperit niște modele false. Desenele paranoicilor nu aveau descrieri de tip „este suspicios”. Participanții au văzut ochi mari acolo unde s-au așteptat să vadă și i-au ignorat unde nu se așteptau să vadă. Asta a fost valabil pentru toate modelele pe care le-au „descoperit”. Acest experiment a discreditat testul desenării unei persoane.

Dacă încă nu sunteți convinși, citiți în continuare o sinteză a meta-analizei făcute de Scott O. Lilienfeld și alții.3 Toate studiile la care fac referire mai jos sunt documentate în meta-analiza lui Lilienfeld, așa că puteți verifica în lucrarea originală (am pus un link la referința 3).

În termeni mari, există două abordări ale testului desenării unei persoane. Una este abordarea individuală, propusă de Karen Machover și pune accent pe elemente izolate (ex.: ochi mari). Conform lui Machover, multe semne sunt asociate cu trăsături de personalitate și trăsături psihopatologice. De exemplu, cum am văzut și mai sus, ochii mari sunt asociați cu paranoia, cravata lungă cu agresivitatea sexuală, lipsa trăsăturilor faciale cu depresia, umbrele îngroșate cu impulsurile agresive și ștersăturile dese cu anxietatea. Tot Machover a zis și că persoana desenată întruchipează caracteristicile psihologice centrale ale celui ce a desenat. Cea de-a doua abordare este cea globală, propusă de Elizabeth Koppitz prin anii ’60, care a dezvoltat un sistem de 30 de indicatori pentru desenele făcute de copii. Acești indicatori sunt apoi însumați pentru a obține un scor de neadaptare.

Consistența/Certitudinea

Consistența statistică între evaluatorii testului desenării unei persoane variază în diverse studii. O consistență mare se obține dacă cei ce evaluează obțin aceleași rezultate. O consistență slabă se obține când… fiecare e cu părerea lui. Așadar, e important să existe o consistență mare la evaluarea desenelor. Unele studii au găsit consistențe de peste 0,80, altele consistențe variind între 0,45 și 0,96 (pentru „umbre = agresivitate”) sau între -0,13 și 0,60 (pentru expresii faciale). Și consistența la testare-retestare variază. Unele studii au găsit consistențe între 0,74 și 0,90, altele între 0,81 și 0,99. Rezultatele în ceea ce privește consistența au fost în general acceptabile. Consistența medie internă a unei versiuni a testului a fost 0,86 pentru scorul total. Ce înseamnă numerele astea? O consistență între 0,80 și 0,90 este considerată bună, una peste 0,90 este excelentă (1,00 este valoarea maximă). În concluzie, consistența statistică a testului „desenază-o-persoană” este foarte bună. Totuși, consistența nu spune nimic dacă nu există validitate.

Validitatea

O problemă în evaluarea validității testului este că multe dintre ipoteze sunt greu de falsificat. Ce înseamnă asta? Păi, de exemplu, puși în fața descoperirilor negative, susținători ai acestui test vin cu explicații cum ar fi că persoanele patologice, în contrast cu cele normale, pot să deseneze figuri care sunt ori prea mari ori prea mici, au linii ori prea groase, ori prea subțiri, adaugă ori prea multe ori prea puține detalii sau că îngroșarea liniilor și ștersăturile dese pot să însemne fie prezența anxietății, fie prezența eforturilor reușite împotriva anxietății (adică lipsa ei) etc. Alte explicații insistă că uneori desenul nu e modul prin care oamenii aleg să-și exprime problemele (și de aceea, când testele nu funcționează nu e nicio problemă), dar nu dau nicio explicație de ce se întâmplă asta și, mai ales, când. Prin urmare, validitatea testului este foarte scăzută din cauză că aproape price descriere este considerată „bună”. Acesta este și unul dintre motivele principale pentru care consistența este mare. Dar, cum ziceam, consistența fără validitate nu înseamnă nimic. Majoritatea covârșitoare a studiilor au găsit o validitate neglijabilă sau zero în cazul testului „desenează-o-persoană”.

Într-o evaluare a literaturii publicate din 1967 până în 1982 s-a descoperit că există susținere moderată doar pentru 2 din cei 30 de factori: trunchiurile rotunde (în opoziție cu cele pătrate) indică trăsături feminine de personalitate, iar desenele colorate sunt un semn de anxietate. În schimb, nu s-a găsit nicio legătură între urechile mari și paranoia, desenarea organelor interne și schizofrenie, accesorii cum ar fi cuțite sau pistoale și delincvență, scoaterea în evidență a părului și impulsuri sexuale ș.a. De asemenea, nu s-a găsit nicio corelație semnificativă între mărimea, înălțimea sau greutatea desenatorului și cele ale figurii desenate.

Într-un studiu făcut de Joiner, Schmidt și Barnett, rezultatele legate de mărime, nivel al detaliilor și grosimea liniilor au fost negative. Deși consistența evaluatorilor a fost mare (între 0,91 și 0,95) (adică toți au ajuns la aceleași rezultate, nu s-au contrazis), niciunele dintre rezultate nu s-au potrivit cu felul în care erau în realitate persoanele care au desenat (au fost evaluate semne ale depresiei și ale anxietății la pacienți patologici). De exemplu, mărimea figurii se crede că este invers asociată cu depresia (adică figură mică = depresie mare), dar studiile au arătat că între ceea ce evaluatorii au dedus din desene și cum erau, de fapt, cei care le-au desenat corelația este nesemnificativă). La fel, și nivelul de detaliu ar trebui să coreleze invers cu anxietatea (adică anxietate mare = detalii puține), dar și în acest caz legătura a fost nesemnificativă. Alt studiu, făcut de Dudley et al. a găsit că persoanele deprimate, de fapt, e mai puțin probabil să deseneze fețe din profil (contrar a ceea ce se crede), iar Cvetkovic a găsit că schizofrenicii e mai puțin probabil să deseneze capete fără corp (din nou, contrar credințelor).

Ca răspuns la descoperirile ce sugerau că testul desenării unei persoane este invalid, susținătorii lui au zis că, de fapt, în practică nu se pune accent pe semne individuale. Afirmația asta e doar o scuză, pentru că în 1995 doi psihologi, Smith și Dumont, au făcut un experiment în care au participat 36 de psihologi clinicieni ce foloseau testul desenării unei persoane (dar și alte tehnici proiective) și au înregistrat comentariile acestora în timp ce interpretau desenele. Din 22 de clinicieni, 20 au tras concluziile bazându-se pe semne specifice. De exemplu, comentariile unui clinician: „Ochii săi sunt bizari și supra-accentuați. Cred că are probleme cu bărbații, cu o suspiciune paranoică”.

Totuși, există indicii că o abordare globală poate obține validitate modestă în detectarea psihopatologiei (a se reține: modestă). De exemplu calitatea slabă a desenului poate indica o problemă. Într-un studiu de Tharinger și Stark au fost evaluați 52 de copii care aveau ori tulburare emoțională, ori tulburare de anxietate, ori nimic. O analiză a semnelor individuale n-a dat niciun rezultat semnificativ, dar o analiză globală a reușit distingerea copiilor normali de cei cu o tulburare. Însă analiza globală nu s-a bazat pe tehnicile proiective din testul desenării unei persoane, ci pe indicatori generali ai psihopatologiei (ex.: lipsa bunăstării emoționale sau inumanitatea figurii desenate). În schimb, studii făcute de Naglieri și Pfeiffer, în care au încercat să diferențieze între 54 de copii și adolescenți cu tulburare de comportament și 54 fără, au descoperit că scorul celui de-al doilea grup a fost mai mare decât al primului, adică cei din al doilea grup au fost identificați greșit ca având tulburare de comportament.

Inteligența și talentul artisitc

O parte din validitatea (și așa mică) a testului „desenează-o-persoană” este dată de evaluarea talentului artistic sau a inteligenței. În ce privește inteligența, s-a găsit o corelație medie între IQ și scorul la testul desenului. În acest caz „medie” nu e suficient de bună. În ce privește talentul artistic, e de așteptat să aibă un efect, având în vedere că oamenii sunt puși să deseneze. Din cauză că nu este luat în calcul, apar erori de interpretare. De exemplu, unele părți ale corpului sunt mai greu de desenat decât altele, în special pentru copii, ceea ce face ca desenele lor să fie interpretate ca semn al neadaptării. Pe scurt, cei care nu au talent artistic riscă să fie diagnosticați ca patologici. Analize făcute de mai mulți psihologi sugerează că abilitatea astistică este determinantul cel mai important al variației figurilor. Într-un studiu făcut de Cressen în 1975, evaluările psihologilor au fost influențate de talentul artistic. Psihologii din experiment au trebuit să identifice schizofrenicii dintr-un grup de oameni (unii cu schizofrenie, alții fără) și nu s-au descurcat mai bine decât dacă ar fi ales la întâmplare, iar cei care au fost „identificați” ca schizofrenici au fost predominant cei netalentați la desen. A, și pentru a fi siguri, în realitate nu este nicio legătură între talentul artistic și schizofrenie.

În final, nici experiența evaluatorului nu îmbunătățește calitatea diagnosticului.

Concluzii

Am văzut, în mare, în ce constă testul „desenează-o-persoană”, am văzut cum sunt interpretate desenele și am văzut că este într-un mod foarte intuitiv. Chiar și pe mine ca sceptic m-a atras acest test când am citit despre tehnicile folosite pentru că sunt interesante (în general tehnicile proiective sunt interesante). Totuși, chiar dacă sună bine, nu putem să presupunem că funcționează. Și testele trebuie testate. Am văzut diverse studii și concluzia este clară: testul „desenează-o-persoană” este un dezastru. Toate utilizările proiective ale sale sunt inutile. Tot ce poate să spună acest test este cât de mult talent are la desen persoana evaluată și, într-un mod limitat, nivelul de dezvoltare cognitivă a unui copil (dacă desenează o persoană formată din cap și membre e mai puțin dezvoltat decât un copil care desenează și corpul).

Testul „desenează-o-persoană” nu vă poate spune ce trăsături are cineva sau dacă este bolnav!

Mit sau Real?

Note:

1: Monica Licu, „Desenul persoanei – Testul Machover – și rolul lui în procesul educațional”; și Testul desenul omului (Consultanță Psihologică);
2: L. J. Chapman and J. P. Chapman (1967). ‘Genesis of popular but erroneous psychodiagnostic observations’. Journal of Abnormal Psychology, 72, pg. 193–204; (Abstract)
3: Scott O. Lilienfeld, James M. Wood, Howard N. Garb, „The Scientific Status of Projective Techniques”, Psychological Science in the Public Interest, Nov. 2000, vol. 1, no. 2; Secțiunea Human Figure Drawing Methods; (Abstract)

 

The Science of Attraction

[Notă: acest articol este foarte pop-science, nu-l luați foarte în serios. Considerați că e probabil ca rezultatele unor studii individuale să fie greșite – mai multe detalii în acest articol]

Dacă tot e ziua îndrăgostiților o să o folosesc ca pretext pentru a scrie despre atracție. Nu despre atracția gravitațională; despre atracția interpersonală (de la „fizică” la „romantică”). Pe tema asta s-au scris o mulțime de cărți de auto-educare/dezvoltare personală (self-help) care promit minuni. De la The Secret (care ne spune că trebuie doar să ne dorim și vom obține) până la cărți de tip The Layguide: How to Seduce Women More Beautiful Than You Ever Dreamed Possible No Matter How You Look Like or How Much You Make (care prezintă metode detaliate despre… vă dați seama din titlu), toate promit soluții magice pentru a găsi ori „iubirea perfectă” ori pentru a agăța fete, iar metodele propuse variază în eficiență de la complet nefuncționale la parțial funcționale. Ce reușesc aproape toate să facă este să crească încrederea cititorilor și astfel să-i determine să încerce să obțină ce vor, ceea ce este mai bine decât să nu încerce. Dar nu e nicio magie.

Totuși, atracția a fost studiată și s-a descoperit că unele lucruri funcționează mai bine decât altele, dar este doar un efect statistic. Atâta timp cât țineți cont de asta și nu vă așteptați la minuni, rezultatele studiilor următoare (și a altora asemănătoare) pot fi utile. Enjoy!

  1. Ceva roșu: într-o serie de 7 experimente s-a demonstrat că femeile îi percep pe bărbați ca fiind mai atrăgători dacă sunt pe un fundal roșu sau poartă o haină de culoare roșie;
  2. Toți bărbații buni sunt „luați”: într-un experiment participantele au fost întrebate dacă ar dori să înceapă o relație cu un bărbat. Unora li s-a spus că bărbatul este singur, altora că are o iubită. Doar 59% dintre femei au dorit o relație dacă au crezut că e singur, în timp ce 90% și-au dorit o relație dacă au crezut că nu e singur. Simplul fapt că era dorit de o altă femeie i-a crescut atractivitatea. Așa că, prin definiție, toți bărbații buni sunt „luați” pentru că asta îi face „buni”. Studiul a verificat și situația inversă și s-a observat că în cazul bărbaților efectul nu funcționează: atractivitatea unei femei nu variază dacă e într-o relație sau e singură; (a)
    Într-un alt studiu s-a observat că femeile preferă bărbații pe care i-au văzut în poze în care alte femei le zâmbeau (dacă acele femei au fost descrise pozitiv); (b)
    Într-un alt studiu s-a observat că femeile îi consideră mai atrăgători pe bărbații care apar în poze alături de alte femei (comparativ cu aceeași bărbați care apar singuri); iar bărbații le-au considerat mai puțin atrăgătoare pe femeile care apăreau în poze alături de alți bărbați (comparativ cu cele care apăreau singure); (c)
    Așadar, știți ce poze să vă puneți pe Facebook 😉
  3. Inteligența e sexy: într-un experiment, 204 femei participante au trebuit să aleagă ce bărbați preferă după ce au urmărit mai multe videoclipuri cu aceștia făcând diferite activități. S-a observat că femeile au preferat bărbații mai inteligenți (fără să știe asta în mod conștient);
  4. Umorul este atrăgător: s-a observat că femeile apreciază mai mult replicile amuzante decât complimentele;
  5. Foamea contează: într-un studiu s-a observat că bărbații flămânzi preferă femeile mai grase. Cercetătorii britanici i-au întrebat pe studenții care intrau sau ieșeau dintr-o cantină studențească să aprecieze atractivitatea unor fete din poze. Cei care intrau (deci erau flămânzi) au dat note mai mari fetelor mai grase, comparativ cu cei care ieșeau (erau sătui);
  6. Vorbiți despre ce NU vă place: cei care povestesc despre lucruri cu care ambii nu sunt de acord se apropie mai mult decât cei care vorbesc despre subiecte cu care ambii sunt de acord. Bineînțeles, dacă discută în contradictoriu nu există multe șanse de a se apropia;
  7. Zâmbește și înclină capul: zâmbetele false de obicei nu produc același efect ca și cele reale. Totuși, ca să pară real, un zâmbet trebuie să dureze mai mult și să fie asociat de o înclinare a capului ori în față ori într-o parte;
  8. Iubire sau atracție fizică?: într-un experiment, mai multe cupluri au fost filmate în timp ce discutau fie despre dragoste (romantică), fie despre atracție fizică. Înregistrările au fost apoi analizate pentru a descoperi elementele non-verbale specifice. S-a observat că în cazul discuțiilor despre dragoste, partenerii aveau corpurile înclinate unul spre altul, zâmbeau și dădeau din cap în semn de aprobare. În cazul celor care discutau despre atracție fizică s-a observat mai mult tendința de a își mușca sau linge buzele;
  9. Împărtășește ceva personal: pentru că produce o senzație de apropiere și intimitate mai repede decât discuțiile despre alte subiecte;
  10. Sperieturile sunt bune: în mai multe experimente s-a observat că persoanele într-o stare de stimulare ridicată îi văd pe ceilalți mai atrăgători decât într-o stare normală. Într-un parc de distracții au fost abordați potențiali participanți și au fost puși să aprecieze atractivitatea unor persoane înainte sau după ce au fost într-un montagne russe. Înainte au fost note mai mici, iar după au fost note mai mari (participanții care au dat note n-au fost aceeași și înainte și după, e un rezultat statistic). Așadar, la prima întâlnire, mergeți la un film horror în locul unuia romantic;
  11. Găsește-ți un prieten mai urât: Dan Ariely a făcut un experiment ingenios. A folosit fotografii ale unor studenți pe care le-a modificat astfel încât să producă o variantă mai urâtă a lor (i-a făcut un pic asimetrici). Apoi a prezentat participanților câte trei fotografii: cea originală, cea „urâtă” și una cu un alt student. Efectul observat a fost următorul: studenții care erau prezentați alături de o variantă mai urâtă a lor au fost apreciați ca fiind mai atrăgători. Simpla existență a unei variante mai urâte îi făcea (pe cei originali, nemodificați) mai atrăgători. Și nu doar atât, dar îi făcea preferabili celorlalți. Cu alte cuvinte, dacă ai un prieten care seamănă cu tine (sau un frate), dar care e puțin mai urât decât tine, ia-l cu tine când mergi în cluburi/baruri pentru că o să fi văzut ca fiind mai atrăgător decât ești, comparativ cu alții care nu au lângă ei „o variantă mai urâtă” a lor. Surprinzător. Despre experimente asemănătoare, dar din domeniul economic vorbește Dan Ariely în prezentarea sa de la TED (în special la 12:40);
  12. Sincronizați-vă!: s-a observat că mișcările sincronizate duc la apariția sentimentelor de apropiere și de compasiune între oameni. Simpla bătaie a ritmului în mod sincron poate apropia doi oameni. Acest lucru se poate aplica și când vine vorba de atracția fizică sau romantică. Dansați sincronizați!
  13. Atingeri, atingeri: atingerea duce la producerea de oxitocină care are ca efect calmarea și creșterea armoniei sociale, precum și un sentiment de apropiere. Primatele nu se îngrijesc (groom) doar pentru a păstra igiena, ci pentru a îmbunătăți relațiile sociale. În cazul oamenilor (dar și al primatelor), zonele care produc mai multă oxitocină la atingere sunt gâtul și spatele. De aceea oamenii care merg la masaj au tendința de a avea încredere în masori;
  14. Pupilele: se dilată dacă persoana vede ceva interesant sau ceva ce îi place. Pupile nedilatate înseamnă de obicei lipsă de interes, plictiseală, frică, tristețe etc. Dacă pupilele a două persoane sunt „sincronizate” ca grad de dilatare înseamnă că au empatie mare una față de alta. Pupilele se mai dilată și când facem calcule (de exemplu 73×84), dar asta nu-i o problemă. Cel mai important pentru a observa reacțiile emoționale ale cuiva e să îi urmărim pupilele.

Dacă vreți să aflați mai multe, vă recomand:

Science of Attraction 

Science of Attraction: The Halo Effect

Richard Wiseman: http://richardwiseman.files.wordpress.com/2011/09/love.pdf (o variantă foarte scurtă a capitolului 5 „Attraction” din cartea 59 Seconds: Think a Little, Change a Lot);

Psychology Today, despre atingeri: http://www.psychologytoday.com/blog/the-attraction-doctor/201202/how-flirt-and-seduce-touch-part-1

Referințe:
[1]: Andrew J. Elliot et al., „Red, Rank and Romance in Women Viewing Men„, Journal of Experimental Psychology, Vol. 139(3), Aug. 2010, 399-407;
[2]: (a): J. Parker, M. Burkley, „Who’s chasing whom? The impact of gender and relationship status on mate poaching„, Journal of Experimental Social Psychology, Vol. 45, July 2009, pg. 1016; și Kevin Eva, Timothy Wood, „Are all the taken men good? An indirect examination of mate-choice copying in humans„, Canadian Medical Association Journal, Dec. 2006, vol. 175, no. 12;
(b): Simon Chu, „I like who you like, but only if I like you: Female character affects mate-choice copying„, Personality and Individual Differences, vol. 52, Apr. 2012, p. 691;
(c): David M. Buss, Sarah E. Hill, „The Mere Presence of Opposite-Sex Others on Judgements of Sexual and Romantic Desirability: Opposite Effects for Men and Women„, Personality and Social Psychology Bulletin, Mar. 2008, vol. 34, no. 5, p. 635;
[3]: Mark Prokosch et al., „Intelligence and mate choice: intelligent men are always appealing„, Evolution and Human Behavior, vol. 30, Jan. 2009, p. 11;
[4]: Matthew Cooper et al., „Chat-up lines as male displays: Effects of context, sex and personality„, Personality and Individual Differences, vol. 43, Oct. 2007, p. 1075;
[5]: V. Swami, M. Tovée, „Does hunger influence judgements of female physical attractiveness?„, British Journal of Psychology (2006), 97, 353-363;
[6]: Bosson, J. K., Johnson, A. B., Niederhoffer, K., & Swann, W. B., Jr. (2006). „Interpersonal chemistry through negativity: Bonding by sharing negative attitudes about others„. Personal Relationships, 13, 135–150;
[7]: Krumhuber, E., Manstead, A. S. R., & Kappas, A. (2007). „Temporal aspects of facial displays in person and expression perception: The effects of smile dynamics, head-tilt, and gender„. Journal of Nonverbal Behavior, 31, 39–56.;
[8]: Gonzaga, G. C., Turner, R. A., Keltner, D., Campos, B. C., & Altemus, M. (2006). „Romantic love and sexual desire in close bonds„. Emotion, 6, 163–179.;
[9]:Aron, A., Melinat, E., Aron, E. N., Vallone, R., & Bator, R. (1997). „The experimental generation of interpersonal closeness: A procedure and some preliminary findings„. Personality and Social Psychology Bulletin, 23, 363-377;
[10]: Meston, C. M., & Frohlich, P. F. (2003) „Love at first fright: Partner salience moderates roller coaster-induced excitation transfer„. Archives of Sexual Behavior, 32, 537-544;
[11]: Constantine Sedikides, Dan Ariely, and Nils Olsen, „Contextual and Procedural Determinants of Partner Selection: On Asymmetric Dominance and Prominence,” Social Cognition (1999);
[12]: David DeSteno, Piercarlo Valdesolo, „Synchrony and the Social Tuning of Compasion„, Emotion (2011), vol. 11, p. 262;
[13]: John T. Cacioppo & William Patrick, Loneliness, Human Nature and the Need for Social Connection [2009], W.W.Norton & Company, pg. 157-160;
Kerstin Uvnäs-Mober, „Oxytocin may mediate the benefits of positive social interaction and emotions” (1998), Psychoneuroendocrinology, vol. 23, p. 819-835;
[14]: http://en.wikipedia.org/wiki/Pupil#Psychological_effects ;
http://www.journalofvision.org/content/4/8/103.short