psihologija

Šum. Lutrija u odlučivanju. Kad presuda, dijagnoza ili liječenje ovise o vremenu i dobu dana

Zvonimir Galić / 23. srpnja 2021. / Članci / čita se 13 minuta

Razlike u ukusima ili mišljenjima su uobičajene i mogu biti konzistentne. Šum je nekonzistentnost u odlučivanju zbog koje ishodi ovise o irelevantnim faktorima, objašnjava Zvonimir Galić u prikazu knjige Noise: A Flaw in Human Judgment. Uz klasificiranje oblika šuma autori daju i prijedloge kako ga minimizirati

  • Naslovna ilustracija: Knjiga Noise i autori Kahneman, Sibony, Sunstein
  • Zvonimir Galić je izvanredni profesor na Odsjeku za psihologiju Filozofskog fakulteta u Zagrebu. Trenutačno je voditelj istraživačkog projekta „Implicitna ličnost, donošenje odluka i vođenje u organizacijama“ koji financira Hrvatska zaklada za znanost.

Brojni su primjeri da u svim domenama postoji nepotrebna i nepoželjna raznolikost u profesionalnim prosudbama. Primjerice, veliki skupovi podataka prikupljeni unutar američkog pravnog sustava pokazuju da suci donose strože presude na kraju dana kao i prije pauze (na početku radnog dana i neposredno nakon ručka nešto su blaži).  Pregled više od 200 000 odluka o tražiteljima azila pokazao je da su odluke o odbijanja azila učestalije u vrućim danima te da je odluka o nekom pojedinačnom slučaju češće negativna ako je odluka o prethodna dva predmeta bila pozitivna. Barem jednako zabrinjavajuća varijabilnost prisutna je i u medicini. Recimo, u jednoj studiji trećina liječnika koji su gledali isti angiogram nije se složila o tome je li glavna krvna žila na slici blokirana više od 70%, odnosno zahtijeva li hitnu medicinsku intervenciju;  u drugoj je studiji postotak lažno pozitivnih dijagnoza karcinoma dojke na temelju istog skupa radioloških nalaza varirao između 1 i 64%, ovisno o tome koji ih je radiolog proučavao, a u trećoj je utvrđeno vrlo nisko slaganje oko dijagnoze i terapije između deset iskusnih psihijatara koji su opažali isti skup pacijenata.

Ovaj nepoželjni varijabilitet u prosudbama nazivamo ‘šumom’ (engl. noise), a uvijek je prisutan kad prosuđujemo i donosimo odluke. Šum je prisutan čak i u domenama u kojima bismo ga najmanje očekivali. Recimo, promet na burzi kapitala djelomično ovisi o dnevnoj vremenskoj prognozi, a pokazalo se i da je usporedba otisaka prstiju prikupljenih na mjestu zločina s onima koji se nalaze u policijskoj kartoteci podložna utjecaju informacija koje su irelevantne za postupak identifikacije. Šum objašnjava razlike u prosudbama različitih ljudi, ali i razlike u odlukama istog pojedinca u različitim vremenskim razdobljima  –  u jednom su istraživanju autori pitali iste programere dva puta koliko im vremena treba da naprave jednu računalnu aplikaciju (između dva upita prošlo je dosta vremena). Prosječni broj procijenjenih radnih sati između dva mjerenja u prosjeku se razlikovao čak 71%!

Šum u prosuđivanju i odlučivanju tema je knjige Noise. A Flaw in Human Judgment, koju su prije nekoliko tjedana objavili Daniel Kahneman (dobitnik Nobelove nagrade za ekonomiju 2002), Olivier Sibony i Cass Sunstein u izdanju Williama Collinsa (454 str). Ova izvrsna skupina znanstvenika iza koje su vrlo utjecajne i čitane knjige o prosuđivanju i donošenju odluka (npr. Kahnemanov Thinking Fast and Slow, Thaler-Sunsteinov Nudge: Improving Decisions about Health, Wealth and Happiness ili Sibonyeva You’re About To Make a Terrible Mistake), u zajedničkom se projektu posvetila ovom zanemarenom problemu koji ima snažne posljedice na naše poslovne i privatne živote.

  •  Što je šum u odlučivanju i zašto se pojavljuje?

Šum je neželjeni varijabilitet u prosudbama, on uzrokuje velike novčane gubitke i rezultira nepravdom u bilo kojem sustavu. Kad stupe u interakciju s nekom organizacijom (npr. sud, bolnica ili ministarstvo), ljudi očekuju sustav koji donosi konzistentne odluke – slične terapijske postupke za iste zdravstvene tegobe, podjednake presude za ista kaznena djela, istu razinu usluga poslovnim subjektima. Šum u sustav unosi element lutrije jer ishodi ne ovisi samo o meritumu nego i  o identitetu slučajno odabrane osobe koja donosi prosudbu odnosno o trenutku donošenja odluke. Te neopravdane raznolikosti je puno više nego što očekujemo. U jednoj studiji procjenitelji rizika u osiguravajućim kućama varirali su 5 puta(!) više u svojim prosudbama o rizičnosti osiguranja skupine objekata nego što su očekivali njihovim menadžeri.

Cilj bilo koje naše prosudbe je odmjeriti nešto, a kao instrument mjerenja koristimo vlastiti um. To ‘mjerenje’ suci rade kad određuju kazne u sudskim postupcima, liječnici kad odabiru terapeutske postupke i biznismeni kad biraju između različitih poslovnih ponuda. Problem šuma svodi se na to da ishod prosudbe proizlazi iz irelevantnih aspekata donositelja odluka, situacije ili procesa odlučivanja. Po svojoj prirodi, prosudbe su različite od mišljenja ili ukusa u kojima je varijabilitet potpuno uobičajen i poželjan (npr. preferencije umjetničkih djela, standarda ljepote ili programa političkih stranaka). Ukupan šum u sustavu ukazuje na nekonzistentnost a ta nekonzistentnost narušava reputaciju sustava (tko želi ići u bolnicu u kojoj je prijedlog načina liječenja posljedica slučaja?).

Različiti suci će iste ljude za isti prekršaj zakona osuditi različito jer se inače razlikuju u strogosti (šum razine), zato jer različiti suci različito reagiraju na pojedine vrste prekršaja (šum obrasca) te zato što konkretna prosudba u nekoj mjeri ovisi o prethodnim slučajevima istog suca tog dana, visini temperature u prostoriji i raspoloženju suca uzrokovanu, primjerice, loše odigranom utakmicom omiljenog nogometnog tima (slučajni šum)

Svaka pojedinačna prosudba uključuje pogrešku, a ta pogreška rezultat je sustavne pristranosti (engl. bias) i šuma. Recimo, u prosudbi o vremenu koje će im trebati za odrađivanje nekog projekta svi smo skloni pogrešci planiranja (engl. planning fallacy) koja se sastoji u tome da podcjenjujemo vrijeme potrebno za obavljanje nekog projekta. Taj prosječni pomak odnosno sklonost svih ljudi nazivamo pristranošću i možemo ju djelomično otkloniti intervencijama poput one da sve rokove množimo s nekim koeficijentom (npr., za sve projekte predviđamo dvostruko više vremena nego što stoji u originalnom prijedlogu projekta). Prema autorima knjige, još veći problem od ove naše opće sklonosti precjenjivanju rokova je problem da se mi razlikujemo u prosječnoj razini precjenjivanja rokova (neki ljudi su veći optimisti, šum razine), da različiti ljudi različito precjenjuju rokove određenih vrsta projekata (šum obrasca) i da naše procjene u nekom trenutku ovise o irelevantnim faktorima kao što su vremenske prilike ili trenutačno raspoloženje (slučajni šum). Da to stavimo i u kontekst pravnog sustava, različiti suci će iste ljude za isti prekršaj zakona osuditi različito jer se inače razlikuju u strogosti (šum razine), zato jer različiti suci različito reagiraju na pojedine vrste prekršaja (šum obrasca) te zato što konkretna prosudba u nekoj mjeri ovisi o prethodnim slučajevima istog suca tog dana, visini temperature u prostoriji i raspoloženju suca uzrokovanu, primjerice, loše odigranom utakmicom omiljenog nogometnog tima (slučajni šum).

Šum osobito možemo očekivati u složenim odlukama u kojim postoje suprotstavljeni znakovi kao što su osobito složeni pravni, medicinski ili poslovni slučajevi. Složenije su prosudbe podložnije šumu od jednostavnih zbog dvosmislenosti informacija – ako postoji više načina gledanja na stvari, ljudi će se međusobno razlikovati u tome na što će stavljati naglaske. Pri tome, čini se da je najveći problem upravo spomenuti šum obrasca odnosno činjenica da se mi snažno razlikujemo u tome kako reagiramo na točno određene predmete prosudbe. Tako različiti suci osobito različito reagiraju na specifične zločine, liječnici na specifične bolesnike, a poduzetnici na specifične poslovne prilike.

Šum je nepredvidiva pogreška koju ne možemo lako vidjeti i objasniti. Često ga ili ne primjećujemo ili ga jednostavno naknadno racionaliziramo. Jedna od temeljnih karakteristika ljudske prirode je sklonost kauzalnom rezoniranju odnosno zanemarivanju uloge  slučaja te traženje jasnih razloga i ciljeva u događajima. Većina stvari u životu odvija se u ‘zoni normalnog’, odnosno niti je potpuno očekivana niti skroz iznenađujuća. Mi realnost razumijevamo ‘unatrag’ pa završavamo pretragu za razlozima čim nađemo dobru priču. Da je ishod bio drugačiji, svejedno bismo pronašli priču koja bi nam se činila uvjerljivom.  Stoga nam se odluke koja su posljedica šuma u prosuđivanju često ne čine pogrešnima, već logičnima i smislenima. To nas sprječava da budemo bolji u prepoznavanju i ispravljanju lošeg utjecaja šuma na nas.

Razgovor s autorima knjige
  • Kako otkloniti šum i poboljšati odlučivanje?

Razina šuma prije svega ovisi o onom tko donosi odluku pa možemo upravljati kompetencijama donositelja odluka. Očekivano, razina šuma je manja što su ljudi inteligentniji, stručniji u području prosudbe, ali ovisi o načinu na koji ljudi misle. Temeljni je problem u psihologiji odlučivanja da prečesto brzo i lako dođemo do odluke pa onda samo tražimo informacije koje joj govore u prilog. Brojna novija istraživanja pokazuju da stil razmišljanja koji se naziva aktivno otvoreno mišljenje u pravilu rezultira najboljim ishodima.  U knjizi Superforecasting: The Art and Science of Prediction Philip Tetlock i Dan Gardner pišu o rezultatima projekta o mogućnostima unaprjeđivanja analiza i predviđanja koji je Tetlocku i suradnicima financirala američka obavještajna zajednica. Istraživanje je pokazalo da budućnost najbolje predviđaju osobe koje aktivno traže informacije suprotne njihovim trenutačnim uvjerenjima odnosno koje su skloni kontinuirano usklađivati svoje prosudbe novim podacima. Takav način mišljenja najbolje je sažet u izjavi koja se pripisuje britanskom ekonomistu Johnu Maynardu Keynesu: „Kad se promijene podaci, ja promijenim mišljenje!“

Budućnost najbolje predviđaju osobe koje aktivno traže informacije suprotne njihovim trenutačnim uvjerenjima odnosno koje su skloni kontinuirano usklađivati svoje prosudbe novim podacima

Osim odabirom i edukacijom osobe, šum je moguće otkloniti i nizom postupaka koje autori nazivaju higijenom odlučivanja. Autori povlače paralelu s higijenskim postupcima poput pranja ruku čiji je cilj prevencija nespecifičnog raspona mogućih problema prije nego što se dogode – kada peremo ruke sapunom i toplom vodom, otklanjamo unos mogućih uzročnika bolesti u organizam ali pri tome ne znamo kojih točno niti u kojem su stupnju oni bili prisutni na našim neopranim rukama.

Prvi postupak higijene odlučivanja je sustavno prikupljanje informacija o predmetu odlučivanja. Prosuđivanje i donošenje odluka bit će bolje ako prosuditelji mogu razložiti i dokumentirati svaki korak prosudbe. Primjeri za ovakve postupke su jasne dijagnostičke smjernice u medicini  ili uvođenje strukture u prakse odabira ljudi u radnim organizacijama. Recimo, autori u ovoj knjizi spominju primjer Apgar sustava bodovanja vitalnosti novorođenčeta kod kojeg pedijatar nakon poroda prosuđuje pet domena funkcioniranja novorođenčeta nakon poroda (boja kože, aktivnost srca, refleks na podražaj, mišićni tonus i disanje), a u svakoj domeni postoje tri unaprijed definirane vrijednosti s kojima liječnik treba usporediti bebu (npr. blijeda ili plava boja kože = 0 bodova, ružičast trup i plavi udovi = 1 bod, potpuno ružičasta boja kože = 2 boda). Slična praksa postoji i u organizacijskoj psihologiji/upravljanju ljudskim potencijalima. Serija za serijom istraživanja pokazuju da je za predviđanje budućeg uspjeha u poslu bolji strukturirani od nestrukturiranog selekcijskog intervjua. U usporedbi s neusmjerenim razgovorom koji kod zapošljavanja koristi većina poslodavaca, puno boljom selekcijskom metodom čini se intervju u kojem se svim kandidatima za neki posao postavljaju ista pitanja, a njihovi se odgovori vrednuju u odnosu na unaprijed formiranu skalu odgovora.

Drugi koristan i jednostavan postupak je uprosječivanje nezavisnih prosudbi. Istraživanja iz tzv. ‘mudrosti masa’ pokazuju da prosjek različitih nezavisnih procjena bolje odgovara stvarnom stanju od pojedinačnih procjena ljudi koji su eksperti u nekom području. Primjerice, ako pitamo 10 kupača da procijene temperaturu mora i uprosječimo, dobit ćemo točniju procjenu nego da se oslonimo na procjenu slučajno odabrane osobe na plaži. Slična logika vrijedi za ‘masu iznutra’ –  naše procjene će biti bolje ako su rezultat prosjeka naših prosudbi u različitim vremenskim točkama odnosno ako si ciljano pitanje postavimo u više navrata. Pri tome, ključ za uspješnost uprosječivanja je nezavisnost procjena jer razgovor među ljudima stvara šum koji je posljedica socijalno psiholoških procesa poput konformizma među članovima grupe. Nezavisnost je nešto teže postići ako uprosječujemo više odluka istog pojedinca, ali u tom slučaju trebamo se prisiliti da razmišljamo o razlozima zašto bi prva odluka mogla biti netočna. S obzirom na to da su ljudi skloni potvrđivanju postojećih mišljenja i uvjerenja, razmišljanje o tome zašto bi odluka mogla biti netočna je jedna od najjednostavnijih i najuspješnijih tehnika za poboljšavanje kvalitete prosudbi i odluka

Treći postupak odnosi se na način integracije različitih informacija. Istraživanja opisana u knjizi pokazuju da, premda većina nas očekuje obrnuto, mehanička/matematička integracija informacija važnih za donošenje odluke u učinkovitosti premašuje integraciju koja se temelji na kliničkoj, holističkoj prosudbi stručnjaka. Primjerice  ako želimo integrirati rezultate različitih selekcijskih postupaka u slučaju odabira zaposlenika ili dijagnostičkih postupaka u slučaju kliničke obrade pacijenta, bit ćemo točniji ako koristimo neku jednostavnu matematičku formulu nego ako donesemo opću, subjektivnu prosudbu.  Zbog manje količine šuma koja opterećuje procjene različiti se oblici algoritama u brojnim domenama pokazuju učinkovitijima od općih procjena ljudi te je opravdano predviđati da će se upotreba umjetne inteligencije u područjima kao što su medicinska dijagnostika ili automatizirana vožnja, dugoročno pokazati učinkovitijom i, posljedično, učestalijom.

  • Postoji li optimalna razina šuma?

Uvođenje pravila i postupaka čiji je cilj smanjivanje šuma u prosudbama i odlukama nije bez prigovora. Temeljna primjedba kritičara smanjivanja šuma je da jedino naše subjektivne prosudbe mogu na odgovarajući način voditi računa o svim suptilnostima pojedinog predmeta ili slučaja. Za veliku većinu nas aktivnost prosuđivanja je složena, bogata i zanimljiva upravo zato jer ju je nemoguće uklopiti u skup jednostavnih pravila. Imamo previsoko mišljenje o svojoj sposobnosti da izmislimo i primijenimo složena pravila specifična upravo za slučaj koji se pred nama nalazi. Taj je prigovor dosta lako opovrgnuti jer istraživanja jasno pokazuju da ukupni nedostaci subjektivnosti procjene značajno premašuju prednosti koje proizlaze iz suptilnog razmatranja pojedinačnog slučaja. No, postoje i neki opravdani prigovori postupcima umanjivanja šuma u nekom sustavu. Recimo, uvođenje postupaka za umanjivanje šuma trebalo bi biti usklađeno s dobiti iz tih postupaka.  Primjerice, u većini medicinskih postupaka dobiti od uvođenja strukture premašuju troškove (pogledati knjigu The Checklist Manifesto Atula Gawandea), ali u obrazovanju uvođenje ponovljenog ocjenjivanja svakog učeničkog testa tako da svaki test ocijeni barem troje nastavnika smanjilo bi šum ali ne bi opravdalo uložene resurse. Nadalje, sami algoritmi i pravila u sebi mogu imati ugrađene predrasude i pristranosti kao što možemo vidjeti iz algoritama koji koriste umjetnu inteligenciju za donošenje odluka o zapošljavanju a koji diskriminiraju seksualne, etničke ili rasne manjine. Konačno, neka pravila za smanjivanje šuma mogu dovesti do toga da ljudi smatraju da je narušeno njihovo dostojanstvo  odnosno da nisu pravedno tretirani. Primjerice, premda znamo da strukturirani selekcijski intervjui rezultiraju boljim prosudbama o prikladnosti kandidata za neki posao, kandidati ih često ne vole jer imaju osjećaj da ne mogu pokazati sve od sebe.

  • Nesavršena knjiga izrazito vrijedna čitanja

Noise je knjiga koju bi trebali pročitati svi stručnjaci koji se zanimaju za prosuđivanje i donošenje odluka, kao i bilo tko tko želi bolje odlučivati u poslovnim ili privatnom životu. Stječe se dojam da je u njoj manje originalnih ideja nego u knjigama Thinking Fast and Slow ili Nudge, ali joj se mora priznati isticanje problema šuma u odlučivanju i usustavljivanja znanja o njemu.  Knjiga nije savršena, vjerojatno je malo preduga i koristila bi joj snažnija urednička intervencija u pogledu ujednačavanja stilova različitih autora i izbjegavanja preklapanja među poglavljima. No, kao kod većine postupaka higijene odlučivanja, ono što ćete dobiti iz ove knjige znatno premašuje vrijeme i trud uložen u čitanje. Temeljna teza knjige je da je cilj prosuđivanja točnost, a ne izražavanje individualnosti, a šum je pojava koja nas u tom postupku ometa.