Kauzalno zaključivanje je teško
Ili bar teže nego što većina ljudi misli.
Razmotrite dva primjera na koje sam nedavno naišao; prvi iz popularne kulture, a drugi — recentniji — primjer vezan je za tekuće rasprave oko Covida-19.
Prvi primjer potječe iz jedne krimi serije. Ukratko: policija traži silovatelja. Dečko žrtve, inače po zanimanju matematičar, kaže detektivki: "pročitao sam da ako počinitelj silovanja nije pronađen u roku od 7 dana, vjerojatnost da će ikada biti pronađen značajno opada...znači ako ne pronađete počinitelja za 5 dana, nikada ga nađete pronaći...tako da obzirom da imate još 5 dana da uhvatite tog tipa, što uopće još radite ovdje? Zašto ga ne tražite?"
Detektivka nema odgovora na matematičarev upit.
No, matematičar je napravio non-sequitur: iz činjenice da nakon 7 dana od počinjenja zločina značajno opada vjerojatnost da će on biti pronađen uopće ne slijedi da istražitelji moraju ubrzati istragu jer tobože imaju još malo vremena na raspolaganju.
Greška proizlazi iz pretpostavke da je sam protok vremena taj koji je kauzalno relevantan za to hoće li počinitelj biti uhvaćen. To bi, doduše, mogao biti slučaj: npr. možda silovatelji bježe u drugu državu, možda forenzički tragovi (DNK dokazi) deterioriraju s vremenom i slično, i u tom slučaju ubrzavanje istrage bi moglo povećati vjerojatnost da će počinitelj biti uhvaćen.
No moguće je, i rekao bih vjerojatnije, i sljedeće: postoje različiti tipovi kriminalaca - oni manje i više inteligentni. Gluplji su prije uhvaćeni jer su manje pažljivi, manje glupi su kasnije ili nikada uhvaćeni. U tom slučaju protok vremena (od počinjenja djela) je posljedica tipa kriminalca, a nije slučaj da protok vremena uzrokuje (utječe na vjerojatnost) da li će kriminalac biti uhvaćen.
Ubrzavanje istrage, u tom smislu, potpuno je irelevantno jer ono ne može promijeniti činjenicu da se radi o drugom tipu kriminalca. Osobine kriminalca (O) smanjuju vjerojatnost njegova hvatanja (H), a ne sam protok vremena (V) - protok vremena je i sam određen osobinama kriminalca.
Drugim riječima, pretpostavka je da V uzrokuje H, dok zapravo postoji treća varijabla O koja uzrokuje i V i H.
*****************
Drugi primjer je nešto recentniji. Već početkom Covid-krize pojavila se distinkcija između umiranja SA virusom SARS-CoV-2 i umiranja OD istog virusa. Distinkcija se odnosila na pripisivanje uzročnosti za smrt osobe pri čemu je umiranje „sa“ označavalo da je virus kauzalno irelevantan (potpuno? velikim dijelom?) za smrtni ishod. Podaci o „višku smrti“ (višak broja smrti u odnosu na isto razdoblje prethodnih godina) uklonili su mogućnost da se smrti mogu objasniti isključivo različitošću u metodologiji pripisivanja smrti, no ostavimo to po strani. Palo mi je na pamet da se slična distinkcija može potegnuti i kod pripisivanja uzroka ekonomske (ali i druge) štete.
Pretpostavimo da je gubitak uz državno uvedene mjere (poput lockdowna) procijenjen na X. Da bi znali koji je gubitak OD tih mjera (G), trebali bi ujedno znati koji bi bili gubici bez tih mjera, ali uz dobrovoljno distanciranje ljudi koje bi zacijelo uslijedilo i neovisno o državno uvedenih mjera (Y). Primjerice, jedno kino će trpiti gubitke ako im država zabrani rad (X). No, ono bi trpilo određene gubitke i bez tako uvedenih mjera jer bi ljudi svojevoljno manje odlazili u njega (Y). Stoga, gubitak OD uvedenih mjera (G) se dobiva tako da od gubitaka koji bi nastali UZ uvedene mjere (X) oduzmemo gubitke iz kontrafaktičke situacije pada potrošnje zbog dobrovoljnog ponašanja ljudi (Y). Ukratko:
G=X-Y
(Ovdje mi se može prigovoriti da pretpostavljam da je nešto uzrok nekog efekta samo ako efekta ne bi bilo u slučaju izostanka tog uzroka, no u praktičnim smislu je to nebitno ako se X koristi kao argument protiv uvođenja mjera. Kao argument protiv uvođenja mjera možemo koristiti samo G.)
Ovo je važno jer sam čuo ljude kako govore da zato što je znanost slaba u davanju odgovora na kontrafaktičke scenarije ("što bi bilo kad bi bilo"), nikada nećemo znati koliki bi bio broj smrti bez uvedenih mjera, da bi odmah potom rekli da ćemo u budućnosti znati koliki će biti gubici zbog uvedenih mjera. Međutim, za odgovor i na ovo potonje pitanje je također potrebno znati kontrafaktičku situaciju, kao što sam pokazao.
Spomenimo usput i to da se distinkcija sa/od mogla primijeniti i u slučaju sezonske gripe. Naime, ljudi bi uspoređujući opasnost od Covida i gripe, tipično izraženu brojem mrvih od jednog i drugog, u slučaju prvog brzo zazvali sa/od distinkciju, a propuštali primijetiti da se ona može primijeniti i kod zabilježenog broja smrtnih slučajeva od gripe.
Treba, dakle, paziti da iste dokazne standarde primijenjujemo na različita istraživačka pitanja i ne zahtjevamo veće standarde prilikom odgovaranja na pitanja čiji nam se odgovori možda ne bi svidjeli. U takvim uvjetima znanost prestaje biti potraga za istinom i postaje potraga za argumentima koji će favorizirati našu poziciju.