Lažna korelacija
Što je lažna korelacijaU statistici se lažna korelacija, ili lažna, odnosi na vezu između dvije varijable koja se čini uzročno, ali nije. Lažni odnosi često imaju izgled jedne varijable koja utječe na drugu. Ovu lažnu korelaciju često uzrokuje treći faktor koji nije očit u vrijeme ispitivanja, ponekad nazvan zbunjujući faktor.
Ključni odvodi
- Lažna korelacija ili lažljivost je kada se dva čimbenika pojavljuju usko povezana, ali nisu.
- Pojava uzročno-posljedične veze često je posljedica sličnog kretanja na grafikonu, što se ispostavilo da je slučajno ili uzrokovano trećim "zbunjujućim" faktorom.
- Lažnu korelaciju često mogu uzrokovati male veličine uzorka ili proizvoljne krajnje točke.
Kako djeluje lažna korelacija
Kad se dvije slučajne varijable međusobno pomno prate na grafikonu, lako je posumnjati u korelaciju ili odnos između dva faktora, gdje promjena utječe na drugu. Izbacujući još jednu temu "uzročno-posljedične veze", ovo promatranje može navesti čitatelja grafikona da vjeruje da je kretanje varijable A povezano s kretanjem u varijabli B ili obrnuto. ali ponekad su, nakon pomnijeg statističkog ispitivanja, poravnata kretanja slučajna ili uzrokovana trećim faktorom koji utječe na prva dva. Ovo je lažna korelacija. Istraživanja provedena s malim veličinama uzoraka ili proizvoljnim krajnjim točkama je posebnost podložna lažljivosti.
Primjer lažnih korelacija
Otkrivati zanimljive korelacije nije previše teško. Međutim, mnogi će ispasti lažni. Za mušku vrstu na Wall Streetu, dvije popularne lažne korelacije uključuju žene i sport. Iz 1920-ih potječe teorija duljine suknje koja drži da su duljine suknje i smjer dionica na tržištu povezani. Ako su duljine suknji dugačke, to znači da berza propada; ako su kratki, tržište ide prema gore. Krajem siječnja govori se o takozvanom pokazatelju Super Bowla, koji sugerira da pobjeda AFC-ovog tima vjerojatno znači da će tržište dionica pasti u narednoj godini, dok pobjeda NFC tima predstavlja rast porasta tržište. Od 1966. godine pokazatelj je imao tačnost od 80%. To je zabavan dio razgovora, ali vjerojatno ne nešto što bi ozbiljni financijski savjetnici preporučili kao investicijsku strategiju za klijente.
Evo još primjera uobičajenih lažnih korelacija:
- Utapanja rastu kada poraste prodaja sladoleda. Možda se čini da povećana prodaja sladoleda uzrokuje više utapanja, ali u stvarnosti, porast vrućine može natjerati više ljudi da plivaju, kao i kupiti više sladoleda.
- Stopa ubojstava u SAD-u od 2006. do 2011. pala je istom brzinom kao i Microsoft Internet Explorer.
- Rukovodioci koji kažu molim vas i zahvaljuju vam češće uživaju u boljem dijeljenju performansi.
- Ljudi koji nose opremu tima Oakland Raiders vjerojatnije su da će počiniti zločine.
Kako uočiti lažne korelacije
Statističari i drugi znanstvenici koji analiziraju podatke stalno moraju biti u potrazi za lažnim vezama. Postoje brojne metode koje se koriste, uključujući:
- Osiguravanje ispravnog reprezentativnog uzorka.
- Dobijanje odgovarajuće veličine uzorka.
- Budite oprezni proizvoljnih krajnjih točaka.
- Kontrola za što je moguće više vanjskih varijabli.
- Korištenje nulte hipoteze i provjeravanje jake p-vrijednosti.