Problem višestrukih poređenja

Uobičajeni statistički problem u studijama neuroimadžinga je problem višestrukih poređenja (ili testiranja). Da bismo lokalizovali efekte naših analiza u mozgu, obično izvodimo mnoge testove na različitim lokacijama u mozgu. Ako se testovi izvode nezavisno, onda to nazivamo masovna univarijantna analiza.

U standardnoj statistici, prag p-vrednosti od 0.05 implicira da prihvatamo 5% šanse da dobijemo lažni rezultat kada nema signala. Dakle, u proseku 1 od 20 testova koje sprovodimo slučajno će pokazati značajan rezultat, kada zapravo nije bilo stvarnog efekta.

Ukoliko analiziramo promene mozaga podeljenog u 20.000 voksela, radili bismo 20.000 univarijantnih testova. Koristimo li p-vrednost od 0,05, onda bi oko 1.000 voksela čistom slučajnošću pokazalo efekat – lažno pozitivni.

Korekcija višestrukih poređenja

Neophodno je primeniti neki oblik korekcije da bismo kontrolisali broj lažnih pozitivnih rezultata i rešili problem višestrukih poređenja. Bez odgovarajuće korekcije rezultati studije su veoma problematični i nerazumljivi jer je nemoguće znati koji nalazi odražavaju pravu aktivaciju/povezanost. Iako se ponekad u literaturi javljaju nekorigovane rezultate, ovo je loša praksa koju više ne prihvataju časopisi i recenzenti.

Dva najčešća pristupa korekciji  u neuroimadžingu su korekcija stope grešaka ,,na nivou familije i  korekcija stope lažnog otkrića. U “family-wise error – FWE” postavimo prag p-vrednost za celu familiju testova, umesto samo jednog pojedinačnog testa. Kod “false discovery rate – FDR” zahvalni smo ako je 5% voksela koji su proglašeni značajnim u mozgu lažno pozitivni.

Prag zasnovan na vokselu naspram klastera

U neuroimadžingu, najčešća statistika koja se koristi za utvrđivanje praga je granična vrednost zasnovana na vokselu i klasteru. Prag zasnovan na klasterima koristi prostorni opseg signala – klaster voksela. Uključuje primenu početnog, proizvoljnog praga ,,formiranja klastera” na nekorigovanu sliku a zatim korišćenje veličine rezultujućih „blobova“ kao ulaz za metoda korekcije.

Prema tome, prag zasnovan na klasteru koristi prag veličine da kontroliše konačnu stopu lažnih pozitivnih rezultata, a ne prag amplitude, a veličina blobova je ta koja određuje da li prelaze prag. Početni prag formiranja klastera koji se primenjuje na nekorigovane podatke je od ključnog uticaja na pragove zasnovane na klasterima.

Testiranje s permitacijama

U parametarskoj statistici se pretpostavlja da je uzork izvučen iz populacije koja prati nama poznatu distribuciju opisanu malim skupom parametara (srednja vrednost i standardna devijacija). Parametrijska statistika se obično usvaja u neuroimadžingu kako bi se procenile testna statistika i p-vrednosti, a najpoznatiji statistički testovi su primeri parametarske statistike, uključujući t-test i ANOVA.

Nepoklapanje distribucija – Crvenom linijom su obeležene kakva bi normalna distribucija bila i srednja vrednost. Plavo bi bilo naša distribucija koju smo napravili nakon prikupljanja podataka u histogram. Žuta srednja vrednost se takođe ne podudara sa crvenom.

Iako je parametarska statistika laka i brza za izvođenje, jedan važan nedostatak je to što prave nekoliko pretpostavki o podacima. Što je najvažnije, parametarska statistika pretpostavlja da su podaci za svaku populaciju raspoređeni pod poznatom parametarskom distribucijom. Tipično je to Gausovom (normalnom) raspodelom. Međutim, ove pretpostavke se često krše, na primer, poznato je da ICA mape ne prate normalnu distribuciju. Kada se naruši pretpostavka normalnosti, parametarska statistika postaje manje tačna i umesto toga treba uzeti u obzir neparametarske metode.

Permutaciono testiranje čini jednu klasu neparametarske statistike i steklo je značajnu popularnost u neuroimadžingu poslednjih godina. Prednosti permutacionog testiranja su u tome što zahteva malo pretpostavki o podacima. Takođe, izuzetno je fleksibilno i može se primeniti na bilo koju vrstu test statistike. Permutacijsko testiranje je relativno jednostavno za izvođenje (iako može potrajati) i pruža robusnu i tačnu procenu rezultata.

Nulta distribucija

Ideja koja stoji iza testiranja permutacije je da se koriste sami podaci kako bi se izgradila nulta distribucija. U testiranju permutacije, ova distribucija nultih rezultata se stvara mešanjem (permutacijom) subjekata tako da više ne odgovaraju tačnim oznakama.

Na primer, ako imamo studiju gde upoređujemo pacijenate sa zdravim kontrolama, onda bi mešanje oznaka značilo da i „pacijenti“ i „zdrava kontrolna grupa“ sada sadrže mešavinu svih subjekata. Pod pretpostavkom da je nulta hipoteza tačna (tj. da nema razlike između grupa), u suštini postoji samo jedna grupa i rezultat grupne razlike ne bi trebalo da se menja bez obzira na to da li se koriste prave oznake ili su podaci permutovani. U stvarnosti, svaki put kada se oznake permutuju, rezultat će se malo razlikovati kao rezultat ,,nečistoća” u podacima.

Subjekti se mogu permutovati mnogo puta, a nakon svake permutacije se izračuna i sačuva statistika koja nas interesuje (npr. „razlika između grupa“). Nakon dovoljno velikog broja permutacija, svaku sačuvanu vrednost možmo grupisati u empirijsku nultu distribuciju. Na kraju vratimo se na nepermutovane podatke (pacijenti i kontrolni su u svoji prvobitnim grupama) i izračunamo ispravniju statistiku testa.

Da bismo utvrdili koliko je ova test statistika značajna (tj. našli p-vrednost), uporedimo je s nultom distribucijom debijenu prethodnim permutovanjem podataka.

Uopštenije rečeno, testovi permutacije se mogu sprovesti za bilo koju test statistiku, čak i kada je nulta distribucija nepoznata. Glavna prednost je stoga što možemo izabrati statistiku koja odgovara potrebama istraživanja.

Značaj broja permutacija

Treba prepoznati da broj permutacija određuje tačnost p-vrednosti. Za najprecizniju procenu p-vrednosti, treba odraditi sve moguće permutacije. Međutim, ovo može ići često u milione, milijarde ili čak više mogućih permutacija. Zbog toga često nije izvodljivo izvršiti sve moguće permutacije jer bi to jednostavno trajalo predugo.

Na primer, jednostavan t-test sa dva uzorka od po 20 subjekata po grupi ima više od 137 milijardi mogućih permutacija. Da bismo testiranje permutacije učinili praktičnim, izvodimo određeni daleko manji broj nasumičnih permutacija. Naravno, ovaj broj određuje koliko tačno ta raspodela odražava pravu distribuciju koju bismo pronašli da smo uradili sve moguće permutacije. Kao rezultat toga, broj permutacija koje se izvode utiče na tačnost p-vrednosti.

Ako izvršimo samo 100 permutacija, onda možemo pokazati, putem simulacija, da procenjena p-vrednost od 0.05 znači da je prava p-vrednost 0.05 ± 0.04 sa 95% poverenja (tj. u 95 od 100 puta, u proseku , prava p-vrednost će biti negde između 0,01 i 0. 09). Ovo čini značajnu razliku kada se rezultat prijavljuje kao značajan ili ne.

Postoje i drugi aspekti koji utiču na to da li je rezultat značajan ili ne, uključujući efekat veličine i jačina studije, pa stoga broj permutacija možda neće drastično uticati na rezultate u stvarnim studijama. Ipak, uobičajeni „sigurni“ savet je da se izvrši najmanje 5000 permutacija, čime bi interval poverenja bio 0.05 ± 0.006 (skoro je pokazano da može znatno manje).

Iako je više permutacija obično bolje, postoji ograničenje broja permutacija koje se mogu izvršiti. Ovo ograničenje je određeno: (i) brojem subjekta u studiji (tj., ako samo nekoliko subjekta, broj načina na koje možete da ih mešate je manji nego ako imate veliki broj), (ii) broj mogućih permutacija s obzirom na dizajn studije, kao i (iii) broj pomeranja koji su dozvoljeni u skupu podataka ako zapažanja nisu nezavisna.

Razmenjivost

Permutaciono testiranje zahteva manje pretpostavki od parametarske statistike, ali postoji jedna fundamentalna pretpostavka koju treba ispuniti. Razmenjivost.

Da bi ovo razumeli, zamislimo studiju blizanaca, u kojoj su regrutovani parovi blizanaca gde jedan od blizanaca pati od poremećaja (npr. bipolarni poremećaj), a drugom blizancu nije dijagnostifikovan nikakav poremećaj. Cilj studije je da se sagleda razlika između blizanaca koji boluju od bipolarnih poremećaja i zdravih blizanaca. U ovom slučaju, mnogo opcija permutacije će dovesti do raspada parova blizanaca. Razlika između dva nepovezana subjekta će verovatno biti mnogo veća od razlike između para blizanaca, a može biti zbog mnogih faktora osim dijagnoze. Stoga, bilo kakve permutacije koje dovode do raspadanja parova blizanaca nisu dozvoljene u ovom scenariju. Jedina vrsta permutacija koja odgovara ovom zahtevu su zamene unutar blizanaca (tj. zamena oko zdravog kontrolnog blizanca i blizanca sa dijagnozom). Uopšteno govoreći, subjekti su zamenljivi (tj. mogu se zameniti), ako permutacija ne menja distribuciju pod nultom hipotezom.

Grupno poređenje

Ovaj primer možemo proširiti na studiju blizanaca gde je cilj da se uporedi ova razlika između dve grupe. Na primer, možemo regrutovati neke parove blizanaca gde jedan pati od bipolarnog poremećaja, a drugi je zdrav, i neke parove blizanaca gde jedan pati od šizofrenije, a drugi je zdrav. Tako bi moglo da se sagleda razlika unutar svakog para blizanaca i da se uporedi ova razlika između dve vrste mentalnih poremećaja. U ovom primeru, dalja važeća permutacija bi bila zamena parova blizanaca između dve grupe (tj. zamena para blizanaca iz grupe šizofrenije sa parom blizanaca iz bipolarne grupe). Za grupno poređenje, nulta hipoteza je da ne postoji razlika između bipolarnog poremećaja i šizofrenije u smislu razlike između blizanaca sa dijagnozom jednog od poremećaja i zdravog kontrolnog blizanca.

Dakle, permutacija koja zamenjuje par blizanaca iz grupe bipolarnih poremećaja sa parom blizanaca iz grupe šizofrenije je važeća, jer ne bi promenila distribuciju pod nultom hipotezom. Iako ova vrsta nezamenljivosti dodaje komplikaciju, obično je još uvek moguće koristiti testiranje s permutacijama postavljanjem određenih ograničenja na koja su razmene (permutacije) dozvoljene.

<< Mapiranje nervnih mreža stanja mirovanja 🧠 Sadržaj 🧠

Коментари