III.3. Primjer neparametrijskog testa: χ2-test (hi-kvadrat test) III.3.1. Općenito o χ2-testu
Često je potrebno usporediti razne skupine ispitanika po učestalostima
(frekvencijama) i vidjeti razlikuju li se te skupine ili se ne razlikuju. UtvrĎivanje
tih razlika treba obaviti upotrebom statistike a ne procjenom razlika od oka, tako
da se govori o statistički značajnim razlikama. Kako frekvencije u biostatistici
ima odreĎeno značenje, to se moţe govoriti o različitim slučajevima: da se
usporeĎuju dobivene frekvencije jedne skupine s teoretskima, ili se frekvencije
za dvije ili više skupina meĎusobno usporeĎuju u odnosu na referentne
teoretske vrijednosti. Dakle, radi se o jednom obiljeţju ili o dva obiljeţja u vidu
klasa (razreda) u koje je svaka skupina podijeljena. UsporeĎuju se raspodjele
kojima frekvencije tih razreda pripadaju, dakle pitanje razlika izmeĎu nizova
frekvencija svodi se na pitanje da li su njihove raspodjele iste ili su različite u
odnosu na očekivane raspodjele. Razlike izmeĎu raspodjela se pak mogu
utvrditi ako se ispitaju razlike izmeĎu frekvencija razreda tih raspodjela.
Nizovi frekvencija koje se ispituju predstavljaju kategorijske varijable. Mjera za
odstupanje opaţenih frekvencija od očekivanih zove se vrijednost hi-kvadrata ili
χ2-vrijednost, a najčešći statistički test u kojem se ovaj parametar koristi je
hi-kvadrat test ili χ2-test. Prema definiciji, χ2-vrijednost za k stupnjeva slobode je
zbroj od k odreĎenih z-vrijednosti standardizirane normalne raspodjele. Ovakav
zbroj z-vrijednosti podlijeţe zakonu χ2-raspodjele a ne normalne raspodjele:
Često je kod malih uzoraka, malih i problematičnih kontingencijskih tablica zbog
nedovoljno velikih razreda, potrebno uvesti Yatesovu korekciju. U toj korekciji,
apsolutna vrijednost razlike izmeĎu opaţene i očekivane frekvencije umanjuje
se za 0.5, te se potom vrijednost kvadrira i normalizira s Ei:
U χ2-testu računa se tzv. χ2-parametar, χ2-vrijednost ili χ2-statistika (slijedi
χ2-raspodjelu), koji je za praktičnu primjenu za statističke uzorke i skupove
definiran kao aproksimacija, zbroj normaliziranih razlika izmeĎu opaţenih (Oi) i
očekivanih (Ei) frekvencija svih C razreda u tzv. kontingencijskoj tablici (C je
broj ćelija za vrijednosti Oi ili Ei u kontingencijskoj tablici). Što je χ2-vrijednost
veća, to ukupna razlika izmeĎu opaţenih i očekivanih frekvencija statistički
značajnija. χ2-vrijednost se u praksi moţe računati na dva načina, pri čemu sve
očekivane frekvencije moraju biti Ei ≥ 5:
χ2-test uveo je statističar Karl Pearson 1900. godine u časopisu Philosophical
Magazine Series 5, vol. 50 (302), str. 157-175:
Broj statističkih uzoraka i varijabli koji se uključuju u χ2-test:
1 uzorak, 1 varijabla χ2-test slaganja, prilagodbe ili aproksimacije
(rijetko u biostatistici)
1 uzorak, 2 varijable χ2-test nezavisnosti dviju varijabli
(ne tako često u biostatistici):
-običan ili Pearsonov χ2-test nezavisnosti
-χ2-test nezavisnosti s Yatesovom korekcijom
2 i više uzoraka, 2 varijable χ2-test homogenosti skupa
(često u biostatistici)
-običan ili Pearsonov χ2-test homogenosti
-χ2-test homogenosti s Yatesovom korekcijom
χ2-test slaganja ili aproksimacije:
ispituje se koliko jedan niz opaţenih frekvencija odstupa od očekivanih
frekvencija, tj. da li raspodjela uzorka bitno odstupa od raspodjele populacije za
koju se očekuje da je iz nje uzet uzorak.
χ2-test homogenosti skupa:
ispituje se kolike su razlike unutar skupa odnosno izmeĎu dvaju ili više uzoraka,
tj. da li se uzorci meĎusobno bitno razlikuju. Ova provjera se temelji na
ispitivanju razlika niza opaţenih frekvencija uzoraka u odnosu na frekvencije
jedne pretpostavljene raspodjele.
χ2-test nezavisnosti dviju varijabli:
ispituje se koliko su dvije varijable meĎusobno povezane tj. zavisne unutar
jednog uzorka (cijeli skup je shvaćen kao jedan uzorak). Ova provjera
pretpostavlja da dvije kategorijske varijable nisu korelirane ili sparene.
Korelirane varijable su one koje imaju iste ispitanike ili statističke jedinice, a
sparene varijable su one koje imaju parove ispitanika ili statističke jedinice
meĎusobno strogo pridruţene u parovima.
Svaki χ2-test je detaljno objašnjen i pokazan na primjerima u ovom predavanju.
U svakom χ2-testu svaki ispitanik ili statistička jedinica pojavljuje se u
podacima samo jednom, a ne dva ili više puta.
Radi boljeg razumijevanja χ2-testa potrebno je pojasniti χ2-raspodjelu.
df vjerojatnost (α)
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82
3 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27
4 0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47
5 1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6 1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46
7 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32
8 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9 3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88
10 3.94 4.86 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59
Nije značajno Značajno
χ2-raspodjela:
kritične vrijednosti χ2*
desnog kraka raspodjele
ovise o df i α; kritične
vrijednosti prikazane su za
prvih 10 vrijednosti df i za
11 vrijednost α (od 0.95 do
0.001)
Funkcija fk(x) je funkcija χ2-raspodjele
vjerojatnosti, koja jako ovisi o broju
stupnjeva slobode k (često i u oznaci
df). Za velike k (k > 50) ova raspodjela
pribliţuje se normalnoj raspodjeli.
Nezavisna varijabla funkcije fk(x) je
x = χ2α = Σi (Oi - Ei)/Ei, tj. zbroj
normiranih kvadrata odstupanja
opaţenih frekvencija (Oi) od
očekivanih (Ei).
Oblik fk(x) funkcije χ2-raspodjele:
x = χ2 i vjerojatnost p = α na
desnom su kraku raspodjele.
Osnovni oblici četiriju najčešćih funkcija
raspodjele vjerojatnosti: standardizirana
Gaussova (z-vrijednost), Studentova
(t-vrijednost), Fisherova (F-vrijednost) i
hi-kvadrat raspodjela (χ2-vrijednost).
χ2-raspodjela općenito nije simetrična,
ali postaje simetrična za velike df, kada
se pribliţuje normalnoj raspodjeli.
χ2-raspodjela:
kritične
vrijednosti χ2*
desnog kraka
raspodjele
ovise o df i α.
Statistički
značajnim
smatra se
vjerojatnost
P < 0.05, tj.
razlika je
značajna na
razini α = 0.05
ili manjoj.
χ2-raspodjela: kritične
vrijednosti χ2* desnog kraka.
Dane su vrijednosti za prvih
30 vrijednosti df i za
vrijednosti α od 0.99 do
0.001.
III.3.2. χ2-test slaganja ili aproksimacije
Ovaj χ2-test nosi različita imena: test slaganja, test o prilagodbi modela
podacima, test aproksimacije empirijske raspodjele teorijskoj (Engl. chi-square
goodness-of-fit test, one-sample chi-square test).
Ovdje je x statističko obiljeţje od interesa, tj. 1 varijabla izmjerena za
1 uzorak. Ovim testom se provjerava je li uzorak reprezentativan za populaciju,
tj. je li razlika izmeĎu opaţene raspodjele uzorka i pretpostavljene raspodjele
populacije statistički značajna. Statistička hipoteza je:
H0: Varijabla x ima pretpostavljenu (očekivanu) raspodjelu.
H1: Varijabla x nema pretpostavljenu (očekivanu) raspodjelu.
UsporeĎuju se dvije raspodjele za uzorak – opaţena i očekivana raspodjela.
Opaţena raspodjela: empirijska raspodjela apsolutnih frekvencija po razredima
(O1, O2, O3, …, OC), raspodjela dobivena mjerenjem odnosno eksperimentom,
skupljanjem podataka uzorak je podijeljen na dva ili više razreda, kategorija
ili klasa (tj. podskupova, poduzoraka) po nekoj osobini.
Očekivana raspodjela: raspodjela koja se očekuje, bilo da se radi o nekoj
teorijskoj raspodjeli (diskretna uniformna, normalna, binomna, Poissonova i dr.),
bilo da se radi o prethodno ustanovljenoj empirijskoj raspodjeli ili kojoj drugoj
raspodjeli koja se pretpostavlja raspodjela apsolutnih frekvencija po razre-
dima (E1, E2, E3, …, EC) izračunava se kao produkti veličine uzorka N (ukupna
frekvencija) i očekivanih relativnih frekvencija ili vjerojatnosti p1, p2, p3, …, pC.
Broj razreda je C ≥ 2, a broj stupnjeva slobode (često i u oznaci k) je df = C - 1.
χ2-test slaganja ili aproksimacije nije čest u biostatistici. Uglavnom se
koristi za kategorijske varijable – nominalne i ordinalne varijable.
RjeĎe se koristi za druge tipove varijabli koje se transformiraju u kategorijske
varijable:
1) Likertova ljestvica, koja je po prirodi ordinalna varijabla, ovdje se strogo
shvaća kao ordinalna varijabla, tj. varijabla s kategorijama (razredima, klasama)
koje su poredane u odreĎeni niz ili red;
2) diskretna varijabla se transformira u ordinalnu varijablu tako što se svakoj
brojevnoj vrijednosti pripisuje tzv. klasni razred, ili se intervalima brojevnih
vrijednosti pripisuju klasni razredi (intervali moraju biti iste veličine), a sam
klasni razred je oznaka za klasu (brojevna vrijednost postaje samo brojevna
oznaka za razred);
3) kontinuirana varijabla se takoĎer transformira u ordinalnu varijablu, tako što
se razlomi u intervale brojevnih vrijednosti kojima se pripisuju klasni razredi
(intervali moraju biti iste veličine), a sam klasni razred je oznaka za klasu
(brojevna vrijednost postaje samo brojevna oznaka za razred).
Na početku testiranja potrebno je načiniti kontingencijsku tablicu (slijedeći slajd)
i ispuniti je): prvo se definiraju razredi, zatim se odreĎuju opaţene frekvencije
prebrojavanjem u skupu dobivenih podataka, te se potom izračunavaju
očekivane frekvencije. Svi ovi podaci se upišu u tablicu (zelena polja), a
kontrola zbrajanjem obavlja se na rubu, izvan tablice (ţuta polja).
Razredi (kategorije) Opaţene frekvencije (Oi) Očekivane frekvencije (Ei)
razred 1 O1 E1
razred 2 O2 E2
razred 3 O3 E3
... ... ...
razred C OC EC
Ukupno (N) N N
Kontingencijska tablica opaţenih (Oij) i očekivanih (Eij) frekvencija s C razreda:
Nakon što je kontingencijska tablica popunjena i provjerena, pristupa se
izračunavaju niza vrijednosti: χ2-vrijednosti, broja stupnjeva slobode df,
vjerojatnosti P za nul-hipotezu H0, te kritične vrijednosti χ2* za zadanu razinu
statističke značajnosti α.
Nakon toga slijedi statistička odluka – prihvatiti ili odbaciti nul-hipotezu H0 – te
slijedno tome odbaciti ili prihvatiti alternativnu hipotezu H1 za postojanje
značajnih razlika izmeĎu opaţenih i očekivanih frekvencija tj. hipotezu da
postoji značajno neslaganje izmeĎu podataka i teorijskog modela. Drugim
riječima, alternativna hipoteza tvrdi da empirijska raspodjela i raspodjela
teorijskog modela nisu iste ili pribliţno iste, da se značajno razlikuju s
vjerojatnošću 1 - P.
χ2-test slaganja ili aproksimacije NE koristi se za male uzorke (N < 20).
Primjer 1. Postpartum (postporoĎajna) depresija (PPD). Dva američka
istraţivača postavljanju različite hipoteze s obzirom na postpartum depresiju
majke (PPD), koja se javlja 4-8 tjedana nakon poroda ili kasnije tijekom prve
godine djetetovog ţivota. Istraţivač A tvrdi da 1/3 majki bude manje depresivna,
1/3 više depresivna, a 1/3 majki ni manje ni više depresivna nakon poroda nego
što su bile prije poroda. Istraţivač B tvrdi da je istraţivač A u krivu i odluči
skupiti podatke za potvrdu svoje hipoteze. Intervjuirano je 60 majki prije i nakon
poroĎaja. Iskusni kliničari poslušali su snimke svih intervjua te su svrstali 60
ispitanica u tri razreda s obzirom na stupanj depresije nakon poroda u odnosu
na stanje prije poroda: ocjena -1 (više depresivne) za 13 ispitanica, ocjena 0 (ni
manje ni više depresivne) za 33 ispitanica, te 1 (manje depresivne) za 14
ispitanica. Koji istraţivač je u pravu? Jesu li majke podjednako zastupljene u
trima razredima, ili je njihova zastupljenost bitno drugačija?
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Majke su podjednako zastupljene u sve tri kategorije, tj. ne postoji značajna
razlika izmeĎu opaţenih i očekivanih frekvencija (razlika je nula).
H1: Majke nisu podjednako zastupljene u sve tri kategorije, tj. postoji značajna
razlika izmeĎu opaţenih i očekivanih frekvencija (razlika nije nula).
2) Izbor testa: χ2-test slaganja.
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.05
4) Izračunavanje:
N = 60 ---- veličina cijelog uzorka (sve ispitivane majke) = ukupna frekvencija
C = 3 ---- broj razreda broj stupnjeva slobode df = C - 1 = 2
O1 = 13 ---- opaţena frekvencija za poduzorak više postpartum depresivnih
majki
O2 = 33 ---- opaţena frekvencija za poduzorak majki koje nisu ni više ni manje
postpartum depresivne
O3 = 14 --- opaţena frekvencija za poduzorak manje postpartum depresivnih
majki
-provjera ukupne frekvencije: N = O1 + O2 + O3 = 13 + 33 + 14 = 60
-računanje očekivanih frekvencija (pretpostavlja se diskretna uniformna
raspodjela): E1 = E2 = E3 = N/C = 60/3 = 20, gdje su vjerojatnosti
p1 = p2 = p3 = 1/N, tj. prema definiciji je E1 = N×p1, E2 = N×p2, E3 = N×p3
-izrada kontingencijske tablice:
------------------------ Postpartum depresija majki Opaţene frekvencije (Oi) Očekivane frekvencije (Ei)
više depresivne 13 20
ni manje ni više depresivne 33 20
manje depresivne 14 20
Ukupno (N) 60 60
-računanje χ2-vrijednosti:
a) sloţeniji način (po definiciji):
χ2 = Σi (Oi - Ei)2/Ei = (13 - 20)2/20 + (33 - 20)2/20 + (14 - 20)2/20 = 12.7
b) jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 132/20 + 332/20 + 142/20 - 60 = 12.7
df = C - 1 = 2 ---- broj stupnjeva slobode
U tablici kritičnih vrijednosti χ2-raspodjele (prethodni slajdovi) nalazi se za df = 2
i za α = 0.05 kritična vrijednost χ2* = 5.991. Stoga je P < 0.005.
5) Zaključivanje:
χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se prihvaća.
Odgovor: Opaţene frekvencije postpartum razina depresija majki značajno se
razlikuju od očekivanih (df = 2, χ2 = 12.7, χ2* = 5.991 za α = 0.05, P < 0.005).
Razlika je značajna i na razini α = 0.005 (χ2* = 10.597). Drugim riječima,
hipoteza istraţivača B pokazala se točnom, a hipoteza istraţivača A netočnom.
To znači da majke uglavnom ne podlijeţu jačoj ili slabijoj postpartum depresiji
zbog poroĎaja, a manji broj ih podlijeţe.
Tako na primjer, u jednom članku ispitano je 450 majki [L. I. Alasoom, M. R.
Koura. Predictors of Postpartum Depression in the Eastern Province Capital of
Saudi Arabia. Journal of Family Medicine and Primary Care, 3(2), (2014), 146-
150.], od kojih je 82.2% (370 ispitanica) bilo bez PPD, 9.8% (44 majki) je imalo
umjerenu PPD, a samo 8.0% (36 majki) je imalo tešku PPD.
Razina postpartum depresije je ordinalna varijabla,
Primjer 2. Zastupljenost spolova u uzorku. U jednom istraţivanju nasumično je
odabrano 100 osoba iz populacije koja ima 50% muškaraca i 50% ţena.
Uzorak su činila 44 muškarca i 56 ţena. Jesu li spolovi podjednako zastupljeni
u uzorku, ili je njihova zastupljenost bitno drugačija od očekivane?
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Spolovi su podjednako zastupljeni u uzorku, tj. ne postoji značajna razlika
izmeĎu opaţenih i očekivanih frekvencija (razlika je nula).
H1: Spolovi nisu podjednako zastupljeni u uzroku, tj. postoji značajna razlika
izmeĎu opaţenih i očekivanih frekvencija (razlika nije nula).
2) Izbor testa: χ2-test slaganja.
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.05
4) Izračunavanje:
N = 100 ---- veličina cijelog uzorka = ukupna frekvencija
C = 2 ---- broj razreda broj stupnjeva slobode df = C - 1 = 1
O1 = 44 ---- opaţena frekvencija za poduzorak muškaraca
O2 = 56 ---- opaţena frekvencija za poduzorak ţena
-provjera ukupne frekvencije: N = O1 + O2 = 44 + 56 = 60
-računanje očekivanih frekvencija (pretpostavlja se uniformna raspodjela):
E1 = E2 = N/C = 100/2 = 50
Spol je nominalna varijabla.
-izrada kontingencijske tablice:
-----------------------------------------------------------------
Spol Opažene frekvencije (Oi) Očekivane frekvencije (Ei)
muški 44 50
ženski 56 50
Ukupno (N) 100 100
-računanje χ2-vrijednosti:
a) sloţeniji način (po definiciji):
χ2 = Σi (Oi - Ei)2/Ei = (44 - 50)2/50 + (56 - 50)2/50 = 1.44
b) jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 442/50 + 562/50 - 100 = 1.44
df = C - 1 = 1 ---- broj stupnjeva slobode
U tablici kritičnih vrijednosti χ2-raspodjele (prethodni slajdovi) nalazi se za df = 1
i za α = 0.05 kritična vrijednost χ2* = 3.841. Stoga je P > 0.05.
5) Zaključivanje:
χ2 < χ2* H0 se ne moţe odbaciti – zadrţava se, a H1 se odbacuje.
Odgovor: Opaţene frekvencije spolova u danom uzorku značajno se ne
razlikuju od očekivanih (df = 1, χ2 = 1.44, χ2* = 3.841 za α = 0.05, P > 0.05).
Razlika nije značajna ni na razini α = 0.10 (χ2* = 2.706), što znači da je i
P > 0.10. Drugim riječima, spolovi su podjednako zastupljeni u uzorku, kao što
bi se i očekivalo na njihovu zastupljenosti u populaciji.
Primjer 3. Promjena etničke strukture. Pet godina nakon zadnjeg popisa
stanovništva u jednoj saveznoj drţavi u SAD nasumično je odabran uzorak za
istraţivanje od 2500 ispitanika sa slijedećom etničkom strukturom:
Skupina Broj
-----------------------------------
Bijelci 1732
Crnci 538
Izvorni Amerikanci 32
Hispanoamerikanci 42
Azijati 133
Ostali 23
-----------------------------------
Udio etničkih skupina u spomenutom popisu stanovništva je bio:
Skupina Udio
--------------------------------------
Bijelci 0.743
Crnci 0.216
Izvorni Amerikanci 0.012
Hispanoamerikanci 0.012
Azijati 0.008
Ostali 0.009
--------------------------------------
Provjeriti na temelju uzorka ima li dovoljno dokaza na razini značajnosti 1% da
se raspodjela etničkih skupina promijenila od zadnjeg popisa stanovništva.
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Etnička zastupljenost se nije značajno promijenila u zadnjih pet godina.
H1: Etnička zastupljenost se je značajno promijenila u zadnjih pet godina.
2) Izbor testa: χ2-test slaganja.
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.01
4) Izračunavanje:
N = 2500 ---- veličina cijelog uzorka = ukupna frekvencija
C = 6 ---- broj razreda broj stupnjeva slobode df = C - 1 = 5
-opaţene apsolutne frekvencije su dane u tablici zadatka: zbroj je točno 2500
-računanje očekivanih frekvencija prema prethodno utvrĎenoj raspodjeli
popisom stanovništva: etnička skupina je nominalna varijabla
Ei = N × fr,i = ukupan broj × udio (relativna frekvencija)
E1 = 2500 × 0.743 = 1857.5
E2 = 2500 × 0.216 = 540
E3 = 2500 × 0.012 = 30
E4 = 2500 × 0.012 = 30
E5 = 2500 × 0.008 = 20
E6 = 2500 × 0.009 = 22.5
-izrada kontingencijske tablice:
-----------------------------------------------------------------
Etnička skupina Opažene frekvencije (Oi) Očekivane frekvencije (Ei)
Bijelci 1732 1857.5
Crnci 538 540
Izvorni Amerikanci 32 30
Hispanoamerikanci 42 30
Azijati 133 20
Ostali 23 22.5
Ukupno (N) 2500 2500
-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 17322/1857.5 + 5382/540 + 322/30 + 422/30 + 1332/20 +
+ 232/22.5 - 2500 = 651.88113 ≈ 651.881
df = C - 1 = 5 ---- broj stupnjeva slobode
U tablici kritičnih vrijednosti χ2-raspodjele (slika na idućem slajdu) nalazi se za
df = 5 i za α = 0.01 kritična vrijednost χ2* = 15.086. Stoga je P < 0.001.
5) Zaključivanje:
χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se prihvaća.
Odgovor: Opaţene frekvencije etničkih skupina značajno se razlikuju od onih
prije pet godina (df = 5, χ2 = 1651.881, χ2* = 15.086 za α = 0.01, P < 0.001).
Dakle, etnička struktura savezne drţave se promijenila u zadnjih pet godina.
Primjer 4. Koncentracija α-1-antitripsina. Kod 135 ţena starosti od 46 do 65
godina odreĎena je koncentracija (u g/L) α-1-antitripsina. Dobiveni podaci
ureĎeni su u klasne intervale i prikazani kao raspodjela frekvencija, a zatim su
iz izračunate srednje vrijednosti i standardne devijacije izračunate očekivane
frekvencije za normalnu raspodjelu. Pokazati da li je dobijena raspodjela
normalna. Podaci za opaţene i očekivane frekvencije su u tablici (idući slajd).
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Dobivene frekvencije slijede očekivanu normalnu raspodjelu.
H1: Dobivene frekvencije ne slijede očekivanu normalnu raspodjelu.
-dobivena vrijednost χ2 = 651.881
veća je od bilo koje granične
vrijednost u tablici χ2-raspodjele,
stoga se uzima da je P < 0.001.
Desni krak raspodjele od
granične vrijednosti znači
vjerojatnost α da je hipoteza H0
točna. Lijevo od te granične
vrijednosti površina ispod krivulje
je jednaka vjerojatnosti 1 - α, tj.
vjerojatnost da je H1 točna.
2) Izbor testa: χ2-test
slaganja. Klasni interval
metričke varijable je
ordinalna varijabla.
3) Izbor testnog kriterija:
kritična vrijednost za dani df i
razinu stat. značaj. α = 0.01
4) Izračunavanje:
N = 135 ---- veličina uzorka
C = 8 ---- broj razreda
broj st. slob. df = C - 1 = 7
-zbroj svih opaţenih
frekvencija je 135
-zbroj svih očekivanih
frekvencija je točno 135
-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 22/2 + 102/9 + 272/24 + 412/38 + 312/36 + 162/19 + 62/6 +
22/1 - 135 = 2.8910819 ≈ 2.891 U tablici χ2-raspodjele nalazi se za df = 7 i za
α = 0.05 kritična vrijednost χ2* = 14.067. Stoga je P > 0.05.
5) Zaključivanje: χ2 < χ2* H0 se zadrţava – prihvaća se, a H1 se odbacuje.
Odgovor: Empirijska raspodjela ne razlikuje se značajno od normalne
raspodjele (df = 7, χ2 = 2.891, χ2* = 14.067 za α = 0.05, P > 0.05).
Primjer 5. Učestalost prometnih nesreća. U jednom tjednu zabiljeţen je slijedeći
broj prometnih nesreća na jednoj opasnoj cesti, posljedica kojih je bila hitan
transport unesrećenih u obliţnju bolnicu:
Dan u tjednu Broj nesreća
------------------------------------------
ponedjeljak 4
utorak 2
srijeda 2
četvrtak 3
petak 6
subota 5
nedjelja 7
------------------------------------------
Što se moţe zaključiti iz ove empirijske raspodjele? Jesu li frekvencije
prometnih nesreća podjednake kroz taj tjedan?
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Broj prometnih nesreća je podjednak kroz taj tjedan.
H1: Broj prometnih nesreća je podjednak kroz taj tjedan.
2) Izbor testa: χ2-test slaganja.
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga
4) Izračunavanje:
N = O1 + O2 + … + O7 = 28 ---- veličina cijelog uzorka = ukupna frekvencija
C = 7 ---- broj razreda = broj dana u tjednu broj stup. slobode df = C - 1 = 6
-opaţene apsolutne frekvencije su dane u tablici zadatka: zbroj je točno 2500
-računanje očekivanih frekvencija prema uniformnoj raspodjeli – da su
frekvencije kroz tjedan potpuno jednake: E1 = E2 = … = E7 = N/C = 28/7 = 4.0
-izrada kontingencijske tablice: dan u tjednu je ordinalna varijabla
-----------------------------------------------------------------
Dan u tjednu Opažene frekvencije (Oi) Očekivane frekvencije (Ei)
ponedjeljak 4 4
utorak 2 4
srijeda 2 4
četvrtak 3 4
petak 6 4
subota 5 4
nedjelja 7 4
Ukupno (N) 28 28
-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 42/4 + 22/4 + 22/4 + 32/4 + 62/4 + 52/4 + 72/4 - 28 = 7.75
U tablici χ2-raspodjele nalazi se za df = 6 i za α = 0.05 kritična vrijednost
χ2* = 12.592. Stoga je P > 0.05.
5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti - prihvaća se, a H1 se ne
moţe zadrţati - odbacuje se.
Odgovor: Frekvencije prometnih nesreća kroz taj tjedan na cesti ne razlikuje se
značajno po danima (df = 6, χ2 = 7.75, χ2* = 12.592 za α = 0.05, P > 0.05).
Primjer 6. Autosomno recesivno nasljedne bolesti. U genetičkom testiranju na
jednu autosomno recesivnu nasljednu bolest sudjelovalo je 100 ispitanika s
njihovim roditeljima. Dobivene su slijedeće učestalosti tih 100 ispitanika za
bolesne osobe (kombinacija alela ƇƇ), zdrave nositelje bolesti (kombinacije
alela ƇC) i zdrave nenositelje (kombinacija alela CC):
Genotip Učestalost
---------------------------------
ƇƇ 26
ƇC 45
CC 29
---------------------------------
Shema s primjerom genetičkog nasljeĎivanja dana je na idućem slajdu.
Teorijske relativne frekvencije prema toj shemi jesu: 25% za ƇƇ, 50% za ƇC i
25% za CC. Jesu li razlike izmeĎu empirijske i teorijske raspodjele značajne, tj.
obaraju li ove razlike ili potvrĎuju Hardy-Weinbergov zakon? Ovaj zakon je
zakon genetičke ravnoteţe populacije, prema kojemu se relativne frekvencije
alela odreĎenog lokusa odrţavaju na istoj razini u nizu sukcesivnih generacija
ako nisu prisutni drugi evolucijski čimbenici.
Shema
autosomno
recesivnog
naslijeĎivanja:
Co – zdrav gen
oca
Cm – zdrav gen
majke
Ƈo – oštećeni
gen oca
Ƈm – oštećeni
gen majke
Postoji osam
kombinacija
roditeljskih
gena:
ƇoCm (sin, kćer)
CoƇm (sin, kćer)
ƇoCm (sin, kćer)
ƇoƇm (sin, kćer)
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Razlike u frekvencijama nisu značajne, tj. vrijedi spomenuti genetički zakon.
H1: Razlike u frekvencijama jesu značajne - ne vrijedi spomenuti genet. zakon.
2) Izbor testa: χ2-test slaganja.
3) Izbor testnog kriterija: kritična vrijednost za dani df i α = 0.05
4) Izračunavanje: N = O1 + O2 + O3 = 100, C = 3, df = C - 1 = 2
-računanje očekivanih frekvencija prema teorijskim relativnim frekvencijama
(vjerojatnostima): E1 = E3 = 0.25 × 100 = 25, E2 = 0.50 × 100 = 50
-izrada kontingencijske tablice: genotip je nominalna varijabla
Genotip Opažene frekvencije (Oi) Očekivane frekvencije (Ei)
ƇƇ 26 25
ƇC 45 50
CC 29 25
Ukupno (N) 100 100
-računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 262/25 + 452/50 + 292/25 - 100 = 1.18 U tablici χ2-rasp.
za df = 2 i za α = 0.05 je χ2* = 5.991. Stoga je P > 0.05.
5) Zaključivanje: χ2 < χ2* H0 se prihvaća, a H1 se odbacuje.
Odgovor: Razlike frekvencija nisu značajne (df = 2, χ2 = 1.18, χ2* = 15.991 za
α = 0.05, P > 0.05), što potvrĎuje valjanost spomenutog genetičkog zakona.
III.3.3. χ2-test homogenosti skupa i χ2-test nezavisnosti dviju varijabli
χ2-test homogenosti skupa je čest test, a χ2-test nezavisnosti dviju
varijabli nije čest u biostatistici. Izračunavanja su jednaka za oba testa, ali
su razlike u shvaćanju skupa podataka, u statističkoj hipotezi i
interpretaciji rezultata. Uglavnom se koriste za kategorijske varijable –
nominalne i ordinalne varijable, a rjeđe za druge tipove varijabli koje se
shvaćaju kao ordinalne ili se transformiraju u ordinalnu varijablu (vrijede
ista pravila kao kod χ2-testa slaganja ili aproksimacije).
Ovdje postoje dva statistička obiljeţja od interesa, tj. 2 varijable izmjerene za
statistički skup koji se moţe shvatiti na više načina (kao jedan uzorak, ili kao
dva i više uzoraka). Zato kontingencijska tablica ima oblik matrice, i ona se
posebno radi za opaţene frekvencije i za očekivane frekvencije (idući slajd).
Brojevi se upisuju u zelene ćelije, a sume se provjeravaju izvan tablice (ţuto).
χ2-test homogenosti skupa (Engl. chi-square test for/of homogeneity, chi-
square test for homogeneity of populations, chi-square test for homogeneity of
proportions): cijeli statistički skup shvaća se kao cijela populacija, a sastoji se
od dva ili više podskupova tj. uzoraka ili populacija – ova podjela skupa na
klase (razrede, kategorije) je tzv. vertikalna kategorijska varijabla A u
kontingencijskoj tablici (idući slajd). Varijabla B je svojstvo čija nas raspodjela
zanima po klasama varijable A – podjela horizontalne kategorijske varijable B
na klase ispitivanog svojstva vidljiva je u kontingencijskoj tablici (idući slajd).
Varijabla B
Varijabla A razred B1 razred B2 razred B3 ... razred BC2 Ukupno
razred A1 O11 O12 O13 ... O1C2 A1
razred A2 O21 O22 O23 ... O2C2 A2
razred A3 O31 O32 O33 ... O3C2 A3
... ... ... ... ... ... ...
razred AC1 OC11 OC12 OC13 ... OC1C2 AC1
Ukupno B1 B2 B3 ... BC2 T (N)
Varijabla B
Varijabla A razred B1 razred B2 razred B3 ... razred BC2 Ukupno
razred A1 E11 E12 E13 ... E1C2 A1
razred A2 E21 E22 E23 ... E2C2 A2
razred A3 E31 E32 E33 ... E3C2 A3
... ... ... ... ... ... ...
razred AC1 EC11 EC12 EC13 ... EC1C2 AC1
Ukupno B1 B2 B3 ... BC2 T (N)
Kontingencijska tablica očekivanih frekvencija (Eij) tipa C1×C2:
Kontingencijska tablica opaţenih frekvencija (Oij) tipa C1×C2:
Ovim testom se provjerava postoje li statistički značajne razlike unutar skupa tj.
izmeĎu dvaju ili više uzoraka. Ako takve razlike postoje, skup je nehomogen, a
ako razlike ne postoje onda je skup homogen. Dakle, kao i u slučaju χ2-testa
slaganja, i ovdje se usporeĎuju opaţene i očekivane frekvencije, koje se
definiraju, odreĎuju i izračunavaju na isti način. No kod χ2-testa slaganja radilo
se o jednodimenzionalnoj empirijskoj raspodjeli jer je postojala samo jedna
varijabla. U slučaju χ2-testa homogenosti postoje dvije varijable, pa je teorijska
raspodjela dvodimenzionalna, a empirijska raspodjela moţe imati i više
dimenzija ako uzorci predstavljaju meĎusobno različite raspodjele i još k tome
različite raspodjele u odnosu na teorijsku.
Statistička hipoteza je:
H0: Ne postoje značajne razlike u raspodjeli uzoraka tj. skup je homogen (svi
uzorci imaju istu pretpostavljenu, očekivanu raspodjelu).
H1: Postoje značajne razlike u raspodjeli uzoraka tj. skup je nehomogen (svi
uzorci nemaju istu pretpostavljenu, očekivanu raspodjelu - barem jedan uzorak
ju nema).
Najmanja kontingencijska tablica ima dimenzije 2×2, tj. tipa je 2×2. Ako je broj
klasa za varijablu A jednak C1, a broj klasa za varijablu B je C2, onda
kontingencijska tablica je tipa C1×C2. Zbrojevi po razredima varijable A jesu A1,
A2, A3, …, a zbrojevi po razredima varijable B jesu B1, B2, B3, … Ukupan zbroj
po svim Ai ili Bj je jednak N (u čestoj oznaci i T). Element kontingencijske
tablice Oij ili Eij pripada i-tom razredu varijable A i j-tom razredu varijable B.
Orijentacija kontingencijske tablice tj. izbor dviju varijabli A i B:
-bilo koji izbor dviju varijabli za orijentaciju tablice, tj. koja od dviju varijabli bude
A a koja B, ne utječe na χ2-vrijednost i rezultat statističkog testa, s Yatesovom
korekcijom ili bez korekcije, neovisno takoĎer o tipu tablice;
-preporučuje se za vertikalnu varijablu A uzeti varijablu koja je nezavisna
varijabla, kontrolna varijabla, ili je moguće da bude nezavisna varijabla ili više
nezavisna nego druga varijabla;
-preporučuje se za horizontalnu varijablu B uzeti varijablu koja je zavisna, nije
kontrolna kada je druga kontrolna, ili je moguće da bude zavisna varijabla ili
više zavisna nego druga varijabla;
-ustaljena orijentacija tablice omogućuje bolje razumijevanje i interpretaciju
statističkog testa.
χ2-test nezavisnosti dviju varijabli (Engl. chi-square test for/of
independence): cijeli statistički skup shvaća se kao jedinstvena populacija ili
uzorak, a sastoji se od dva ili više podskupova tj. poduzoraka – ova podjela
skupa na klase (razrede, kategorije) varijabli A i B je ista kao za χ2-test
homogenosti. Ovim testom se provjerava postoji li statistički značajna veza tj.
zavisnost izmeĎu dviju varijabli koje nisu korelirane ili sparene, drugim riječima
jesu li dvije takve varijable meĎusobno zavisne ili nezavisne. Takva provjera
nezavisnosti moguća je samo kada se ispituju dva obiljeţja istog uzorka.
Često je teško utvrditi što je uzorak a što ispitivani skup, tako da je za mnoge
skupove podataka moguće obaviti i χ2-test homogenosti i χ2-test nezavisnosti.
Statistička hipoteza je:
H0: Dvije kategorijske varijable meĎusobno su nezavisne.
H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.
χ2-test homogenosti skupa vrlo je čest u biostatistici, dok χ2-test
nezavisnosti dviju varijabli i nije baš čest.
Općenito se svaki običan χ2-test tj. χ2-test bez ikakve korekcije zove i
Pearsonov χ2-test (Engl. Pearson’s χ2-test).
U slučaju Yatesove korekcije, χ2-test se zove Yatesov χ2-test ili χ2-test s
Yatesovom korekcijom (Engl. Yates’s χ2-test, χ2-test with Yates’s correction).
Yatesovu korekciju preporučeno je učiniti u slučajevima da:
1- kontingencijska tablica ima dimenzije 2×2, dok je N izmeĎu 20 i 40 ili barem
jedna ćelija sadrţi očekivanu frekvenciju koja je manja od 5;
2- više od 20% ćelija u kontingencijskoj tablici većih dimenzija sadrţi očekivane
frekvencije koje su manje od 5 (ili se neke ćelije spajaju da se ovo izbjegne);
3- ukupna frekvencija N je manja od 20 tj. radi se o malom skupu.
U slučaju da jedna ili više ćelija sadrži nulu kao očekivanu frekvenciju,
onda se χ2-test nikako ne može izvesti. Prilikom određivanja opaženih
frekvencija za bilo koji χ2-test, svaka statistička jedinica (osoba, ispitanik,
bolesnik itd.) smije se pojaviti samo jednom a ne dvaput ili više puta.
Za male skupove, umjesto χ2-testa izvodi se Fisherov egzaktni test (Engl.
Fisher’s exact test, koji nije predmet ovog kolegija).
Primjer 1A. Liječenje abdominalne boli. U slijedećoj tablici navedeni su rezultati
(frekvencije) za 154 bolesnika s abdominalnom boli, od kojih je jedna grupa bila
liječena pinaverij bromidom (dvije tablete dnevno), a druga placebom.
Bol prisutna
Terapija DA NE Ukupno
pinaverij bromid 6 57 63
placebo 30 61 91
Ukupno 36 118 154
Testirati efikasnost soli (pinaverij bromida) u liječenju abdominalne boli
upotrebom χ2-testa.
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Grupe s različitim terapijama se bitno ne razlikuju u frekvencijama, tj. razlike
izmeĎu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od
nule).
H1: Grupe s različitim terapijama se bitno razlikuju u frekvencijama, tj. razlike
izmeĎu opaţenih i očekivanih frekvencija jesu bitne (bitno su različite od nule).
2) Izbor testa: χ2-test homogenosti skupa, uz Yatesovu korekciju jer se radi o
kontingencijskoj tablici tipa 2×2.
Broj uzoraka: 2 uzorka – uzorak bolesnika liječen pinaverij bromidnom
terapijom i uzorak bolesnika liječen placebo terapijom. Skup = 2 uzorka
Varijable (nominalne): vrsta terapije - nezavisna varijabla s dvije vrijednosti
(pinaverij bromid i placebo), prisutnost boli – zavisna varijabla s dvije vrijednosti
(DA i NE)
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1) × ( 2 - 1) = 1
4) Izračunavanje: T = 154 ---- ukupna frekvencija
A1 = 63, A2 = 91 --- frekvencije nezavisne varijable (vrsta terapije)
B1 = 36, B2 = 118 --- frekvencije zavisne varijable (prisutnost boli)
-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka
-računanje očekivanih frekvencija prema uniformnoj raspodjeli za svaku
varijablu: općenito je Eij = Ai Bj /T tj. Eij : Ai = Bj : T odnosno
Eij : Bj = Ai : T, kako slijedi:
E11:36 = 63:154 tj. E11:63= 36:154 E11 = 36×63/154 = 14.727273 ≈ 14.73
E12:118 = 63:154 tj. E12:63= 118:154 E12 = 118×63/154 = 48.272727 ≈ 48.27
E21:36 = 91:154 tj. E21:91= 36:154 E21 = 36×91/154 = 21.272727 ≈ 21.27
E22:118 = 63:154 tj. E22:63= 118:154 E22 = 118×91/154 = 69.727273 ≈ 69.73
Najlakše je koristiti opću formulu Eij = Ai Bj /T
-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):
-----------------------------------------------------------------
Bol prisutna
Terapija DA NE Ukupno
pinaverij bromid 14.73 48.27 63
placebo 21.27 69.73 91
Ukupno 36 118 154
-Pearsonov ili običan χ2-test:
a) računanje χ2-vrijednosti na sloţeniji način (po definiciji):
χ2 = Σi (Oi - Ei)2/Ei = (6 - 14.73)2/14.73 + (57 - 48.27)2/48.27 +
+ (30 - 21.27)2/21.27 + (61 - 69.73)2/69.73 = 11.428968 ≈ 11.429
b) računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 62/14.73 + 572/48.27 + 302/21.27 + 612/69.73 - 154 =
= 11.428968 ≈ 11.429
-Yatesov χ2-test ili χ2-test s Yatesovom korekcijom:
χ2 = Σi (|Oi - Ei| - 0.5)2/Ei = (|6 - 14.73| - 0.5)2/14.73 + (|57 - 48.27| - 0.5)2/48.27 +
+ (|30 - 21.27| - 0.5)2/ 21.27 + (|61 - 69.73| -0.5)2/69.73 = 10.157298 ≈ 10.157
U tablici χ2-rasp. za df = 1 i α = 0.05 je χ2* = 3.841. Stoga je P < 0.002.
5) Zaključivanje: χ2 > χ2* H0 se odbacuje, a H1 se prihvaća.
Odgovor: Razlike opaţenih i očekivanih frekvencija su značajne (df = 1,
χ2* = 3.841 za α = 0.05; bez korekcije - χ2 = 11.429, P < 0.001; s korekcijom - χ2
= 10.157, P < 0.002), što potvrĎuje učinkovitost pinaverij bromida.
Primjer 1B. Isti problem (primjer 1A), s istim podacima. Zadatak je χ2-testom
utvrditi jesu li dvije kategorijske varijable (vrsta terapije i prisutnost boli)
meĎusobno nezavisne. Izračunavanje je istovjetno, samo je interpretacija
rezultata drugačija.
----------------------------------------------------
U odnosu na prethodni primjer 1A, razlike postoje svega na nekoliko mjesta,
dok je računski postupak u svemu isti:
-1) Postavljanje statističke hipoteze:
H0: Dvije kategorijske varijable meĎusobno su nezavisne.
H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.
-2) Izbor testa: χ2-test nezavisnosti dviju varijabli, uz Yatesovu korekciju jer se
radi o kontingencijskoj tablici tipa 2×2. Skup od 154 ispitanika moţe se smatrati
jednim uzorkom koji je izvučen iz iste populacije (svi bolesnici imaju
abdominalnu bolest, samo se liječe na dva različita načina).
-5) Zaključivanje: χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se ne
moţe odbaciti - prihvaća se. Vrijednost χ2 odreĎuje razinu meĎusobne
povezanosti dviju varijabli – što je ova vrijednost veća varijable su jače
povezane tj. manje neovisne.
-Odgovor: Dvije varijable su značajno zavisne (df = 1, χ2* = 3.841 za α = 0.05;
bez korekcije - χ2 = 11.429, P < 0.001; s korekcijom - χ2 = 10.157, P < 0.002),
što potvrĎuje učinkovitost pinaverij bromida. Drugim riječima, pinaverij bromid
je bolja terapija, a placebo slabija terapija za abdominalnu bol.
Primjer 2A. Liječenje Hodgkinovog limfoma. U slijedećoj tablici navedeni su
rezultati (frekvencije) za 140 bolesnika s Hodgkinovim limfomom, od kojih je
jedna grupa bila liječena kemoterapijom, a druga radioterapijom.
Odgovor na terapiju
Terapija potpun djelomičan nikakav Ukupno
kemoterapija 50 20 10 80
radioterapija 20 20 20 60
Ukupno 70 40 30 140
Testirati efikasnost vrsta terapija u liječenju Hodgkinovog limfoma upotrebom
χ2-testa.
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Grupe s različitim terapijama se bitno ne razlikuju u frekvencijama, tj. razlike
izmeĎu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od
nule).
H1: Grupe s različitim terapijama se bitno razlikuju u frekvencijama, tj. razlike
izmeĎu opaţenih i očekivanih frekvencija jesu bitne (bitno su različite od nule).
2) Izbor testa: χ2-test homogenosti skupa, bez Yatesove korekciju jer se radi o
kontingencijskoj tablici tipa 2×3, s velikom ukupnom frekvencijom
(T = 140 > 40) i velikim brojem u svakoj ćeliji (10 - 50). Skup = 2 uzorka
Broj uzoraka: 2 uzorka – uzorak bolesnika liječen kemoterapijom i uzorak
bolesnika liječen radioterapijom.
Varijable: vrsta terapije (nominalna) - nezavisna varijabla s dvije vrijednosti
(kemoterapija i radioterapija), odgovor bolesti na terapiju (ordinalna) - zavisna
varijabla s tri vrijednosti (potpuna, djelomična i nikakva)
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga
df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1) × (2 - 1) = 2
4) Izračunavanje: T = 140 ---- ukupna frekvencija
A1 = 80, A2 = 60 --- frekvencije nezavisne varijable (vrsta terapije)
B1 = 70, B2 = 40, B3 = 30 --- frekvencije zavisne varijable (odgovor na terapiju)
-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka
-računanje očekivanih frekvencija prema uniformnoj raspodjeli za svaku
varijablu: Eij = Ai Bj /T
E11 = 70×80/140 = 40
E12 = 40×80/140 = 22.857143 ≈ 23
E13 = 30×80/140 = 17.142857 ≈ 17
E21 = 70×60/140 = 30
E22 = 40×60/140 = 17.142857 ≈ 17
E23 = 30×60/140 = 12.857143 ≈ 13
-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):
-----------------------------------------------------------------
Odgovor na terapiju
Terapija potpun djelomičan nikakav Ukupno
kemoterapija 40 23 17 80
radioterapija 30 17 13 60
Ukupno 70 40 30 140
-Pearsonov ili običan χ2-test:
a) računanje χ2-vrijednosti na sloţeniji način (po definiciji):
χ2 = Σi (Oi - Ei)2/Ei = (50 - 40)2/40 + (20 - 23)2/23 + (10 - 17)2/17 + (20 - 30)2/30 +
(20 - 17)2/17 + (20 - 13)2/13 = 13.405633 ≈ 13.406
b) računanje χ2-vrijednosti na jednostavniji način (po izvedenom izrazu):
χ2 = Σi (Oi)2/Ei - N = 502/40 + 202/23 + 102/17 + 202/30 + 202/17 + 202/13 - 140 =
= 13.405633 ≈ 13.406
U tablici χ2-rasp. za df = 2 i α = 0.05 je χ2* = 5.991. Stoga je P < 0.002.
5) Zaključivanje: χ2 > χ2* H0 se odbacuje, a H1 se prihvaća.
Odgovor: Razlike izmeĎu opaţenih i očekivanih frekvencija su značajne (df = 2,
χ2* = 5.991 za α = 0.05; χ2 = 13.406, P < 0.002), što potvrĎuje bitne razlike
meĎu terapijama. Kemoterapija se pokazala učinkovitijom od radioterapije.
Primjer 2B. Isti problem (primjer 2A), s istim podacima. Zadatak je χ2-testom
utvrditi jesu li dvije kategorijske varijable (vrsta terapije i odgovor Hodgkinovog
limfoma na terapiju) meĎusobno nezavisne. Izračunavanje je istovjetno, samo
je interpretacija rezultata drugačija.
----------------------------------------------------
U odnosu na prethodni primjer 2A, razlike postoje svega na nekoliko mjesta,
dok je računski postupak u svemu isti:
-1) Postavljanje statističke hipoteze:
H0: Dvije kategorijske varijable meĎusobno su nezavisne.
H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.
-2) Izbor testa: χ2-test nezavisnosti dviju varijabli. Skup od 140 ispitanika moţe
se smatrati jednim uzorkom koji je izvučen iz iste populacije (svi bolesnici imaju
Hodgkinov limfom, samo se liječe na dva različita načina).
-5) Zaključivanje: χ2 > χ2* H0 se ne moţe zadrţati – odbacuje se, a H1 se ne
moţe odbaciti - prihvaća se. Vrijednost χ2 odreĎuje razinu meĎusobne
povezanosti dviju varijabli – što je ova vrijednost veća varijable su jače
povezane tj. manje neovisne.
-Odgovor: Dvije varijable su značajno zavisne (df = 2, χ2* = 5.991 za α = 0.05,
χ2 = 11.429, P < 0.002), što potvrĎuje učinkovitost kemoterapije u odnosu na
radioterapiju. Drugim riječima, kemoterapija je bolja terapija, a radioterapija je
slabija terapija za Hodgkinov limfom.
Primjer 3. Odnos astme i gripe. U jednom eksperimentu se provjeravao odnos
izmeĎu astmatične krize i pojave gripe. Ispitano je 150 nasumično odabrana
djeteta u domu zdravlja u jednoj gradskoj četvrti. Dobiveni su slijedeći podaci o
frekvencijama za vremensko razdoblje od jednog tjedna:
Astma/Gripa DA NE
DA 27 34
NE 42 47
Jesu li astmatični napadi i pojava gripe meĎusobno nezavisni? Uzeti α = 4%.
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Dvije kategorijske varijable meĎusobno su nezavisne.
H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.
2) χ2-test nezavisnosti dviju varijabli. Yatesova korekcija je potrebna jer se radi
od kontingencijskoj tablici tipa 2×2, s velikom ukupnom frekvencijom i velikim
brojem u svakoj ćeliji. Skup = 1 uzorak
Broj uzoraka: 1 uzorak – djeca koja imaju ili nemaju astmatičnu krizu i/ili gripu.
Varijable: astmatična kriza (nominalna) - varijabla s dvije vrijednosti (DA i NE),
pojava gripe (nominalna) - varijabla s dvije vrijednosti (DA i NE). Sama astma je
nezavisna varijabla u odnosu na gripu, pa je pogodnije astmatične napade
staviti formalno na mjesto nezavisne varijable tj. u vertikalan poloţaj, a pojavu
gripe u horizontalan poloţaj.
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.04
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1) × (2 - 1) = 1
4) Izračunavanje:
-puna kontingencijska tablica opaţenih frekvencija, na osnovu danih podataka:
Pojava gripe
Astmatična kriza DA NE Ukupno
DA 27 34 61
NE 42 47 89
Ukupno 69 81 150
T = 150 ---- ukupna frekvencija
A1 = 61, A2 = 89 --- frekvencije formalno nezavisne varijable (astmatična kriza)
B1 = 69, B2 = 81 --- frekvencije formalno zavisne varijable (pojava gripe)
-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T
E11 = 61×69/150 = 28.06
E12 = 61×81/150 = 32.94
E21 = 89×69/150 = 40.94
E22 = 89×81/150 = 48.06
-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):
-----------------------------------------------------------------
Pojava gripe
Astmatična kriza DA NE Ukupno
DA 28.06 32.94 61
NE 40.94 48.06 89
Ukupno 69 81 150
-Pearsonov ili običan χ2-test:
računanje χ2-vrijednosti po definiciji:
χ2 = Σi (Oi - Ei)2/Ei = (27 - 28.06)2/28.06 + (34 - 32.94)2/32.94 +
+ (42 - 40.94)2/40.94 + (47 - 48.06)2/48.06 = 0.1249774 ≈ 0.125
-Yatesov χ2-test ili χ2-test s Yatesovom korekcijom:
χ2 = Σi (|Oi - Ei| - 0.5)2/Ei = (|27 - 28.06| - 0.5)2/28.06 + (|34 - 32.94| - 0.5)2/32.94
+ (|42 - 40.94| - 0.5)2/40.94 + (|47 - 48.06| -0.5)2/48.06 = 0.0348816 ≈ 0.034
U tablici χ2-rasp. za df = 1 i α = 0.04 je χ2* = 4.218. Stoga je P > 0.04.
5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti pa se prihvaća, a H1 se ne
moţe zadrţati pa se odbacuje.
Odgovor: Za ispitan uzorak djece, dvije varijable nisu značajno zavisne (df = 1,
χ2* = 4.218 za α = 0.04; bez korekcije - χ2 = 0.125, P > 0.04; s korekcijom –
χ2 = 0.034, P > 0.04). Drugim riječima, astmatični napadi nisu uzrokovani ili
pojačani gripom, niti oni utječu na pojavnost gripe.
Primjer 4. Liječenje HIV pozitivnih osoba. Provedeno je istraţivanje o kvaliteti
liječenja HIV pozitivnih osoba u sustavu javnog zdravstva u Brazilu. U gradu A,
nasumično je odabrano 150 HIV pozitivnih osoba, a u gradu B 200 HIV
pozitivnih osoba. Koristeći podatke dane u slijedećoj tablici, moţe li se tvrditi da
vlada isto mišljenje u oba grada, uz α = 5%?
Grad/Liječenje dobro zadovoljavajuće loše
A 73 37 40
B 94 61 45
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Gradovi se bitno ne razlikuju u frekvencijama, tj. razlike izmeĎu opaţenih i
očekivanih frekvencija nisu bitne (nisu bitno različite od nule).
H1: Gradovi se bitno razlikuju u frekvencijama, tj. razlike izmeĎu opaţenih i
očekivanih frekvencija nisu bitne (bitno su različite od nule).
2) Izbor testa: χ2-test homogenosti skupa, bez Yatesove korekciju jer se radi o
kontingencijskoj tablici tipa 2×3, s velikom ukupnom frekvencijom i velikim
brojem u svakoj ćeliji. Skup = 2 uzorka
Broj uzoraka: 2 uzorka – ispitanici u gradu A i ispitanici u gradu B.
Varijable: grad (nominalna) - nezavisna varijabla s dvije vrijednosti (A i B),
kvaliteta liječenja HIV pozitivnih osoba (ordinalna) - zavisna varijabla s tri
vrijednosti (dobro, zadovoljavajuće, loše)
Kvaliteta liječenja HIV pozitivnih osoba
Grad dobro zadovoljavajuće loše Ukupno
A 73 37 40 150
B 94 61 45 200
Ukupno 167 98 85 350
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.05; df = (broj redova - 1) × (broj stupaca - 1) = (2-1)×(3 -1) = 2
4) Izračunavanje:
-puna kontingencijska tablica opaţenih frekvencija, na osnovu danih podataka:
4) Izračunavanje: T = 350 ---- ukupna frekvencija
A1 = 150, A2 = 200 --- frekvencije nezavisne varijable (grad)
B1 = 167, B2 = 98, B3 = 85 --- frekvencije zavisne varijable (kvaliteta liječenja)
-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T
E11 = 150×167/350 = 71.571429 ≈ 72
E12 = 150×98/350 = 42
E13 = 150×85/350 = 36.428571 ≈ 36
E21 = 200×167/350 = 95.428571 ≈ 95
E22 = 200×98/350 = 56
E23 = 200×85/350 = 48.571429 ≈ 49
-izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):
-----------------------------------------------------------------
Kvaliteta liječenja HIV pozitivnih osoba
Grad dobro zadovoljavajuće loše Ukupno
A 72 42 36 150
B 95 56 49 200
Ukupno 167 98 85 350
-Pearsonov ili običan χ2-test:
računanje χ2-vrijednosti po definiciji:
χ2 = Σi (Oi - Ei)2/Ei = (73 - 72)2/72 + (37 - 42)2/42 + (40 - 36)2/36 + (94 - 95)2/95 +
(61 - 56)2/56 + (45 - 49)2/49 = 1.8370569 ≈ 1.837
U tablici χ2-rasp. za df = 2 i α = 0.05 je χ2* = 5.991. Stoga je P > 0.05.
5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti pa se prihvaća, a H1 se ne
moţe zadrţati pa se odbacuje.
Odgovor: Razlike izmeĎu opaţenih i očekivanih frekvencija nisu značajne
(df = 2, χ2* = 5.991 za α = 0.05; χ2 = 1.837, P > 0.05). Drugim riječima,
anketirane HIV pozitivne osobe u dva brazilska grada imaju isto mišljenje o
kvaliteti liječenja HIV pozitivnih osoba u sustavu javnog zdravstva.
Primjer 5. Učinkovitost kemoterapije. Ispitivana je reakcija karcinoma na
kemoterapiju u četiri skupine onkoloških bolesnika. Bolesnici su svrstani u tri
skupine, prema reakciji karcinoma na kemoterapiju: slaba, osrednja i jaka.
Ispitati za α = 2% reagiraju li svi tipovi karcinoma na isti način. Podaci u tablici:
Razina reakcije karcinoma na kemoterapiju
Tip karcinoma slaba osrednja jaka Ukupno
Tip I 51 33 16 100
Tip II 58 29 13 100
Tip III 48 42 30 120
Tip IV 26 38 16 80
Ukupno 183 142 75 400
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Tipovi karcinoma se bitno ne razlikuju u frekvencijama, tj. razlike izmeĎu
opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od nule).
H1: Tipovi karcinoma se bitno razlikuju u frekvencijama, tj. razlike izmeĎu
opaţenih i očekivanih frekvencija su bitne (bitno su različite od nule).
2) Izbor testa: χ2-test homogenosti skupa, bez Yatesove korekciju jer se radi o
kontingencijskoj tablici tipa 4×3, s velikom ukupnom frekvencijom i velikim
brojem u svakoj ćeliji. Skup = 4 uzorka
Broj uzoraka: 4 uzorka – ispitanici s tipovima karcinoma I, II, III i IV.
Varijable: tip karcinoma (nominalna) - nezavisna varijabla s četiri vrijednosti
(tipovi: I, II, III i IV), razina reakcije karcinoma na kemoterapiju (ordinalna) -
zavisna varijabla s tri vrijednosti (slaba, osrednja, jaka)
3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke
značajnosti α = 0.02
df = (broj redova - 1) × (broj stupaca - 1) = (4 - 1) × (3 - 1) = 6
4) Izračunavanje: T = 140 ---- ukupna frekvencija
A1 = 100, A2 = 100, A3 = 120, A4 = 80 --- frekvencije nezavisne varijable (tip
karcinoma)
B1 = 183, B2 = 142, B3 = 75 --- frekvencije zavisne varijable (razina reakcije
karcinoma na kemoterapiju)
-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka
-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T
E11 = 100×183/400 = 45.75
E12 = 100×142/400 = 35.5
E13 = 100×75/400 = 18.75
E21 = 100×183/400 = 45.75
E22 = 100×142/400 = 35.5
E23 = 100×75/400 = 18.75
E31 = 120×183/400 = 54.9
E32 = 120×142/400 = 42.6
E33 = 120×75/400 = 22.5
E41 = 80×183/400 = 36.6
E42 = 80×142/400 = 28.4
E43 = 80×75/400 = 15
Razina reakcije karcinoma na kemoterapiju
Tip karcinoma slaba osrednja jaka Ukupno
Tip I 45.75 35.5 18.75 100
Tip II 45.75 35.5 18.75 100
Tip III 54.9 42.6 22.5 120
Tip IV 36.6 28.4 15 80
Ukupno 183 142 75 400
-izrada kontingencijske tablice za očekivane frekvencije:
-----------------------------------------------------------------
-Pearsonov ili običan χ2-test:
računanje χ2-vrijednosti po definiciji:
χ2 = Σi (Oi - Ei)2/Ei = (51 - 45.75)2/45.75 + (33 - 35.5)2/35.5 + (16 - 18.75)2/18.75
+ (58 - 45.75)2/45.75 + (29 - 35.5)2/35.5 + (13 - 18.75)2/18.75 + (48 - 54.9)2/
54.9 + (42 - 42.6)2/42.6 + (30 - 22.5)2/22.5 + (26 - 36.6)2/36.6 + (38 - 28.4)2/
28.4 + (16 - 15)2/15 = 17.172724 ≈ 17.173
U tablici χ2-rasp. za df = 6 i α = 0.02 je χ2* = 15.033. Stoga je P < 0.02.
5) Zaključivanje: χ2 > χ2* H0 se ne moţe zadrţati pa se odbacuje, a H1 se ne
moţe odbaciti pa se prihvaća.
Odgovor: Razlike izmeĎu reakcija različitih tipova karcinoma na kemoterapiju
su značajne (df = 6, χ2* = 15.033 za α = 0.02; χ2 = 17.173, P < 0.02). Dakle,
tipovi karcinoma su značajno različito reagirali na kemoterapiju.
Primjer 6. Operacija duodenalng ulkusa. Četiri skupine bolesnika s
duodenalnim ulkusom podvrgnute su operaciji različitim operacijama, koje su
se razlikovale u postotku uklonjenog gastričnog tkiva: 0% (vagotomija i
drenaţa, V+D), 25% (vagotomija i antrektomija, V+A), 50% (vagotomija i
piloroplastija, V+P) i 75% (gastrektomija i Roux-en-Y rekonstrukcija, G+R).
Bolesnici su svrstani u razrede prema jačini različitih neţeljenih posljedica
operacije: nikakva, slaba, osrednja. Provjeriti postoji li povezanost izmeĎu
postotka uklonjenog gastričnog tkiva i jačine neţeljenih posljedica operacije.
Podaci su dani u tablici:
Jačina neželjenih posljedica operacije
Tip operacije nikakva slaba osrednja Ukupno
V+D (0%) 61 28 7 96
V+A (25%) 68 23 13 104
V+P (50%) 58 40 12 110
G+R (75%) 53 38 6 97
Ukupno 240 129 38 407
----------------------------------------------------
1) Postavljanje statističke hipoteze:
H0: Dvije kategorijske varijable meĎusobno su nezavisne.
H1: Dvije kategorijske varijable nisu meĎusobno nezavisne.
2) χ2-test nezavisnosti dviju varijabli. Yatesova korekcija nije potrebna jer se
radi od kontingencijskoj tablici tipa 4×3, s velikom ukupnom frekvencijom i
velikim brojem u svakoj ćeliji. Skup = 1 uzorak
Broj uzoraka: 1 uzorak – bolesnici kojima je operiran duodenalnog ulkusa.
Varijable: tip operacije (ordinalna, zbog postotka uklonjenog gastričnog tkiva) -
varijabla s četiri vrijednosti (0%: V+D, 25%: V+A, 50%: V+P, 75%: G+R), jačina
neţeljenih posljedica operacije (ordinalna) - varijabla s tri vrijednosti (nikakva,
slaba, osrednja).
3) Izbor testnog kriterija: kritična vrijednost za dani df i α = 0.05
df = (broj redova - 1) × (broj stupaca - 1) = (4 - 1) × (3 - 1) = 6
4) Izračunavanje: T = 407 ---- ukupna frekvencija
A1 = 96, A2 = 104, A3 = 110, A4 = 97 --- frekvencije nezavisne varijable (tip
operacije); B1 = 240, B2 = 129, B3 = 38 --- frekvencije zavisne varijable (jačina
neţeljenih posljedica operacije)
-opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka
-računanje očekivanih frekvencija prema uniformnoj raspodjeli: Eij = Ai Bj /T
E11 = 96×240/407 = 56.609337 ≈ 57 E31 = 110×240/407 = 64.864865 ≈ 65
E12 = 96×129/407 = 30.427518 ≈ 30 E32 = 110×129/407 = 34.864865 ≈ 35
E13 = 96×38/407 = 8.963145 ≈ 9 E33 = 110×38/407 = 10.27027 ≈ 10
E21 = 104×240/407 = 61.326781 ≈ 61 E41 = 97×240/407 = 57.199017 ≈ 57
E22 = 104×129/407 = 32.963145 ≈ 33 E42 = 97×129/407 = 30.744472 ≈ 31
E23 = 104×38/407 = 9.7100737 ≈ 10 E43 = 97×38/407 = 9.0565111 ≈ 9
Jačina neželjenih posljedica operacije
Tip operacije nikakva slaba osrednja Ukupno
V+D (0%) 57 30 9 96
V+A (25%) 61 33 10 104
V+P (50%) 65 35 10 110
G+R (75%) 57 31 9 97
Ukupno 240 129 38 407
-izrada kontingencijske tablice za očekivane frekvencije:
-----------------------------------------------------------------
-Pearsonov ili običan χ2-test:
računanje χ2-vrijednosti po definiciji:
χ2 = Σi (Oi - Ei)2/Ei = (61 - 57)2/57 + (28 - 30)2/30 + (7 - 9)2/9 + (68 - 61)2/61 + (23
- 33)2/33 + (13 - 10)2/10 + (58 - 65)2/65 + (40 - 35)2/35 + (12 - 10)2/10 + (53 -
57)2/57 + (38 - 31)2/31+ (6 - 9)2/9 = 10.32154 ≈ 10.322
U tablici χ2-rasp. za df = 6 i α = 0.05 je χ2* = 12.592. Stoga je P > 0.05.
5) Zaključivanje: χ2 < χ2* H0 se ne moţe odbaciti pa se zadrţava, a H1 se ne
moţe zadrţati pa se odbacuje.
Odgovor: Za ispitan uzorak bolesnika, dvije varijable nisu značajno zavisne
(df = 6, χ2* = 12.592 za α = 0.06, χ2 = 10.322, P > 0.05). Drugim riječima, jačina
neţeljenih posljedica operacije ne ovisi značajno o tipu operacije (tj. o postotku
uklonjenog gastričnog tkiva).
III.3.4. Primjeri zadataka o χ2-testu homogenosti uzorka
Primjeri slijedećih zadataka odnose se na slučaj χ2-testa homogenosti uzorka,
tj. χ2-testa kojim se ispituje homogenost cijelog skupa (gdje je skup shvaćen
kao jedan uzorak) odnosno postoje li značajne razlike unutar skupa = razlike
izmeĎu originalnih uzoraka (podskupova) različitih veličina. Broj takvih uzoraka
(podskupova) moţe biti dva, tri, četiri i više.
Ovaj tip χ2-testa primijenjen je u svim zadacima radi jednostavnosti.
U zadatku se ne traţi izračunavanje očekivanih vrijednosti i χ2-vrijednosti, jer su
takvi računi komplicirani i dugo traju da bi se rješavali za vrijeme ispita.
MeĎutim, uz sve zadane podatke, u zadatku se moţe traţiti:
-izraĎivanje kontingencijske tablice opaţenih vrijednosti
-odreĎivanje broja stupnjeva slobode
-nalaţenje kritične vrijednosti χ2* i vjerojatnosti P iz priloţene tablice
-statističko zaključivanje tj. statističko odlučivanje o postavljenoj hipotezi
(hipoteza da nema ili ima značajnih razlika u skupu tj. izmeĎu podskupova)
Vjerojatnost P uvijek se određuje iz tablica za najmanji α za koji je χ2 > χ2*.
Ako α za statističko testiranje nije navedeno, uzima se vrijednost α = 0.05.
U odgovoru zadatka se uvijek navode informacije o rješenju i konačnom
statističkom testiranju.
Primjer 1. Postoperativne komplikacije. Slučajno su odabrani uzorci od po 800
bolesnika koji su operirani u gradu A i u gradu B. Bolesnici su svrstani u dva
razreda – koji nemaju i koji imaju postoperativne komplikacije. Ispitivalo se
χ2-testom na razini značajnosti α = 5% postoje li značajne razlike izmeĎu
bolesnika iz gradova A u B, upotrebom χ2-testa za homogenost skupa. Sastaviti
kontingencijsku tablicu za opaţene vrijednosti, kada je poznato da je broj
pacijenata bez postoperativnih komplikacija u gradu A jednak 762, a u oba
grada je 1522. Odrediti broj stupnjeva slobode.
---------------------------
Postupak:
a) podaci:
-dva nezavisna uzorka u skupu: uzorak 1 – uzorak bolesnika operiranih u gradu
A, uzorak 2 – uzorak bolesnika operiranih u gradu B χ2-test homogenosti
skupa, gdje se ispituje postoji li značajna razlika izmeĎu bolesnika operiranih u
dva grada s obzirom na postoperativne komplikacije
-veličine uzoraka: 800 (uzorak 1) i 800 (uzorak 2) veličina skupa: 1600
-varijable: grad - mjesto stanovanja (nominalna) s dvije vrijednosti (A i B);
postojanje postoperativnih komplikacija (nominalna) s dvije vrijednosti (DA i NE)
kontingencijska tablica tipa 2×2 Yatesova korekcija
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti
-broj stupnjeva slobode
Postoperativne komplikacije
Grad DA NE Ukupno
A 38 762 800
B 40 760 800
Ukupno 78 1522 1600
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti:
1- konstruira se tablica veličine 2x2, jer je utvrĎen broj razreda dviju varijabli
2- vertikalno se postavi varijabla koja je nezavisna varijabla, kontrolna varijabla
ili je moguće da bude nezavisna varijabla; u ovom slučaju to je grad – mjesto
stanovanja
3- horizontalno se postavi varijabla koja je zavisna, nije kontrolna niti
nezavisna, ili je moguće da bude zavisna varijabla; u ovom slučaj to je
postojanje postoperativnih komplikacija
-postavljanje ovih varijabli je stvar konvencije, a ovaj poredak ili obratan
poredak daju istu χ2-vrijednost bez korekcije ili s korekcijom
4- upišu se brojevne vrijednosti iz zadatka u pripadne ćelije u tablici
5- izračunavaju se brojevi u prazne ćelije (označeni crveno u gornjoj tablici),
postepenim računanjem iz poznatih brojeva:
800 + 800 = 1600 800 - 762 = 38
1600 - 1522 = 78 1522 - 762 = 760 800 - 760 = 40
6- provjeravaju se SVI zbrojevi, da se isprave eventualna kriva izračunavanja ili
upisivanja zadanih brojeva:
-horizontalni zbrojevi: 38 + 762 = 800 40 + 760 = 800 78 + 1522 = 1600
-vertikalni zbrojevi: 38 + 40 = 78 762 + 760 = 1522 800 + 800 = 1600
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1
Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih
vrijednosti je slijedeća:
Postoperativne komplikacije
Grad DA NE Ukupno
A 38 762 800
B 40 760 800
Ukupno 78 1522 1600
Primjer 2. Postoperativne komplikacije 2. Nastavljajući se na problem u
Primjeru 1, na osnovi izraĎene kontingencijske tablice dobivena je vrijednost
χ2 = 0.054 bez korekcije i χ2 = 0.013 s Yatesovom korekcijom. Testirati hipotezu
da nema značajne razlike u pojavljivanju postoperativnih komplikacija u
gradovima A i B, za α = 5% i df = 1. Podaci za χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 5% = 0.05
-broj stupnjeva slobode: df = 1
-χ2-vrijednost: χ2 = 0.054 bez korekcije, χ2 = 0.013 s Yatesovom korekcijom,
dakle meĎusobno su bliske vrijednosti
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u pojavljivanju postoperativnih
komplikacija u gradovima A i B. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u pojavljivanju
postoperativnih komplikacija u gradovima A i B.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 3.84
Testiranje: χ2 < χ2* tj. 0.054 < 3.84 i 0.013 < 3.84 H0 se prihvaća, a H1 se
odbacuje, a vjerojatnost za H0 je P > 0.05.
Odgovor: Razlike u pojavljivanju postoperativnih komplikacija u gradovima A i B
nisu značajne (df = 1, χ2* = 3.84 za α = 0.05; χ2 = 0.054 bez korekcije,
χ2 = 0.013 s Yatesovom korekcijom, P > 0.05).
Primjer 3. Pušači i nepušači. U jednom istraţivanju o pušenju u nekoj zemlji
nasumično je odabrano 1000 ispitanika, od kojih je 328 bilo pušača od kojih
125 ţena. Znajući da je bilo 515 ispitanica, sastaviti kontingencijsku tablicu za
opaţene vrijednosti, za χ2-test homogenosti kojim se ispituje razlika izmeĎu
muškaraca i ţena s obzirom na učestalost pušenja. Izračunati df.
---------------------------
Postupak:
a) podaci:
-dva nezavisna uzorka u skupu: uzorak 1 – uzorak muškaraca, uzorak 2 –
uzorak ţena χ2-test homogenosti skupa, gdje se ispituje postoji li značajna
razlika izmeĎu spolova s obzirom na učestalost pušenja
-veličina skupa: 1000
-varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski); pušenje
(nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 2×2
Yatesova korekcija
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti
-broj stupnjeva slobode
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti (idući slajd), povodeći se
istim pravilima kao u Primjeru 1.
-izračunavanje brojeva za prazne ćelije:
1000 - 515 = 485 328 - 125 = 203
1000 - 328 = 672 515 - 125 = 390
485 - 203 = 282 ili 672 - 390 = 282
-provjera ispravnosti tablice zbrojevima:
horizontalno: 203 + 282 = 485 125 + 390 = 515 328 + 672 = 1000
vertikalno: 203 + 125 = 328 282 + 390 = 672 485 + 515 = 1000
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1
Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih
vrijednosti:
Pušenje
Spol DA NE Ukupno
muškarci 203 282 485
žene 125 390 515
Ukupno 328 672 1000
Pušenje
Spol DA NE Ukupno
muškarci 203 282 485
žene 125 390 515
Ukupno 328 672 1000
Primjer 4. Pušači i nepušači 2. Nastavljajući se na problem u Primjeru 3, na
osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 35.037 bez
korekcije i χ2 = 34.244 s Yatesovom korekcijom. Testirati hipotezu da nema
značajne razlike u učestalosti pušenja meĎu spolovima, za α = 0.1% i df = 1.
Podaci za χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.1% = 0.001
-broj stupnjeva slobode: df = 1
-χ2-vrijednost: χ2 = 35.037 bez korekcije, χ2 = 34.244 s Yatesovom korekcijom,
dakle meĎusobno su bliske vrijednosti
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u učestalosti pušenja meĎu
spolovima. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u učestalosti
pušenja meĎu spolovima.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 10.83
Testiranje: χ2 > χ2* tj. 35.037 >> 3.84 i 34.244 >> 3.84 H0 se odbacuje, a H1
se prihvaća, a vjerojatnost za H0 je P < 0.001.
Odgovor: Razlike u učestalosti pušenja meĎu spolovima su značajne (df = 1,
χ2* = 10.83 za α = 0.001; χ2 = 35.037 bez korekcije, χ2 = 34.244 s Yatesovom
korekcijom, P < 0.001).
Primjer 5. Učinkovitost lijekova. U jednom istraţivanju o učinkovitosti dvaju
lijekova A i B s obzirom na odreĎenu bolest sudjelovalo je 160 osoba, od kojih
su 55 osjetile a 25 nisu osjetile učinak lijeka A. Sveukupno je 100 osoba osjetilo
djelovanje lijekova. Sastaviti kontingencijsku tablicu za opaţene vrijednosti, za
χ2-test homogenosti kojim se ispituje jesu li lijekovi A i B podjednako učinkoviti
odnosno neučinkoviti. Odrediti broj stupnjeva slobode.
---------------------------
Postupak:
a) podaci:
-dva nezavisna uzorka u skupu: uzorak 1 – osobe liječene lijekom A, uzorak 2 –
osobe liječene lijekom B χ2-test homogenosti skupa, gdje se ispituje postoji li
značajna razlika izmeĎu osoba liječenih lijekom A i B s obzirom na učinkovitost
-veličina skupa: 160
-varijable: terapija - lijek (nominalna) s dvije vrijednosti (A i B); postojanje učinka
lijeka (nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa
2×2 Yatesova korekcija
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti
-broj stupnjeva slobode
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim
pravilima kao u Primjeru 1.
Postojanje učinka lijeka
Lijek DA NE Ukupno
A 55 25 80
B 45 35 80
Ukupno 100 60 160
-izračunavanje brojeva za prazne ćelije:
55 + 25 = 80 160 - 80 = 80 160 - 100 = 60 100 - 55 = 45
60 - 25 = 35 ili 80 - 45 = 35
-provjera ispravnosti tablice zbrojevima:
horizontalno: 55 + 25 = 80 45 + 35 = 80 100 + 60 = 160
vertikalno: 55 + 45 = 100 25 + 35 = 60 80 + 80 = 160
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1
Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih
vrijednosti:
Postojanje učinka lijeka
Lijek DA NE Ukupno
A 55 25 80
B 45 35 80
Ukupno 100 60 160
Primjer 6. Učinkovitost lijekova 2. Nastavljajući se na problem u Primjeru 5, na
osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 2.667 bez
korekcije i χ2 = 2.16 s Yatesovom korekcijom. Testirati hipotezu da postoji
značajna razlika u učinkovitosti dvaju lijekova, za α = 1% i df = 1. Podaci za
χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 1% = 0.01
-broj stupnjeva slobode: df = 1
-χ2-vrijednost: χ2 = 2.667 bez korekcije, χ2 = 2.16 s Yatesovom korekcijom,
dakle meĎusobno bliske vrijednosti
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u učinkovitosti lijekova A i B.
slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u učinkovitosti
lijekova A i B.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 6.64
Testiranje: χ2 < χ2* tj. 2.667 < 6.64 i 2.16 < 6.64 H0 se prihvaća, a H1 se
odbacuje, a vjerojatnost za H0 je P > 0.01.
Odgovor: Razlike u učinkovitosti dvaju lijekova nisu značajne (df = 1, χ2* = 6.64
za α = 0.01; χ2 = 2.667 bez korekcije, χ2 = 2.16 s Yatesovom korekcijom,
P > 0.01).
Primjer 7. Albumin u urinu. U jednom istraţivanju je kod 33 zdrave osobe, 50
osoba sa različitim nefrološkim dijagnozama i 33 osobe sa kardiološkim
bolestima dokazivan albumin u urinu. Pozitivan rezultat na albumin u urinu
dobijen je kod 4 zdrave osobe, 41 pacijenta sa nefrološkim i 8 pacijenata sa
kardiloškim oboljenjima. Sastaviti kontingencijsku tablicu za opaţene
vrijednosti, za χ2-test homogenosti kojim se ispituje postoji li razlika izmeĎu
učestalosti pojavljivanja pozitivnih rezultata za albumin u urinu kod ovih grupa.
Odrediti broj stupnjeva slobode.
---------------------------
Postupak:
a) podaci:
-tri nezavisna uzorka u skupu: uzorak 1 – zdrave osobe, uzorak 2 – nefrološki
bolesnici, uzorak 3 – kardiološki bolesnici χ2-test homogenosti skupa, gdje
se ispituje postoji li značajna razlika izmeĎu tri uzorka ispitanika s obzirom na
pozitivan rezultat albumina u urinu
-varijable: zdravstveno stanje (nominalna) s tri vrijednosti (zdrave osobe,
nefrološki bolesnici, kardiološki bolesnici); prisutnost albumina u urinu
(nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 3×2
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti
-broj stupnjeva slobode
Prisutnost albumina u urinu
Zdravstveno stanje DA NE Ukupno
zdrave osobe 4 29 33
nefrološki bolesnici 41 9 50
kardiološki bolesnici 8 25 33
Ukupno 53 63 116
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim
pravilima kao u Primjeru 1.
-izračunavanje brojeva za prazne ćelije:
4 + 41 + 8 = 53 33 - 4 = 29 50 - 41 = 9 33 - 8 = 25
33 + 50 + 33 = 116
116 - 53 = 63 ili 29 + 9 + 25 = 63
-provjera računa:
horizontalno: 4 + 29 = 33 41 +9 = 50 8 + 25 = 33 53 + 63 = 116
vertikalno: 4 + 41 + 8 = 53 29 + 9 + 25 = 63 33 + 50 + 33 = 116
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(2 -1) = 2
Odgovor: Broj stupnjeva slobode je df = 2. Kontingencijska tablica opaţenih
vrijednosti (idući slajd):
Prisutnost albumina u urinu
Zdravstveno stanje DA NE Ukupno
zdrave osobe 4 29 33
nefrološki bolesnici 41 9 50
kardiološki bolesnici 8 25 33
Ukupno 53 63 116
Primjer 8. Albumin u urinu 2. Nastavljajući se na problem u Primjeru 7, na
osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 47.669.
Testirati hipotezu da postoji značajna razlika izmeĎu triju skupina osoba u
prisutnosti albumina u urinu, za α = 0.05 i df = 2. Podaci za χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82
3 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.05
-broj stupnjeva slobode: df = 2
-χ2-vrijednost: χ2 = 47.669
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u prisutnosti albumina u urinu triju
skupina osoba. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u prisutnosti
albumina u urinu triju skupina osoba.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 5.99
Testiranje: χ2 > χ2* tj. 47.669 >> 5.99 H0 se odbacuje, a H1 se prihvaća, a
vjerojatnost za H0 je P < 0.001.
Odgovor: Razlike u prisutnosti albumina u urinu triju skupina osoba (zdrave
osobe, nefrološki i kardiološki bolesnici) su značajne (df = 2, χ2* = 5.99 za α =
0.05, χ2 = 47.669, P < 0.001). Kao što je za očekivati, nefrološki bolesnici
najčešće imaju albumin u urinu.
Primjer 9. Alfa-1-antitripsin. Kod bolesnika oboljelih od bronhijalne astme
(N=30) i grupe oboljelih od obstruktivnog bronhitisa (N=30), kao i kod zdravih
osoba (N=30) odreĎena je koncentracija α-1-antitripsina nefelometrijskom
metodom (vrijednosti su date u g/L). Sastaviti kontingencijsku tablicu, ako je
kod zdravih jedan rezultat bio iznad gornje granice referentnih vrijednosti, kod
bolesnika sa astmom je bilo 8, a kod bolesnika sa bronhitisom 5 povišenih
vrijednosti. χ2-testom se provjerava da li ima razlike u broju osoba koje imaju
povišene vrijednosti u odnosu na zdrave. Odrediti broj stupnjeva slobode.
---------------------------
Postupak:
a) podaci:
-tri nezavisna uzorka u skupu: uzorak 1 – oboljeli od bronhijalne astme, uzorak
2 – oboljeli od obstruktivnog bronhitisa, uzorak 3 – zdrave osobe χ2-test
homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeĎu tri uzorka
ispitanika s obzirom na normalnu odnosno povišenu koncentraciju
α-1-antitripsina u krvi.
-varijable: zdravstveno stanje (nominalna) s tri vrijednosti (oboljeli od
bronhijalne astme, oboljeli od obstruktivnog bronhitisa, zdrave osobe);
prisutnost α-1-antitripsina u krvi (nominalna) s dvije vrijednosti (normalna i
povišena) kontingencijska tablica tipa 3×2
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti
-broj stupnjeva slobode
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim
pravilima kao u Primjeru 1.
Koncentracija α-1-antitripsina
Zdravstveno stanje normalna povišena Ukupno
oboljeli od bronhijalne
astme
22 8 30
oboljeli od obstruktivnog
brohnitisa
25 5 30
zdrave osobe 29 1 30
Ukupno 76 14 90 -izračunavanje brojeva za prazne ćelije:
30 + 30 + 30 = 90 30 - 8 = 22 30 - 5 = 25 30 - 1 = 29
33 + 30 + 30 = 90 8 + 5 + 1 = 14
90 - 14 = 76 ili 22 + 25 + 29 = 76
-provjera računa:
horizontalno: 22 + 8 = 30 25 +5 = 30 29 + 1 = 30 76 + 14 = 90
vertikalno: 22 + 25 + 29 = 76 8 + 5 + 1 = 14 30 + 30 + 30 = 90
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(2 -1) = 2
Odgovor: Broj stup. slobode df = 2. Kontingencijska tablica opaţenih vrijednosti:
Koncentracija α-1-antitripsina
Zdravstveno stanje normalna povišena Ukupno
oboljeli od bronhijalne
astme
22 8 30
oboljeli od obstruktivnog
brohnitisa
25 5 30
zdrave osobe 29 1 30
Ukupno 76 14 90
Primjer 10. Alfa-1-antitripsin 2. Nastavljajući se na problem u Primjeru 9, na
osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 6.259.
Testirati hipotezu da postoji značajna razlika izmeĎu triju skupina osoba u
prisutnosti α-1-antitripsina u krvi, za α = 0.05 i df = 2. Podaci za χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.05
-broj stupnjeva slobode: df = 2
-χ2-vrijednost: χ2 = 6.259
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u prisutnosti α-1-antitripsina u krvi
triju skupina osoba. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u prisutnosti
α-1-antitripsina u krvi triju skupina osoba.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 5.99
Testiranje: χ2 > χ2* tj. 6.259 > 5.99 H0 se odbacuje, a H1 se prihvaća, a
vjerojatnost za H0 je P < 0.05.
Odgovor: Razlike u koncentraciji α-1-antitripsina u krvi triju skupina osoba
(oboljeli od bronhijalne astme, oboljeli od obstruktivnog bronhitisa, zdrave
osobe) su značajne (df = 2, χ2* = 5.99 za α = 0.05, χ2 = 6.259, P < 0.05). Kao
što je za očekivati, plućni bolesnici imaju značajnu koncentraciju ovog enzima.
Primjer 11. Pušenje i spol. U jednom anketiranju studenata o zastupljenosti
pušača dobiveni su slijedeći rezultati u tablici dolje, za koju je potrebno sastaviti
kontingencijsku tablicu opaţenih vrijednosti, sa svrhom da se χ2-testom utvrdi
postoje li značajne razlike u zastupljenosti pušača izmeĎu spolovima. Legenda
za tablicu: spol: 1 – muški, 2 – ţenski; pušenje: 1 – da, 2 – povremeno, 3 – ne.
Izračunati broj stupnjeva slobode.
spol pušenje spol pušenje spol pušenje
1 3 1 3 2 1
2 3 2 3 1 1
2 1 1 3 2 1
2 3 2 3 2 1
1 1 2 3 2 1
2 1 2 3 1 2
2 2 2 3 1 1
2 2 1 1 2 1
1 3 2 1 2 1
Status pušenja
Spol da povremeno ne Ukupno
muški 4 1 4 9
ženski 9 2 7 18
Ukupno 13 3 11 27
---------------------------
Postupak:
a) podaci:
-dva nezavisna uzorka u skupu: uzorak 1 – uzorak muških ispitanika, uzorak 2
– uzorak ţenskih ispitanika χ2-test homogenosti skupa, gdje se ispituje
postoji li značajna razlika izmeĎu dva uzorka ispitanika tj. spolova s obzirom na
status pušenja
-varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski); status pušenja
(ordinalna) s tri vrijednosti (da, povremeno, ne) kontingenc. tablica tipa 2×3
b) traţi se:
-kontingencijska tablica opaţenih vrijednosti
Izračunavanje:
Izrada kontingencijske tablice opaţenih vrijednosti: prvo se načine
jednostavnija prebrajanja (brojevi u crnom) – po spolovima, zatim brojevi
povremenih pušača jer ih je malo, broj svih pušača i svih nepušača; zatim se
ostatak ćelija popuni iz razlika ili zbrojeva već upisanih brojeva (brojevi u
crvenom).
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(3 -1) = 2
Odgovor: Broj stupnjeva slobode je df = 2. Kontingencijska tablica opaţenih
vrijednosti je:
Status pušenja
Spol da povremeno ne Ukupno
muški 4 1 4 9
ženski 9 2 7 18
Ukupno 13 3 11 27
Primjer 12. Pušenje i spol 2. Nastavljajući se na problem u Primjeru 11, na
osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 0.084, a s
Yatesovom korekcijom χ2 = 0.396. Testirati hipotezu da postoji značajna razlika
izmeĎu spolova s obzirom na status pušenja, za α = 0.05 i df = 2. Podaci za
χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.05
-broj stupnjeva slobode: df = 2
-χ2-vrijednost: χ2 = 0.084, s Yatesovom korekcijom χ2 = 0.396 zbog ćelija s
brojevima koji su manji od 5
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u statusu pušenja spolova.
slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u statusu pušenja
spolova.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 5.99
Testiranje: χ2 < χ2* tj. 0.084 < 5.99 i 0.396 < 5.99 H0 se svakako zadrţava jer
se ne moţe odbaciti, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.
Odgovor: Razlike u statusu pušenja spolova nisu značajne (df = 2, χ2* = 5.99 za
α = 0.05, χ2 = 0.084, χ2 = 0.396 s Yatesovom korekcijom, P > 0.05). Dakle,
studenti muškog i ţenskog spola podjednako puše odnosno ne puše.
Primjer 13. Stavovi o liječniku. U jednoj ustanovi provedena je anketa meĎu 23
djelatnika i 26 djelatnica te je ispitivan stav prema liječniku u ambulanti te
ustanove. Iz dobivenih odgovora moglo se zaključiti je li stav prema liječniku u
cjelini „pozitivan“ ili „negativan“. Budući da je liječnik u toj ambulanti bila ţena,
postavljeno je pitanje razlikuju li se muškarci od ţena u stavu prema toj liječnici.
Dobiveni su slijedeći rezultati:
Muškarci (N=23) Pozitivan stav 14 Negativan stav 9
Ţene (N=26) Pozitivan stav 9 Negativan stav 17
Sastaviti kontingencijsku tablicu opaţenih frekvencija, sa svrhom da bi se
χ2-testom moglo utvrditi postoje li značajne razlike u stavovima spolova prema
toj liječnici.
---------------------------
Postupak:
a) podaci:
-dva nezavisna uzorka u skupu: uzorak 1 – djelatnici muškarci, uzorak 2 –
djelatnici ţene χ2-test homogenosti skupa, gdje se ispituje postoji li značajna
razlika izmeĎu dva uzorka ispitanika s obzirom stav prema liječnici u ustanovi
-varijable: spol (nominalna) s dvije vrijednosti (muški zaposlenici, ţenski
zaposlenici); stav prema liječnici ustanove (nominalna) s dvije vrijednosti
(pozitivan stav i negativna stav) kontingencijska tablica tipa 2×2
-kontingencijska tablica opaţenih vrijednosti
Stav prema liječnici
Spol pozitivan negativan Ukupno
muški 14 9 23
ženski 9 17 26
Ukupno 23 26 49
Izračunavanje:
Izrada kontingencijske tablice opaţenih vrijednosti kao u Primjeru 1: prvo se
upišu zadani brojevi (brojevi u crnom), zatim se upišu preostali brojevi (brojevi u
crvenom) koji su u ovom slučaju zbrojevi nekih zadanih brojeva.
Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(2 -1) = 1
Odgovor: Broj stupnjeva slobode je df = 1 jer je tablica tipa 2×2.
Kontingencijska tablica opaţenih vrijednosti je slijedeća:
Stav prema liječnici
Spol pozitivan negativan Ukupno
muški 14 9 23
ženski 9 17 26
Ukupno 23 26 49
Primjer 14. Stavovi o liječniku 2. Nastavljajući se na problem u Primjeru 13, na
osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 3.377, a s
Yatesovom korekcijom χ2 = 2.406. Testirati hipotezu da postoji značajna razlika
izmeĎu spolova s obzirom na stav prema liječnici ustanove, za α = 0.05 i df = 1.
Podaci za χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.05
-broj stupnjeva slobode: df = 1
-χ2-vrijednost: χ2 = 3.377, s Yatesovom korekcijom χ2 = 2.406 zbog tipa 2×2
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u stavu spolova prema liječnici
ustanove. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u stavu spolova
prema liječnici ustanove.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 3.84
Testiranje: χ2 < χ2* tj. 3.377 < 3.84 i 2.406 < 3.84 H0 se svakako zadrţava jer
se ne moţe odbaciti, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.
Odgovor: Razlike u stavu spolova prema liječnici ustanove nisu značajne
(df = 2, χ2* = 3.84 za α = 0.05, χ2 = 3.377, χ2 = 2.406 s Yatesovom korekcijom,
P > 0.05).
Primjer 15. Epidemija gripe. Medicinski centar je izvršio analizu oboljenja od
gripe u ustanovama gdje su neki zaposlenici bili cijepljeni 11 mjeseci prije
epidemije, neki neposredno prije epidemije, a neki nisu bili uopće cijepljeni.
Dobiveni su sljedeći rezultati za ukupno 911 oboljelih i 8295 koji nisu oboljeli:
od 2899 necijepljenih samo 402 osobe su oboljele, a meĎu cijepljenima
neposredno prije epidemije samo 131 osoba je oboljelo a 2009 nije oboljelo.
Sastaviti kontingencijsku tablicu opaţenih frekvencija, sa svrhom da bi se
χ2-testom moglo utvrditi postoje li značajne razlike u zdravstvenom statusu
ispitanika s obzirom na njihov status cijepljenja. Izračunati broj stupnjeva
slobode.
---------------------------
Postupak:
a) podaci:
-tri nezavisna uzorka u skupu: uzorak 1 – necijepljeni, uzorak 2 – cijepljeni 11
mjeseci prije epidemije, uzorak 3 – cijepljeni neposredno prije epidemije
χ2-test homogenosti skupa, gdje se ispituje postoji li značajna razlika meĎu
uzorcima s obzirom na status zdravlja za vrijeme epidemije gripe
-varijable: status cijepljenja (ordinalna) s tri vrijednosti (necijepljeni, cijepljeni 11
mjeseci prije epidemije i cijepljeni neposredno prije epidemije); zdravstveni
status (nominalna) s dvije vrijednosti (oboljeli od gripe i nisu oboljeli)
kontingencijska tablica tipa 3×2
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti
-broj stupnjeva slobode
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim
pravilima kao u Primjeru 1.
Zdravstveni status
Status cijepljenja oboljeli nisu oboljeli Ukupno
necijepljeni 402 2497 2899
cijepljeni 11 mjeseci prije epidemije 378 3789 4167
cijepljeni neposredni prije epidemije 131 2009 2140
Ukupno 911 8295 9206
-izračunavanje brojeva za prazne ćelije:
911 - (131 + 402) = 378 2899 - 402 = 2497
131 + 2009 = 2140 911 + 8295 = 9206 8295 - (2009 + 2497) = 3789
378 + 3789 = 4167 ili 9206 - (2899 + 2140) = 4167
-provjera računa:
horizontalno:
402 + 2497 = 2899 378 + 3789 = 4167
131 + 2009 = 2140 911 + 8295 = 9206
vertikalno:
402 + 378 + 131 = 911 2497 + 3789 + 2009 = 8295
2899 + 4167 + 2140 = 9206
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(2 -1) = 2
Odgovor: Broj stup. slob. df = 2. Kontingencijska tablica opaţenih vrijednosti:
Zdravstveni status
Status cijepljenja oboljeli nisu oboljeli Ukupno
necijepljeni 402 2497 2899
cijepljeni 11 mjeseci prije epidemije 378 3789 4167
cijepljeni neposredni prije epidemije 131 2009 2140
Ukupno 911 8295 9206
Primjer 16. Epidemija gripe 2. Nastavljajući se na problem u Primjeru 15, na
osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 88.637.
Testirati hipotezu da postoji značajna razlika uzoraka s različitim statusom
cijepljenja s obzirom na njihov status zdravlja tijekom epidemije gripe, za
α = 0.001 i df = 2. Podaci za χ2-raspodjelu:
df vjerojatnost α
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.001
-broj stupnjeva slobode: df = 2
-χ2-vrijednost: χ2 = 88.637
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u zdravstvenom statusu skupina s
obzirom na status cijepljenja. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u zdravstvenom
statusu skupina s obzirom na status cijepljenja.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1; u tu svrhu treba
pronaći odgovarajuću kritičnu vrijednost u tablici χ2-raspodjele
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 10.83
Testiranje: χ2 > χ2* tj. 88.637 >> 10.83 H0 se svakako ne moţe zadrţati pa se
odbacuje, a H1 se zadrţava, a vjerojatnost za H0 je P < 0.001.
Odgovor: Razlike u zdravstvenom statusu triju uzoraka su značajne (df = 2,
χ2* = 10.83 za α = 0.001, χ2 = 88.637, P < 0.001). Vidljivo je da meĎu
cijepljenima ima najmanje oboljelih.
Primjer 17. Stav prema doniranju organa. U istraţivanju o znanju i stanovnika
jedne hrvatske ţupanije o javnozdravstvenom značaju doniranja organa
dobiveni su slijedeći podaci. Anketirano je 82 osoba mlaĎe (18-35 g.), 77 zrelije
(36-55 g.) i 41 starije (55 i više g.) dobi. Na pitanje bi li donirali organe svojih
bliţnjih nakon njihove smrti, s DA odgovorilo je 80 ispitanika, s NE 44, a s NE
ZNAM 76 ispitanika. Tri najčešća odgovora su bila: NE ZNAM u mlaĎoj skupini
(44 osoba), DA u zreloj skupini (39 ispitanika), i DA opet u mlaĎoj skupini (24
osoba). Odgovor s najmanjoj frekvencijom je bio NE ZNAM u starijoj skupini (9
osoba). Sastaviti kontingencijsku tablicu opaţenih frekvencija i izračunati broj
stupnjeva slobode.
---------------------------
Postupak:
a) podaci:
-tri nezavisna uzorka u skupu: uzorak 1 – mlaĎi (18-35 g.) ispitanici, uzorak 2 –
zreliji (36-55 g.) ispitanici, uzorak 3 – stariji (55 i više g.) ispitanici
χ2-test homogenosti skupa - ispituje se postoji li značajna razlika meĎu
uzorcima s obzirom na stav o doniranju organa svojih bliţnjih nakon njihove
smrti
-varijable: dob (ordinalna) s tri vrijednosti (mlaĎi, zreliji i stariji ispitanici); stav o
doniranju organa svojih bliţnjih (nominalna) s tri vrijednosti (DA, NE i NE
ZNAM) kontingencijska tablica tipa 3×3
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti i broj stupnjeva slobode
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim
pravilima kao u Primjeru 1.
82 + 77 + 41 = 200 80 - (24 + 39) = 17 82 - (24 + 44) = 14
76 - (44 + 9) = 23 41 - (17 + 9) = 15 44 - (14 + 15) = 15
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (3 - 1)×(3 -1) = 4
Stav o doniranju organa bližnjih
Dob DA NE NE ZNAM Ukupno
18-35 g. 24 14 44 82
36-55 g. 39 15 23 77
> 55 g. 17 15 9 41
Ukupno 80 44 76 200
-provjera računa:
horizontalno:
24 + 14 + 44 = 82 39 + 15 + 23 = 77
17 + 15 + 9 = 41 80 + 44 + 76 = 200
vertikalno:
24 + 39 + 17 = 80 14 + 15 + 15 = 44
44 + 23 + 9 = 76 82 + 77 + 41 = 200
Odgovor: Broj stup. slob. df = 4. Kontingencijska tablica opaţenih vrijednosti:
Stav o doniranju organa bližnjih
Dob DA NE NE ZNAM Ukupno
18-35 g. 24 14 44 82
36-55 g. 39 15 23 77
> 55 g. 17 15 9 41
Ukupno 80 44 76 200
Primjer 18. Stav prema doniranju organa 2. Nastavljajući se na problem u
Primjeru 17, na osnovi izraĎene kontingencijske tablice dobivena je vrijednost
χ2 = 19.067. Testirati hipotezu da postoji značajna razlika uzoraka (dobnih
skupina) s obzirom na njihov stav o doniranju organa bliţnjih. Uzeti kritičnu
vrijednost χ2* = 9.488 za α = 0.05 i df = 4.
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.05
-broj stupnjeva slobode: df = 4
-χ2-vrijednost: χ2 = 9.488
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u stavu triju dobnih skupina o
doniranju organa bliţnjih. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u stavu triju
dobnih skupina o doniranju organa bliţnjih.
b) traţi se:
-testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 9.488
Testiranje: χ2 > χ2* tj. 19.067 > 9.488 H0 se ne moţe zadrţati pa se
odbacuje, a H1 se zadrţava, a vjerojatnost za H0 je P < 0.05.
Odgovor: Razlike u stavu triju dobnih skupina o doniranju organa bliţnjih su
značajne (df = 4, χ2* = 10.83 za α = 0.05, χ2 = 19.067, P < 0.05).
Primjer 19. Metabolički sindrom. Ispitane su dvije skupine – 100 shizofrenih
bolesnika u jednoj klinici za psihijatriju, te 100 zdravih osoba (kontrolna
skupina) na sistematskom pregledu. Cilj istraţivanja je bio utvrditi učestalost i
uzroke metaboličkog sindroma kod oboljelih od shizofrenije. OdreĎene su
kritične vrijednosti pet sastavnica metaboličkog sindroma tj. opsega struka
(abdominalna pretilost), serumskih triglicerida (hipertrigliceridemija), serumskog
HDL-kolesterola (nizak HDL-kolesterol), krvnog tlaka (hipertenzija) i razine
glukoze u krvi (hiperglikemija). Dobiveni su slijedeći podaci za respektivno 0, 1,
2, 3, 4 i 5 sastavnica metaboličkog sindroma: 16, 16, 22, 29, 11 i 6 shizofrenih
bolesnika; 21, 22, 28, 17, 8 i 4 ispitanika iz kontrolne skupine. Sastaviti
kontingencijsku tablicu opaţenih frekvencija i izračunati broj stupnjeva slobode.
---------------------------
Postupak:
a) podaci:
-dva nezavisna uzorka u skupu: uzorak 1 – shizofreni bolesnici, uzorak 2 –
zdrave osobe (kontrolna skupina) χ2-test homogenosti skupa, gdje se ispituje
postoji li značajna razlika meĎu uzorcima s obzirom na broj sastavnica
metaboličkog sindroma
-varijable: zdravstveni status (nominalna) s dvije vrijednosti (shizofreni bolesnici
i zdravi ispitanici); broj sastavnica metaboličkog sindroma (diskretna) sa šest
vrijednosti (0, 1, 2, 3, 4 i 5) kontingencijska tablica tipa 2×6
b) traţe se:
-kontingencijska tablica opaţenih vrijednosti i broj stupnjeva slobode
Izračunavanje:
I) Izrada kontingencijske tablice opaţenih vrijednosti, upisujući vrijednosti u
odgovarajuće ćelije (brojevi u crnom) i računanje suma (brojevi u crvenom)
II) Računanje broja stupnjeva slobode df:
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(6 -1) = 5
Odgovor: Broj stup. slob. df = 5. Kontingencijska tablica opaţenih vrijednosti:
Broj sastavnica metaboličkog sindroma
Zdravstveni status 0 1 2 3 4 5 Ukupno
shizofreni bolesnici 16 16 22 29 11 6 100
zdravi ispitanici 21 22 28 17 8 4 100
Ukupno 37 38 50 46 19 10 200
Broj sastavnica metaboličkog sindroma
Zdravstveni status 0 1 2 3 4 5 Ukupno
shizofreni bolesnici 16 16 22 29 11 6 100
zdravi ispitanici 21 22 28 17 8 4 100
Ukupno 37 38 50 46 19 10 200
Primjer 20. Metabolički sindrom 2. Nastavljajući se na problem u Primjeru 19,
na osnovi izraĎene kontingencijske tablice dobivena je vrijednost χ2 = 6.347, s
Yatesovom korekcijom χ2 = 4.531. Testirati hipotezu da postoji značajna razlika
uzoraka (shizofrenih bolesnika i zdravih osoba) s obzirom broj sastavnica
metaboličkog sindroma. Uzeti kritičnu vrijednost χ2* = 11.070 za α = 0.05 i
df = 5.
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.05
-broj stupnjeva slobode: df = 5
-χ2-vrijednost: χ2 = 6.347, s Yatesovom korekcijom χ2 = 4.531
-statistička hipoteza:
Nul-hipoteza (H0): Nema značajne razlike u broju sastavnica metaboličkog
sindroma izmeĎu shizofrenih bolesnika i zdravih ispitanika. slijedno tome je:
Alternativna, suprotna hipoteza (H1): Postoje značajne razlike u broju
sastavnica metaboličkog sindroma izmeĎu shizofrenih bolesnika i zdravih
ispitanika.
b) traţi se: testirati hipotezu H0 i odlučiti koja će se zadrţati, H0 ili H1
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 11.070
Testiranje: χ2 < χ2* tj. 6.347 < 11.070 i 4.531 < 11.070 H0 se ne moţe odbaciti
pa se prihvaća, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.
Odgovor: Razlike izmeĎu shizofrenih bolesnika i zdravih ispitanika u broju
sastavnica metaboličkog sindroma nisu značajne (df = 5, χ2* = 11.070 za
α = 0.05, χ2 = 6.347, s Yatesovom korekcijom χ2 = 4.531, P > 0.05). Broj
sastavnica metaboličkog sindroma je ovdje shvaćen kao kategorijska
(ordinalna) varijabla.
Primjer 21. Srčani udar.
Bolnički podaci za manju
skupinu bolesnika koji su
imali srčani udar su dani u
tablici desno. Varijable: spol
(M – muški, F – ţenski);
dijagnoza prema
meĎunarodnoj klasifikaciji
(41041, 51051 i 41091 prema
mjestu oštećenja srca);
dijagnostička grupa bolesnika
(121 – bolesnici koji su
preţivjeli s kardiovaskularnim
komplikacijama, 122 –
bolesnici koji su preţivjeli bez
kardiovaskularnih
komplikacija, 123 – umrli).
Sastaviti kontingecijsku
tablicu i odrediti df za
testiranje razlika spolova s
obzirom na dijagnozu i
dijagnostičke skupine.
---------------------------
Postupak:
a) podaci:
-dva nezavisna uzorka u skupu: uzorak 1 – muškarci, uzorak 2 – ţene
χ2-test homogenosti skupa, gdje se ispituje postoji li značajna razlika meĎu
spolovima s obzirom na dijagnozu oštećenja srca i s obzirom na pripadnost
dijagnostičkoj grupi
-varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski bolesnici);
dijagnoza oštećenja srca prema meĎunarodnoj klasifikaciji (nominalna) s tri
vrijednosti (41041, 41051 i 41091); dijagnostička grupa (nominalna) s tri
vrijednosti (121, 122 i 123) dvije kontingencijske tablice tipa 2×3
b) traţe se:
-dvije kontingencijske tablice opaţenih vrijednosti i broj stupnjeva slobode
Izračunavanje:
I) Izrada kontingencijskih tablica opaţenih vrijednosti (idući slajd), upisujući
vrijednosti u odgovarajuće ćelije (brojevi u crnom) i izračunavanje drugih
(brojevi u crvenom), povodeći se Primjerom 11. Potrebno je paţljivo prebrojiti
sve bolesnike po spolu, zatim po manjim skupinama, i izračunati preostale
brojeve, te na kraju provjeriti cijelu tablicu zbrajanjem po brojeva kao u
prethodnim primjerima.
II) Računanje broja stupnjeva slobode df koji je isti za obje tablice:
df = (broj redova - 1) × (broj stupaca - 1) = (2 - 1)×(3 -1) = 2
Dijagnoza oštećenja srca
Spol 41041 41051 41091 Ukupno
muški 6 3 6 15
ženski 6 3 7 16
Ukupno 12 6 13 31
Primjer popunjavanja ćelija:
6 - 3 = 3 31 - 15 = 16 31 - (6 + 13) = 12 12 - 6 = 6
15 - (6 + 3) = 6 13 - 6 = 7 ili 16 - (6 + 3 ) = 7
Dijagnostička grupa
Spol 121 122 123 Ukupno
muški 7 6 2 15
ženski 5 10 1 16
Ukupno 12 16 3 31
Primjer popunjavanja ćelija (plavo su označeni brojevi iz prethodne tablice):
31 - (16 + 3) = 12 16 - 10 = 6 16 - (10 + 1) = 5 12 - 5 = 7
Obje kontingencijske tablice su jednostavne za popuniti, a točnost
popunjavanja se jednostavno provjerava zbrajanjem brojeva po redovima i po
stupcima. Brojevne oznake razreda ovdje nemaju brojevne vrijednosti.
Napomena. Brojevi unutar kontingencijske tablice jesu uvijek svi brojevi
koji ne pripadaju stupcu ili redu pod nazivom „Ukupno”.
Odgovor: Broj stupnjeva slobode za obje kontingencijske tablice je df = 2.
Kontingencijske tablice opaţenih vrijednosti su:
Dijagnoza oštećenja srca
Spol 41041 41051 41091 Ukupno
muški 6 3 6 15
ženski 6 3 7 16
Ukupno 12 6 13 31
Dijagnostička grupa
Spol 121 122 123 Ukupno
muški 7 6 2 15
ženski 5 10 1 16
Ukupno 12 16 3 31
Napomena. Pod kontingencijskom tablicom koja sadrži dvije varijable se
podrazumijevaju ćelije koje sadrže vrijednosti tih varijabli. Popuniti takvu
kontingencijsku tablicu znači upisati brojeve u ove ćelije. Dodatan stupac
„Ukupno” i red „Ukupno” služe samo za provjeru točnosti upisa brojeva u
kontingencijsku tablicu, i nisu u pravom smislu sastavni dijelovi te
tablice.
Primjer 22. Srčani udar 2. Nastavljajući se na problem u Primjeru 21, na osnovi
izraĎene kontingencijske tablice dobivene su vrijednosti: χ2 = 0.045, s
Yatesovom korekcijom χ2 = 0.235 za varijable spol i dijagnoza oštećenja srca;
χ2 = 1.636, s Yatesovom korekcijom χ2 = 0.669 za varijable spol i dijagnostička
grupa. Testirati hipoteze da postoje značajne razlike spolova s obzirom na dvije
spomenute varijable, na razini statističke značajnosti α = 0.05 i za df = 2
(kritična vrijednost χ2* = 5.991).
---------------------------
Postupak:
a) podaci:
-razina statističke značajnosti: α = 0.05
-broj stupnjeva slobode: df = 2
-χ2-vrijednost: Test 1 --- χ2 = 0.045, s Yatesovom korekcijom χ2 = 0.235;
Test 2 --- χ2 = 1.636, s Yatesovom korekcijom χ2 = 0.669
-statističke hipoteze:
Test 1 --- H0: Nema značajne razlike spolova u dijagnozi oštećenja srca.
H1: Postoje značajne razlike spolova u dijagnozi oštećenja srca.
Test 2 --- H0: Nema značajne razlike spolova u pripadnosti dijagnostičkim
skupinama. H1: Postoje značajne razlike spolova u u pripadnosti
dijagnostičkim skupinama.
b) traţi se za oba testa: testirati hipotezu H0 i odlučiti koja će se hipoteza
zadrţati, H0 ili H1
Izračunavanje:
Kritična χ2-vrijednost: χ2* = 5.991
Testiranje:
Test 1 --- χ2 << χ2* tj. 0.045 << 5.991 i 0.235 << 5.991 H0 se nikako ne moţe
odbaciti pa se prihvaća, a H1 se svakako odbacuje, a vjerojatnost za H0 je
P > 0.05.
Test 2 --- χ2 < χ2* tj. 1.636 < 5.991 i 0.669 < 5.991 H0 se ne moţe odbaciti pa
se prihvaća, a H1 se odbacuje, a vjerojatnost za H0 je P > 0.05.
Odgovor: Razlike meĎu spolovima nisu značajne ni s obzirom na dijagnozu
oštećenja srca (df = 2, χ2* = 5.991 za α = 0.05, χ2 = 0.045, s Yatesovom
korekcijom χ2 = 0.235, P > 0.05), niti s obzirom na pripadnost dijagnostičkoj
grupi (df = 2, χ2* = 5.991 za α = 0.05, χ2 = 1.636, s Yatesovom korekcijom
χ2 = 0.669, P > 0.05). Iako je učinjena Yatesova korekcija zbog najmanje 1/3
ćelija s vrijednostima manjim od 5, statističkim testiranjem su dobivene male
vrijednosti χ2 u odnosu na kritičnu vrijednosti. Drugim riječima, muškarci i ţene
koje su imale srčani udar podjednako su zastupljeni u svim dijagnozama
oštećenja srca i u pripadnosti dijagnostičkim skupinama.
Pošto se radilo o malo skupu (31 osoba), prebrojavanje zastupljenosti tj.
odreĎivanje apsolutnih frekvencija obavilo se ručno. U slučaju većih uzoraka
prebrojavanje se treba obaviti računalnim programom, tj. odreĎenim opcijama u
nekom od pogodnih programa (Excel, Word, SPSS i dr.).