W badaniach z zakresu nauk społecznych analizowane zmienne często występują w postaci jakościowej (nominalnej). Zmienność polega na tym, że w badanej populacji poszczególne osoby można przypisać do różnych i rozłącznych kategorii (np. zmienność płci sprowadza się do występowania dwóch kategorii - mężczyzna, kobieta zaś zmienność rodzaju wykształcenia sprowadzić można do czterech kategorii: humanistyczne, matematyczno-przyrodnicze, techniczne, artystyczne).
Wiele problemów badawczych w naukach społecznych to pytania o zależności między takim właśnie zmiennymi.
Co oznacza termin zależność? Określenia bliskoznaczne to związek między zmiennymi albo korelacja. W opisywanym tu kontekście terminy te oznaczają, że istnieje taka prawidłowość w układzie danych, że pewnym wartościom zmiennej A częściej można przypisać pewne wartości zmiennej B. Inaczej mówiąc, jeśli określone osoby różnią się wartością zmiennej A, to w pewien sposób różnią się także wartościami zmiennej B. (związki między zmiennymi możemy podzielić na funkcyjne i probalistyczne - odszukaj znaczenie tych dwóch pojęć)
Jeśli poklasyfikujemy ludzi jednocześnie według płci i według wykształcenia, to o zależności wykształcenia od płci powiemy, gdy pewne rodzaje wykształcenia częściej pojawiają się wśród kobiet a inne rodzaje wykształcenia częściej pojawiają się u mężczyzn. Gdyby poszczególne kategorie wykształcenia z jednakową częstością pojawiały się wśród kobiet i wśród mężczyzn, to nie byłoby podstaw do wnioskowania o istnieniu zależności. (dlaczego nie mówimy o zależności płci od wykształcenia?)
W praktyce z reguły stwierdza się jakieś różnice tego rodzaju - większe lub mniejsze. Im są one większe, bardziej wyraźne, tym mniej jest prawdopodobne, że powstały w wyniku działania czynników losowych. W badaniach statystycznych - jakie by one nie były - zawsze dążymy do uzyskania odpowiedzi na pytanie: jakie jest prawdopodobieństwo, że wykryty w badanym zbiorze układ danych powstał w wyniku zadziałania czynnika losowego (czyli jakie jest prawdopodobieństwo błędnego czy - jak ktoś woli - niesłusznego odrzucenia tzw. hipotezy zerowej). Zwróćmy uwagę, że określając prawdopodobieństwo błędnego uogólnienia wyników z próby na populację generalną, wyznaczamy automatycznie prawdopodobieństwo zdarzenia przeciwnego (czyli najzupełniej słusznego uogólnienia rezultatów), ponieważ prawdopodobieństwa obu - wykluczających się - alternatyw sumują się do jedności (lub do 100%). Jeśli więc uznamy, że losowy rozkład danych w populacji generalnej jest mało prawdopodobny w świetle rezultatów uzyskanych w próbie, to musimy przyjąć, że istnienie prawidłowości jest wysoce prawdopodobne.
Zanim przystąpimy do omawiania technicznej strony obliczeń chi-kwadrat, jeszcze jedna uwaga ogólna a właściwie przypomnienie, czym są badania statystyczne i na jakich założeniach się opierają. Wnioskowanie statystyczne ma charakter indukcyjny, czyli polega na uogólnianiu wyników z próby na populację generalną. Zakładamy, że jeśli próba została pobrana w sposób losowy, to dane z próby są odzwierciedleniem wszelkich prawidłowości obecnych w populacji generalnej, zaś wszelkie „odchylenia” od tych prawidłowości występujące w próbie mają charakter losowy (nazywamy je błędem losowym). Jeśli poza tym próba jest duża, to - mówiąc obrazowo - owe odchylenia zginą w masie. Losowość i odpowiednia liczebność próby są warunkami jej reprezentatywności.
Każdy test statystyczny prowadzi do określenia istotności statystycznej czyli do ustalenia prawdopodobieństwa słuszności hipotezy zerowej. Hipotezę zerową możemy w wyniku testu statystycznego odrzucić (jako mało prawdopodobną), albo uznać, że brak jest podstaw do jej odrzucenia (jeśli prawdopodobieństwo jej słuszności jest zbyt duże). W statystyce przyjmuje się, że do odrzucenia hipotezy zerowej upoważnia jej prawdopodobieństwo mniejsze niż 0,05. Granica ta jest jednak umowna i w pewnych okolicznościach może być przesunięta (ale raczej w dół - możemy wyznaczyć ją na 0,02 albo 0,01 czy 0,001 a uzasadnieniem dla takiego zabiegu może być na przykład bardzo duża liczebność próby. Przypomnijmy, że im mniejsze jest prawdopodobieństwo słuszności hipotezy zerowej (czyli wartość p), tym bardziej istotny jest uzyskany rezultat.
Teraz przejdźmy do konkretów. Przy użyciu testu chi-kwadrat będziemy testować hipotezę zerową, która mówi że „w populacji generalnej rozkład poszczególnych kombinacji wartości dwóch zmiennych nie odbiega od rozkładu losowego”. Przyjmiemy na wstępie, że kryterium istotności będzie wartość prawdopodobieństwa hipotezy zerowej mniejsza niż 0,05. Przyjmijmy też do wiadomości, że stosowanie testu chi-kwadrat wymaga spełnienia pewnych warunków co do liczby analizowanych przypadków - żadna wartość nominalna którejkolwiek ze zmiennych nie może pojawić się w próbie mniej niż w 20 obserwacjach. Przed wykonaniem obliczeń musimy to koniecznie sprawdzić! Wyznaczymy w tym celu sumy brzegowe z tabeli.
Do obliczeń będzie nam potrzebna tabela z wynikami badań. Tabela pokaże nam (a) ile osób zbadano w próbie, (b) jak często w próbie pojawiały się poszczególne wartości jednej i drugiej zmiennej (sumy brzegowe) oraz (c) jak często w próbie pojawiały się wszystkie możliwe kombinacje wartości obu zmiennych. Tabela musi zawierać liczebności bezwzględne (nazywane czasem liczebnościami surowymi). Pomijamy tu liczebności względne czyli rozkład procentowy, gdyż do obliczeń używane są dane surowe. Wartości procentowe dopisujemy z reguły na koniec do tabeli, aby zwiększyć czytelność rozkładu danych.
Poniższa tabela ma obrazować relację między płcią a rodzajem preferowanego wykształcenia. Sumy brzegowe opatrzone są nagłówkiem "Razem". Sumy brzegowe sumowane osobno w wierszu i w kolumnie powinny dać identyczny rezultat równy całkowitej liczebności zbioru. W naszej tabeli całkowita liczba obserwacji wyniosła 436=210+226=153+114+125+54. Liczebność zbioru zapisujemy symbolem N. (Zatem w naszej tabeli N=436)
Teraz sprawdzimy czy zasadne jest posłużenie się testem chi-kwadrat. Przyjmuje się, że żadna z liczebności brzegowych w tabeli nie może być mniejsza niż 20. W naszym przykładzie wszystkie wartości brzegowe (210, 226, 153, 114, 25, 54) są wyższe niż 20 a zatem nic nie stoi na przeszkodzie, by dokonać obliczeń.
Test chi-kwadrat opiera się na porównaniu liczebności bezwzględnych uzyskanych w badaniu (nazwiemy je empirycznymi i oznaczymy jako E) z liczebnościami, które ujawniłyby się, gdyby dane w tabeli odzwierciedlały losowe przyporządkowanie wartości jednej zmiennej do wartości drugiej zmiennej (te nazwiemy teoretycznymi i zapiszemy je literką T). Porównanie dotyczy zatem tzw. liczebności empirycznych i liczebności teoretycznych. Liczebności empiryczne mamy już w tabeli gotowe po zliczeniu danych z próby, zaś liczebności teoretyczne trzeba obliczyć. Obliczenia te wykonywane muszą być osobno dla każdego pola w tabeli (z wyjątkiem brzegowych), czyli dla każdej liczebności empirycznej wyznaczamy odpowiednią wartość teoretyczną.
Obliczenie liczebności teoretycznej polega na wymnożeniu dwóch sum brzegowych odpowiadających danemu polu tabeli i podzieleniu uzyskanej wartości przez całkowitą liczebność próby. Liczebności teoretyczne zaokrąglamy do dwóch miejsc po przecinku. Dla pola mężczyzn preferujących humanistyczne wykształcenie z liczebnością empiryczną równą 41, liczebności brzegowe wynoszą 153 i 210. Mnożymy obie liczebności brzegowe a iloczyn dzielimy przez całkowitą liczebność zbioru czyli 436. Uzyskana liczba (73,69) jest liczebnością teoretyczną (nazywaną czasem liczebnością oczekiwaną - oczekiwanie dotyczy tu losowego układu danych w tabeli). W analogiczny sposób obliczamy liczebności teoretyczne dla pozostałych pól.
Po wyliczeniu wszystkich liczebności teoretycznych powinniśmy sprawdzić poprawność obliczeń. Jest to proste – sumy brzegowe liczebności teoretycznych powinny być równe sumom brzegowym liczebności empirycznych. Bardzo drobne różnice mogą wynikać z faktu zaokrąglania.
Przystępujemy teraz do obliczania cząstkowych wartości chi-kwadrat dla każdej pary liczebności teoretycznych i empirycznych (czyli dla każdego pola naszej tabeli roboczej). Korzystamy z następującego wzoru:
(E-T)2/T
Podniesioną do kwadratu różnicę liczebności teoretycznej i empirycznej dla konkretnego pola tabeli dzielimy przez jego liczebność teoretyczną. Wyniki zaokrąglamy do 3 miejsc po przecinku.
Dla pierwszego pola tabeli: (41-73,69)2/73,69=1068,64/73,69=14,502
Sumujemy teraz wartości cząstkowe otrzymując wartość testu chi-kwadrat. Pomijam szczegóły tych obliczeń - spróbuj samodzielnie obliczyć wszystkie cząstki chi-kwadrat. Jeśli obliczyłeś/aś poprawnie to suma cząstek powinna wynieść 58,731.
Wartość testu chi-kwadrat posłuży nam teraz do określenia istotności statystycznej - poprzez ustalenie prawdopodobieństwa hipotezy zerowej dla naszych danych. Można to prawdopodobieństwo wyliczyć dokładnie, korzystając z dostępnego programu (kalkulator testu w darmowym pakiecie GRETL) albo korzystając z tzw. tablic statystycznych określić czy jest ono mniejsze niż ustalona na wstępie wartość (np. p<0,05).
Potrzebne będzie jeszcze dodatkowe obliczenie. Musimy określić tzw. liczbę stopni swobody dla naszej tabeli z danymi. Wzór jest prosty df = (w-1)(k-1) czyli iloczyn pomniejszonej o 1 liczby wierszy i pomniejszonej o 1 liczby kolumn w tabeli (nie licząc brzegowych i nagłówków). W naszym przykładzie df = (2-1)(4-1) = 3. Znając wartość df i przyjmując wartość p=0,05 odczytujemy z tablicy statystycznej jaka odpowiada im wartość krytyczna chi-kwadrat.
Porównany teraz wartość chi-kwadrat obliczoną z danych empirycznych z wartością krytyczną wydobytą z tablicy statystycznej.
Możliwe są dwie alternatywy:
(1) Wartość empiryczna jest mniejsza bądź równa wartość krytycznej, co prowadzi do konkluzji o braku podstaw do odrzucenia hipotezy zerowej (badania nie potwierdzają zależności)
albo
(2) wartość empiryczna jest większa od wartości krytycznej, co oznacza że istnieją podstawy do odrzucenia hipotezy zerowej z prawdopodobieństwem błędu mniejszym niż 0,05 (badania potwierdzają istnienie zależności).
W naszym przykładzie wartość krytyczna (dla df=3 i p=0,05) wynosi 7,815 natomiast obliczona z danych wartość chi-kwadrat wyniosła znacznie więcej, bo 58,731. Oznacza to, że hipotezę zerową można odrzucić z prawdopodobieństwem błędu mniejszym niż 0,05. Jeśli sprawdzisz w tablicy wartości krytyczne dla lepszych od 0,05 poziomów istotności przy df=3, to zobaczysz, że prawdopodobieństwo hipotezy zerowej dla naszych danych jest mniejsze niż 0,02, mniejsze niż 0,01, i mniejsze niż 0,005 (a mówiąc ściślej jest ono dużo niższe - wyliczone z dokładnością do 4 miejsc po przecinku wynosi 0,0000).
Teraz możemy dokonać prezentacji wyniku w postaci edytowalnej tabeli. Dla lepszej ilustracji uwzględniamy w niej oprócz surowych liczebności zestawienie procentowe. Bezpośrednio pod tabelą umieszczamy wynik testu statystycznego składający się z trzech informacji: wartość chi-kwadrat, df oraz wartość p.
Na koniec jeszcze jedna ważna uwaga. Wartość testu chi-kwadrat jest zależna od wielkości zbioru. Identyczne proporcje w tabeli dla próby pięciokrotnie większej przyniosą pięć razy większą wartość testu. Zatem wartość ta nie może być wykorzystana dla porównania siły związku między zmiennymi w próbach różniących się liczebnością. Z kolei uzależnienie wartości krytycznych testu od liczby stopni swobody czyni nieporównywalnymi wyniki uzyskane w tabelach różniących się liczbą kolumn lub wierszy. Aby takie porównania były możliwe należy przeliczyć wartość chi-kwadrat na adekwatny do rodzaju danych współczynnik siły związku. Może to być na przykład współczynnik V-Cramera. Współczynniki tego rodzaju są po prostu miarami korelacji między zmiennymi nominalnymi i pozwalają zorientować się w mocy predykcyjnej jednaj zmiennej względem drugiej. Im bliżej zera, tym mniejsza możliwość przewidywania wartości jednej zmiennej na podstawie znanej wartości drugiej zmiennej, im bliżej 1, tym możliwość trafnego przewidywania jest większa.
W naszym przykładzie V=0,37, co oznacza, że zależność opisana w tabeli choć bardzo istotna to jednak nie jest silna. Zapewne więc preferencje kierunku kształcenia zależą nie tylko od płci, lecz od wielu innych zmiennych.
Oczywiście obliczanie chi-kwadrat (nie mówiąc już o bardziej skomplikowanych testach statystycznych) metodą papier-ołówek w dobie komputerów jest marnowaniem cennego czasu i rozsądnie będzie skorzystać z programu statystycznego. Myślę jednak, że warto wiedzieć, jakie obliczenia robi za nas komputer a nade wszystko wypada umieć poprawnie zinterpretować wydruk komputerowy.