Analiza wariancji (ANOVA) jest jedną z najbardziej popularnych technik statystycznych. Jest więc przykładem tego co stare i dobrze sprawdzone. Użyteczność jej jest ogromna, ponieważ można ją wykorzystać nie tylko w badaniach eksperymentalnych, do których nadaje się idealnie, lecz również w analizie danych z sondaży, gdzie pozwala na dokonywanie porównań międzygrupowych.
Pojęciem kluczowym dla procedury ANOVA jest wariancja czyli miara zmienności danych w zbiorze (była już o niej mowa w innym tekście). Jeśli dane są przedziałowe lub ilorazowe czyli metryczne zwane też mierzalnymi (dysponujemy wartością zero i standardową jednostką pomiaru), wówczas wariancja oznacza średni kwadrat odchylenia od średniej w zbiorze (pierwiastek wariancji nazywamy odchyleniem standardowym). Przyjęto, że wariancję dla populacji generalnej (wszystkie osoby spełniające kryteria wyboru) liczy się inaczej niż wariancję dla próby (części populacji generalnej). W przypadku próby liczebność zbioru (N) pomniejszamy o jeden (N-1). W literaturze znajdziemy też informację, że jeśli próba jest duża (cokolwiek to znaczy), wówczas wariancję liczy się bez pomniejszania liczby obserwacji o jeden.
Miara ta może być rozbita na dwie części – na wariancję wyjaśnioną przynależnością do dwóch lub więcej grup (wariancja międzygrupowa) oraz pozostałą część, której nie wyjaśnia przynależność do grup (wariancja wewnątrzgrupowa, nazywana też wariancją błędu). Stosunek wariancji międzygrupowej do wariancji błędu (czyli – mówiąc inaczej – stosunek wariancji wyjaśnionej do wariancji niewyjaśnionej przynależnością do grup) jest podstawą wnioskowania o istotności różnic między grupami.
Najprostsze przykłady (tylko dla ilustracji istoty metody)
Badamy cztery osoby – dwie kobiety i dwóch mężczyzn – jakimś testem np. wiedzy o technice. Zamierzamy dowiedzieć się, czy kobiety i mężczyzmi różnią się poziomem wiedzy o technice.
Sytuacja pierwsza. Okazuje się, że mężczyźni uzyskali wynik 4 i 4 a kobiety 3 i 3. Co to oznacza w kategoriach „wariancyjnych”? Kobiety różnią się od mężczyzn wiedzą techniczną a przynależność do grup płciowych jest tutaj jedynym źródłem zmienności, ponieważ kobiety nie różnią się między sobą wiedzą o technice, podobnie jak mężczyźni (wariancja wewnątrz badanych grup wynosi więc zero).
Wyobraźmy sobie teraz inną sytuację. Kobiety uzyskały wyniki 3 i 4 a mężczyźni również 3 i 4. Oznacza to, że wariancja między grupami wynosi zero (gdyż obie grupy są takie same – średnia 3,5) ale wariancja wewnątrz grup istnieje. W tym przypadku można o niej powiedzieć, że wariancja wewnątrz grup jest równa całkowitej wariancji w zbiorze. W naszej próbie nie ma zatem żadnego związku między płcią a wiedzą techniczną.
A teraz trzecia sytuacja. Kobiety miały wyniki 2 i 4 a mężczyźni 3 i 5. W tym przypadku istnieje zarówno wariancja międzygrupowa (średnia dla podzbioru kobiet wynosi 3 a dla mężczyzn 4), jak i wariancja wewnątrzgrupowa (ponieważ w każdym podzbiorze mamy jakieś zróżnicowanie wyników).
W sytuacjach podobnych do tej ostatniej potrzebne będzie testowanie statystyczne, które odpowie na pytanie, czy wariancja międzygrupowa w próbie jest na tyle duża w porównaniu z wariancją wewnątrzgrupową, że tę pierwszą można z niewielkim prawdopodobieństwem popełnienia błędu uznać za odzwierciedlenie prawidłowości występującej w populacji generalnej.
Oczywiście próby liczące po dwie osoby są zbyt małe, by jakikolwiek test statystyczny mógł być wiarygodny (w zasadzie nie ma sensu obliczanie testów, gdy porównywane podgrupy są mniejsze niż 10 obserwacji (w niektórych testach za absolutne minimum przyjmuje się 5 obserwacji dla każdej podgrupy).
Procedura obliczeń
Teraz pora omówić procedurę obliczania testu statystycznego dla analizy wariancji. Obliczeń dokonamy za pomocą programu statystycznego. Zalecam również zapoznanie się z procedurą wykonania obliczeń przy użyciu specjalnego kalkulatora statystycznego w internecie oraz całkiem samodzielnie metodą papier-ołówek. Każdy podręcznik statystyki zawiera opis i wzory do zastosowania.
Najpierw musimy jednak przygotować zbiór danych do obliczeń. Możemy przygotować go w dowolnym arkuszu kaltulacyjnym, który pozwala na zapis w formacie excela (xls, xlsx) albo bezpośrednio pod pakietem statystycznym. Pamiętajmy, że każdy program statystyczny wymaga, aby zmienne zajmowały kolumny pionowe a poszczególne przypadki – wiersze poziome.
W naszym przykładzie zbiór będzie zawierał tylko dwie zmienne (czyli dwie kolumny) oraz 24 osoby badane (czyli dwadzieścia cztery wiersze). Przyjmijmy, że badania mają sprawdzić związek płci z poziomem agresywności słownej dzieci w początkowych klasach szkoły podstawowej czyli będziemy szukać różnicy pomiędzy chłopcami a dziewczętami pod względem średniego poziomu agresji słownej. Każde dziecko podlega obserwacji i odnotowane jest krzyczenie na inne dziecko, używanie obelg lub dokuczanie. Liczba takich zachowań w ciągu tygodnia jest wskaźnikiem nasilenia agresji. Niżej podaję (fikcyjne) wyniki obserwacji.
K |
5 |
12 |
13 |
2 |
10 |
8 |
9 |
20 |
14 |
11 |
6 |
5 |
|
|
|
|
|
|
|
M |
9 |
10 |
20 |
5 |
7 |
12 |
13 |
20 |
17 |
23 |
24 |
9 |
|
|
|
|
|
|
|
Musimy teraz te dane zapisać w excelu tak, jak tego wymagają pakiety statystyczne. W pierwszym wierszu excela wpiszemy nazwy zmiennych - sąsiadujących kolumn Agresja i Płeć. Następnie dopiszemy w kolejnych wierszach dane na temat agresji i płci poszczególnych osób. Niżej ilustracja.
Uruchamiamy pakiet statystyczny MYSTAT. Darmowa - studencka wersja programu SYSTAT. Oczywiście jest znacznie okrojona ale najzupełniej wystarczy do większości zastosowań na użytek prac dyplomowych.
Uwaga! Warto na wstępie wejść w opcje wydruku (output) i na stałe zmienić typ raportu z short na long (gdyż jeśli tego nie uczynimy, to na wydrukach zabraknie niektórych informacji, np. porównania średnich).
Teraz otwieramy nasz zbiór w MYSTAT, co spowoduje zaimportowanie danych przez tenże program. Gdy już dysponujemy otwartym w programie zbiorem, możemy przystąpić do wyznaczenia tego co ma być wyliczone.
Wybieramy najpierw opcję obliczeń ANOVA (na górnym pasku wybieramy Analyze i wchodzimy w rozwijalne menu: najpierw Analysis of Variance a po otwarciu tej procedury klikamy Estimate Model). Musimy teraz wskazać zmienne do analizy. Jako zmienną zależną (dependent) wstawimy w stosowne okienko AGRESJA a jako zmienną niezależną (independent) w okienko niżej wstawiamy PŁEĆ.
Gdy już wybraliśmy zmienne, to musimy teraz zaznaczyć operacje matematyczne, które mają być wykonane. Zaznaczamy też opcje dodatkowe (po otworzeniu menu z paska narzędziowego znad okienka ze zmiennymi).
Należy koniecznie zaznaczyć sprawdzenie normalności rozkładu oraz homogeniczności wariancji. Analiza wariancji wymaga sprawdzenia obu tych warunków. Warto przy tym wiedzieć, że ANOVA jest dość odporna na niespełnienie warunku normalności w porównywanych podzbiorach (kryterium normalności można więc zignorować, zwłaszcza gdy odchylenia polegają na skośności w tym samym kierunku w obu podzbiorach). Jednak już nierówność wariancji znacznie mocniej zmniejsza wiarygodność oszacowań, szczególnie gdy liczności pozbiorów bardzo się różnią. W tym przypadku niespełnienie kryterium oznacza więc konieczność logarytmicznego transfromowania zmiennej objaśnianej albo zrezygnowania z analizy wariancji na rzecz testu nieparametrycznego (np. testu Kruskala-Wallisa).
Teraz wszystko jest już gotowe do wykonania analizy. Klikamy OK i jeśli wszystko zostało „odhaczone” w programie poprawnie, to powinniśmy uzyskać wydruk.
Na wydruku widzimy wszystkie informacje potrzebne do interpretacji materiału badawczego (zrzuty ekranowe poniżej).
Z tabelki Analysis of Variance dowiadujemy się, że zróżnicowanie pomiędzy chłopcami a dziewczętami pod względem agresji można uznać za efekt prawidłowości występującej w populacji generalnej, jeśli zaakceptujemy prawdopodobieństwo błędu dla tej decyzji, które wynosi 0,068. Zwykle uznaje się za istotne statystycznie wyniki dla których p-walue jest mniejsze niż 0,05. Oznacza to, że wyniki naszych danych nie są istotne statystycznie, choć są dość bliskie istotności. W takich sytuacjach decydujące jest teoretyczne uzasadnienie otrzymanego wyniku. Jeśli wyniki naszych analiz możemy uzasadnić jakąś uznaną teorią, to wartości p poniżej 0,10 mogą być uznane za istotne, lecz jeśli nie znajdujemy teoretycznego uzasadnienia dla naszych wyników to nie uznajemy istotności. W naszym przykładzie chłopcy okazali się bardziej agresywni (średnia 14,08) niż dziewczęta (średnia 9,58) a na to znajdziemy wiele naukowych uzasadnień.
Zróżnicowanie między grupami dziewcząt i chłopców możemy też zobaczyć na poniższym wykresie (gdzie średnie oznaczono punktem a odcinkiem przedział średnia plus/minus odchylenie standardowe.
Pod wykresem znalazły się na wydruku informacje na temat jednorodności (homogeniczności) wariancji (test Levene'a) - uznamy wariancje podzbiorów homogeniczne, gdy wartość p dla testu jest większa od 0,05. W naszym przykładzie wynosi ona 0,129 a zatem wariancje można uznać za jednorodne (homogeniczne).
Oprócz tego mamy trzy różne testy normalności rozkładu - wszystkie ich wartości są niestotne (p jest powyżej 0,05) a więc nie ma powodu kwestionować normalności rozkładu.
Oba warunki poprawnego stosowania analizy wariancji zostały więc spełnione. Wobec powyższego oszacowania istotności różnicy między porównywanymi podzbiorami można uznać za wiarygodne.