Aby wykorzystać program statystyczny należy przygotować zbiór z danymi. Można to zrobić bezpośrednio w tym programi albo - lepiej - użyć do tego celu arkusza excel i później zaimportować zbiór do pakietu statystycznego.

 

Na początek musisz wiedzieć, że ważne jest znaczenie wierszy i kolumn w arkuszu. Zapamiętaj, że jedna kolumna pionowa zawiera wartości jednej zmiennej po kolei dla wszystkich obiektów w zbiorze (w danych ankietowych kolumna odpowiada jednemu pytaniu ankiety). Z kolei jeden wiersz poziomy opisuje nam wszystkie kolejne wartości zmiennych, jakie odpowiadają jednemu obiektowi w zbiorze (w danych ankietowych wiersz opisuje kolejno wszystkie odpowiedzi udzielone przez jednego respondenta. Przyswojone? Jeśli tak - świetnie.

 

Aby pakiet statystyczny mógł przeczytać dane, każda zmienna (pionowa kolumna) musi mieć nazwę, która podana jest w pierwszym wierszu od góry. Zatem dane zaczynasz wpisywać w drugim wierszu.

 

Ponad nazwami zmiennych nie ma prawa znajdować się nic, gdyż uniemożliwia to programowi statystycznemu nazwanie zmiennych (program odmawia wówczas współpracy lub zapisuje głupoty).

 

Nazwy zmiennych trzeba sobie dobrze przemyśleć - w zasadzie im krótsza nazwa, tym szybciej odbywa się definiowanie formuł obliczeń. Reguła jest prosta! Jeśli nazwy zmiennych zakodowane są jako dwa znaki - np. p1, p2, p3 itd., to  wpisanie formuły dodawania p1+p2+p3 zajmie Ci dwa razy mniej czasu niż zapisanie tej samej formuły jako pyt1+pyt2+pyt3. Jeśli zechcesz wprowadzić dłuższe nazwy zmiennych w rodzaju "poczucie_własnej_wartości_pytanie_1", to wyobraź sobie ile razy więcej czasu zajmie Ci zapisanie formuły dodania do siebie na przykład 20 takich pytań.

 

Jeśli więc masz dane, które będą wymagały pisania długich formuł arytmetycznych (np. sumowania wartości wielu pytań), to staraj się pisać możliwie najkrótsze nazwy zmiennych litera i liczba (np. p1, x1, q1). Jednak jeśli masz takie dane, których nie będziesz przekształcać, tylko wykorzystasz je dokładnie w tej postaci w jakiej je zapisałeś w arkuszu (każde pytanie jest odrębną zmienną bezpośrednio poddawaną analizie), to rozważ wpisanie pełnych nazw zmiennych, ponieważ takie nazwy pojawią się na wydrukach z programu, co może skrócić czas eleganckiej edycji tabel już pod edytorem tekstu (nie będziesz musiał/a zamieniać skrótów na pełne nazwy).

 

W nazwach zmiennych staraj się unikać myślników, plusów i innych symboli lub znaków specjalnych, które mogą oznaczać operacje arytmetyczne. Na przykład:  wartość p-1+p-2 program odczyta dosłownie i zrozumie, że ma coś dodawać i odejmować zamiast tylko dodać do siebie wartości dwóch zmiennych p-1 oraz p-2. W nazwach zamiast myślników należy zastosować kreskę na dole np. p_1 lub pominąć seperator i zapisać p1.

 

Nazwy zmiennych to nie wszystko. Musisz jeszcze przyjąć czytelny zapis poszczególnych wartości zmiennych (wszystkich odpowiedzi na dane pytanie ankiety). Jeśli dane są numeryczne to sprawa jest oczywista - wpisujesz liczbę, którą podał lub zaznaczył respondent.

 

Sprawa się trochę komplikuje, gdy odpowiedzi ankiety polegają na zaznaczeniu wybranego wariantu odpowiedzi słownej spośród kilku podanych. Z reguły używamy wówczas kodów literowych a,b,c,d itd. lub liczbowych 1,2,3,4 itd. dla poszczególnych odpowiedzi. Mówimy tu o pytaniach zamkniętych i w dodatku nakazujących respondentowi wybranie tylko jednej odpowiedzi spośród podanych. Na przykład: prosimy respondenta o zaznaczenie poziomu wykształcenia lub określenie płci. To proste.

 

Więcej pracy czeka nas przy zakodowaniu odpowiedzi na pytanie, w którym respondent może zaznaczyć więcej niż jedną odpowiedź (tzw. pytanie wielokrotnego wyboru). Na przykład: prosimy uczniów, aby wskazali z listy przedmiotów nauczania te, których lubią się uczyć. W takim przypadku problem polega na tym, że faktycznie mamy tyle zmiennych, ile przedmiotów na liście a osoba badana w istocie wybiera lub nie wybiera danego przedmiotu. Musimy więc takie pytanie rozłożyć na tyle kolumn, ile było przedmiotów (każdej nadać odrębną nazwę) a wybranie go lub nie oznaczyć jako 1 albo 0.

 

Wreszcie może być tak, że będziemy chcieli uzyskać odpowiedzi na pytania otwarte, w których respondent wpisuje własne odpowiedzi a nie zaznacza na liście. Opracowanie tego rodzaju danych jest wybitnie pracochłonne. Musimy najpierw przeczytać wszystkie odpowiedzi na dane pytanie, by zorientować się z czym mamy do czynienia. Później poklasyfikować odpowiedzi na rozłączne kategorie. Każdej z kategorii przydzielić jakieś oznaczenie, które będzie zapisywane w arkuszu jako wartość zmiennej.

 

Problemów z otwartymi pytaniami jest mnóstwo. Jednym jest arbitralność dokonywanej klasyfikacji. Innym może być rozmycie treści. Jeśli oczekujemy od respondentów dłuższej wypowiedzi zawierającej - na przykład - podanie własnego stanowiska w jakieś kwestii i jego uzasadnienie, to faktycznie trzeba rozbić materiał na wybór i uzasadnienie. Uzasadnienie może polegać na wskazaniu kilku argumentów, z których każdy może być osobną zmienną. Z powyższych względów badanie ilościowe z licznymi pytaniami otwartymi zdecydowanie nie jest opcją dla osób leniwych a może okazać się prawdziwym koszmarem dla niedouczonych.

 

 

 

Wiesz już teraz, jak ma wyglądać arkusz z danymi. Niżej ściąga.

 

Jeden wiersz=jedna osoba badana

 

Jedna kolumna=jedna zmienna (pytanie)

 

W pytaniach wielokrotnego wyboru rozbijamy pytanie na tyle kolumn, ile jest wiariantów odpowiedzi i zapisujemy w schemacie 0-1.

 

Na górze każdej kolumny widnieje prosta nazwa zmiennej.

 

Nazwy nie mogą zawierać symboli matematycznych ani znaków specjalnych.

 

Odpowiedzi najwygodniej kodować za pomocą liczb lub liter (kod literowy można użyć tylko wtedy, gdy nie przewidujemy wykonywania działań arytmetycznych na analizowanych zmiennych a jedynie zliczanie częstości odpowiedzi i klasyfikowanie).

 

W kodowaniu nie wolno używać symboli matematycznych ani znaków specjalnych!

 

 

Owocnej pracy życzę!

 

 

Jak przygotować zbiór danych za pomocą arkusza kalkulacyjnego ?
09 stycznia 2018