Powstanie i rozwój testów:
W 1880 roku Francis GALTON po raz pierwszy posłużył się testami. W 1885 roku RIEGER konstruuje pierwsze testy inteligencji. W 1905 roku powstaje wystandaryzowana metryczna skala inteligencji do badania dzieci w wieku od 3 – 13 lat opracowana przez Alfreda BINETA i Thomasa SIMONA.
Następuje szybki rozwój testów, które wykorzystywano w szkolnictwie, lecznictwie, sądownictwie i wojsku. W czasie I wojny światowej w USA powołanych do służby wojskowej rekrutów poddawano badaniom testowym, zaś ich wyniki uwzględniano przy kierowaniu do właściwego rodzaju broni. Szybki rozwój badań testowych miał miejsce w USA.
W Polsce w okresie międzywojennym testy znalazły zastosowanie w szkolnictwie i lotnictwie. Powstawały pracownie psychotechniczne, specjalizujące się w zakresie poradnictwa zawodowego.
Badania testowe początkowo sprowadzały się do uzyskania rezultatu liczbowego, który miał być miarą danej dyspozycji. Natomiast rozwój ilościowy i jakościowy testów sprawił, że stały się one specjalistyczną metodą badania psychiki, wymagającą odpowiedniego przygotowania.
Nazwa test pochodzi od angielskiego słowa „to taste”, co oznacza – próbować, doświadczać. Test można więc określić jako próbę, doświadczenie przy przeprowadzaniu badań.
Przedmiotem badań testowych są próbki określonych zjawisk. Jeżeli te próbki są reprezentatywne, wtedy można formułować wnioski dotyczące całokształtu zjawisk należących do danej klasy.
Zatem przedmiotem badań testowych powinny być reprezentatywne próbki czynności. Aby na podstawie badań testowych formułować wnioski dotyczące określonej populacji, należy objąć nimi reprezentatywną grupę osób. Przypadkowy dobór badanych nie upoważnia do dokonywania tego rodzaju uogólnień.
Zarówno w eksperymencie jak i w badaniach testowych warunki są ujednolicone i wyznaczone przez instrukcję, która określa rodzaj i kolejność czynności wykonywanych przez osobę badaną.
Między metodą testów i eksperymentu zachodzą istotne różnice. Eksperyment laboratoryjny wykorzystywany jest głównie dla celów naukowych, natomiast badanie testowe znajduje praktyczne zastosowanie. Zadaniem badań eksperymentalnych jest naukowe poznanie prawidłowości kierujących ludzkimi działaniami, natomiast badań testowych – dokonywanie pomiarów indywidualnych różnic między ludźmi, celem ich praktycznego wykorzystania w różnych dziedzinach działalności życiowej.
Tak więc test bada reprezentatywną próbkę czynności w ujednoliconych i ściśle kontrolowanych warunkach, umożliwiając dokonanie pomiaru danej funkcji psychicznej lub cechy osobowości. Wynik testu jest ujęty liczbowo.
Definicja testu psychologicznego
Test psychologiczny jest zbiorem różnych zadań, pytań, rysunków, słów, symboli, które stanowią próbkę umożliwiającą – na podstawie ich wykonania – wnioskowanie o zachowaniu się osoby badanej w sytuacjach poza testowych. Procedura stosowania testu jest wystandaryzowana i zobiektywizowana. Zaś test spełnia kryteria psychometryczne tj. jest rzetelny i trafny.
Rzetelność (reliability) z którą związany jest błąd standardowy; trafność (validity). Ponadto test powinien być obiektywny, wystandaryzowany i znormalizowany. Z kolei zadania, pytania, rysunki, słowa, symbole (czyli pozycje składające się na dany test), musi cechować wysoka moc dyskryminacyjna to znaczy, że poszczególne pozycje testu muszą różnicować osoby o niskim i wysokim natężeniu cechy, do której pomiaru test został przeznaczony.
Test obejmuje określoną próbkę zadań, które zostały dobrane zgodnie z teorią psychologiczną (teorią inteligencji, teorią osobowości itp.) i powinny wywoływać określone zachowania osoby badanej, na których podstawie będzie można „coś” orzekać o jej zachowaniu w sytuacjach poza testowych – aktualnym (funkcja diagnostyczna) i przyszłym (funkcja prognostyczna wyniku testowego). Jeżeli test ma spełniać funkcję diagnostyczną i prognostyczną, to zbiór pozycji testowych powinien być próbką reprezentatywną dla zbioru zachowań osoby badanej w realnych sytuacjach życiowych. Np. znajomość dużej liczby poprawnych odpowiedzi w teście wiadomości, może oznaczać, że osoba badana może posiadać wysoki poziom wiedzy z danego zakresu. „Może” – ponieważ wysoki wynik testu nie jest jedynym warunkiem określającym przydatność osoby badanej do wykonywania danego zawodu.
Testy psychologiczne są wykorzystywane do identyfikacji osób o określonych charakterystykach psychologicznych. Dotyczy to szczególnie testów osobowości, gdzie na podstawie wyniku testu / kwestionariusza lub konfiguracji kilku testów zebranych w jeden zbiór (zwany baterią) , można stwierdzić wystąpienie danej cechy osobowości, skłonność do określonych zachowań, czy zaburzenie osobowości.
Zalety testów:
- Możliwość ilościowego pomiaru różnych funkcji psychicznych ( pamięci, uwagi, sprawności myślenia, zdolności, inteligencji, cech osobowości itp.);
- Uzyskany materiał umożliwia dokonywanie jakościowej analizy różnych funkcji psychicznych;
- Wynik testu jest obiektywny, nie zależy od oceniającego i jego osobistego stosunku do osoby badanej;
- Testy umożliwiają szybkie przeprowadzenie badań i obliczenie wyników;
- Testy są więc metodą praktyczną i wygodną w stosowaniu.
Wady testów:
- Testy ujmują osobowość jako zbiór niezależnych od siebie składników, podczas gdy są one powiązane;
- Nie wyjaśniają genezy ludzkiego zachowania i ograniczają się do opisu pewnego stanu rzeczy;
- Krytycy testów negowali niezmienność dyspozycji psychicznych w czasie i według nich wynik badania testowego świadczy jedynie o aktualnym poziomie rozwoju danej dyspozycji, zaś przewidywania odnośnie przyszłości mogą być zawodne;
- Krytycy testów wykazywali zmienność ich rezultatów (szereg czynników wpływa na nie modyfikująco). W efekcie badając tym samym testem kilkakrotnie tę samą osobę, uzyskuje się różne wyniki;
- Wyniki, szczególnie testów zdolności mogą być modyfikowane kulturowo i etnicznie;
- Krytykowane jest przecenianie roli testów i uznawanie ich za podstawową metodę diagnostyczną.
Szereg tych zarzutów było spowodowane niewłaściwym stosowaniem testów, niewłaściwym przygotowaniem psychologów, brakiem należycie wypracowanej teorii testów. Test dzięki standaryzacji, normalizacji, określeniu jego trafności i rzetelności staje się precyzyjnym narzędziem badawczym.
Kto jest uprawniony do posługiwania się testami ? Odpowiedź znajdziemy w „Standardach dla testów stosowanych w psychologii i pedagogice- APA,1985/1974 s.12 – kompetencja w przypadku badania testem jest wypadkową wiedzy o zasadach psychometrycznych, wiedzy o charakterze sytuacji badania testem , umiejętności technicznych i zdrowego rozsądku ”. Idzie o to aby wynik testowy był wkomponowany w teorie psychologiczna, której test stanowi operacjonalizację i która zakreśla merytoryczne ramy interpretacyjne jego wyniku. Poza tym test ma swoją teorię psychometryczną, według reguł której został zbudowany. Takie parametry jak rzetelność, błąd standardowy, moc dyskryminacyjna pozycji testowych, trafność – informują psychologa o formalnych granicach interpretacji psychologicznych wyniku testu. Psycholog więc musi dokonać trudnej sztuki integracji tych różnorodnych danych.
Pojęcie rzetelności testu:
Rzetelność testu można potraktować jako miarę dokładności pomiaru dokonywanego za pomocą testu. Im wyższa rzetelność tym większa dokładność, z jaką test mierzy jakąś zmienną i mniejszy błąd pomiaru. Rzetelność określana jest jako stopień, w jakim wyniki testowe można przypisać oddziaływaniu systematycznych źródeł wariancji ( tzn. mierzy natężenie określonej tendencji występującej u osoby badanej, a nie jej podatność na oddziaływanie czynników losowych).
Za Brzezińskim(1997) można wyróżnić 6 empirycznych metod ustalania (szacowania) rzetelności testu.
1. Metody oparte na porównaniu dwukrotnego badania tym samym testem (test –retest reliability) – ocenia się wartość współczynnika korelacji. Istotny w tym przypadku jest upływ czasu między jednym a drugim badaniem.
2. Metody oparte na porównaniu form alternatywnych (równoległych) –parallel –tests method. W tym celu należy sporządzić dwie najbardziej zbliżone (równoległe) wersje testu – stad nazwa metody. Musi być podobieństwo pod względem treści pozycji, jak i charakterystyk psychometrycznych (trudność, wariancja). Współczynnik korelacji wyników obu testów „równoległych” jest traktowany jako współczynnik rzetelności.
3. Metody oparte na porównaniu części (połówek) tego samego testu (split-half reliability), np. połówki obejmujące pozycje parzyste i połówki obejmujące pozycje nieparzyste. Jedna z popularnych technik obliczania współczynnika rzetelności tą metodą jest metoda Spearmana i Browna. Ale tą metody nie można stosować (obliczać współczynnika rzetelności) przy testach szybkości tzn. gdy w teście stosuje się limit czasu, ponieważ wtedy nie wszystkie osoby udzielają odpowiedzi na wszystkie pozycje testu.
4. Metody oparte na analizie właściwości statystycznych pozycji testu ( internal reliability)- korelacja każdej pozycji testu z ogólnym wynikiem testu ( lub korelacja skal testu z ogólnym wynikiem testu). Metody szacowania (obliczania współczynnika korelacji ) to alfa Cronbacha ; lub Kudera – Richardsona.
5. Metody oparte na analizie związku pozycji testowych z ogólnym wynikiem testu. W tej grupie poleca się metodę Spearmana – Browna, opartą na średnie korelacji pozycji testu z jego wynikiem ogólnym.
6. Grupa metod opartych na badaniu stopnia zgodności sędziów kompetentnych, którzy oceniają przydatność poszczególnych pozycji do pomiaru danej zmiennej. Warunkiem włączenia danej pozycji do testu jest uzyskanie wysokiej zgodności między sędziami. Mierzy się ją za pomocą współczynnika zgodności sędziów kompetentnych W- Kendalla.
Nie ma jednej metody uniwersalnej do badania rzetelności.
Trafność testu psychologicznego
Obok rzetelności jest to podstawowe kryterium poprawności pomiaru. Trafność tj. „jak dokładnie test mierzy to, do pomiaru czego został skonstruowany”. Są różne rodzaje trafności.
1. Trafność diagnostyczna ( concurrent validity);
2. Trafność prognostyczna (predictive validity);
3. Trafność treściowa – inaczej wewnętrzna (content validity);
4. Trafność teoretyczna ( construct validity).
Ad. 1 i 2.Dwa pierwsze rodzaje trafności nazywa się trafnością kryterialną ( criterion oriented validity), ponieważ ustalenie trafności w obu wypadkach polega na obliczeniu współczynnika korelacji między wynikiem testu i jakimś pozatestowym kryterium zewnętrznym. Takim kryterium może być wynik osiągnięć szkolnych, lub inny test np. wiadomości, diagnoza psychiatryczna, ocena merytoryczna wykonania czynności zawodowej itp.
Drugi problem dotyczy trafności samego kryterium (zewnętrznego). Nie dość, że kryterium musi być trafne, to jeszcze musi być adekwatnie dobrane do testu.
Trzeci problem związany jest z reprezentatywnością próby, na której prowadzone są badania walidacyjne. Zakłada się, że jest ona reprezentatywna, w praktyce różnie bywa.
Czwarty problem – to prowadzenie badań walidacyjnych na zbyt mało licznych grupach (trudności do dotarcia do osób o specjalnych „właściwościach”) np. kontrolerów ruchu lotniczego, czy pilotów samolotów wysoko manewrowych.
Ad.3. Trafność treściowa zwana też wewnętrzną – aby ją potwierdzić, należy wykazać, że zachowania demonstrowane w badaniach testowych są reprezentatywną próbą zachowań ujawniających się w interesującej badacza sferze. Takie testy jak werbalne testy inteligencji, testy osiągnięć szkolnych, czy testy przydatności zawodowej, powinny być starannie sprawdzone jeżeli chodzi o ich trafność treściową. Nie jest to zadanie łatwe, należy odwołać się do pogłębionej znajomości danej dziedziny wiedzy, praktyki.
Ad.4 . Trafność teoretyczna pokazuje związek testu z określonym konstruktem teoretycznym (zmienną teoretyczną), zaczerpniętym z danej teorii psychologicznej. Wg. niektórych psychometrów trafność teoretyczna jest tak naprawdę podstawowym rodzajem trafności, do niej można sprowadzić dwie wcześniejsze odmiany tj. trafność kryterialną i trafność treściową. W tle każdego testu mamy jakąś teorię psychologiczną. Jeżeli test jest trafny to możliwe jest na gruncie określonej teorii psychologicznej przewidywanie zachowania w różnych sytuacjach osób o wysokich lub niskich wynikach w tym teście.
Normalizacja testu
Osoba przebadana za pomocą testu otrzymuje wynik tak zwany surowy, który informuje jedynie o miejscu jakie osoba zajmuje na kontinuum zmiennej, ograniczonym z jednego krańca przez wynik minimalny, z drugiego – przez wynik maksymalny. Gdy obliczymy średnią arytmetyczną i odchylenie standardowe od średniej, lepiej można usytuować wynik osoby badanej na tle wyników uzyskanych przez grupę, stanowiącej dla osoby badanej układ odniesienia. I to jest kryterium dobrego testu, które nazywa się normalizacją. Normalizacja jest to procedura tworzenia zbiorów, w specjalny sposób przetworzonych wyników testów dla osób o określonych właściwościach zdefiniowanych za pomocą kryterium zewnętrznego; osoby te stanowią w sensie statystycznym reprezentatywna grupę.
W wyniku normalizacji otrzymujemy zestaw norm, umożliwiający odnoszenie wyniku surowego osoby badanej do wyników uzyskanych przez grupę, będącą dla niej grupą odniesienia ( norm-referenced). Robi się to poprzez przekształcenie zbioru surowych wyników uzyskanych od osób tworzących reprezentatywną próbę dla danej populacji, na wyniki jednej ze skal standardowych. Skale standardowe oparte są na rozkładzie normalnym, który swoim kształtem przypomina krzywą „dzwonową”. Krzywa ta jest asymetryczna względem średniej arytmetycznej. Dokładnie 50% osób w populacji, w której dana cecha ma rozkład normalny, sytuuje się powyżej średniej, a druga połowa sytuuje się poniżej średniej. Z takiej skali wyników standaryzowanych (z) można przekształcić każdy wynik surowy na wynik nowej skali.
Wymóg korzystania z norm przy interpretowaniu wyniku testowego jest obowiązkowy, w wypadku gdy prowadzimy badania diagnostyczne. Nie ma takiego wymogu w wypadku badań naukowych.
Standaryzacja i obiektywizacja testu psychologicznego
Testy wymagają określonych reguł postępowania, które obejmują:
1) Ujednolicony zestaw pozycji (zadań, pytań, obrazków), który prezentowany jest osobie badanej w ściśle określonym porządku od którego nie ma odstępstw. Np. nie można osobie badanej pomagać, wydłużać czy skracać czasu przeznaczonego na udzielenie odpowiedzi. Sposób przeprowadzania badania reguluje instrukcja.
2) Instrukcję odczytuje się (lub osoba sama odczytuje) przed przystąpieniem do rozwiązania testu.
3) Arkusz odpowiedzi na którym osoba badana (lub psycholog) zapisuje odpowiedzi na poszczególne pozycje testu.
4) Klucz według którego punktowane są odpowiedzi osoby badanej powinien być tak skonstruowany aby każdy mógł ocenić odpowiedzi jako przynależne do określonych, wyróżnionych w kluczu kategorii (na przykład: prawidłowe – nieprawidłowe).
5) Zestaw norm umożliwiających przekształcenie wyników surowych na wyniki jakiejś skali standardowej.
6) Spisane zasady według których interpretuje się ilościowo (z wykorzystaniem zasad psychometrii i statystyki) i jakościowo (w duchu określonej teorii psychologicznej) wyniki testu.
7) Zebrane informacje o walorach psychometrycznych testu (rzetelność, trafność, błędy standardowe itp.) Test pozbawiony takiej wizytówki nie powinien być stosowany.
Postępowanie w ściśle określony sposób, wobec każdej osoby badanej, określa się mianem standaryzacji testu.
Z kolei sposób punktowania odpowiedzi testowych oraz ilościową interpretację – nazywamy obiektywnością testu.
Kulturowa adaptacja testów
Współcześnie zwraca się uwagę, że test psychologiczny nie może być interpretowany poza kontekstem kulturowym, w którym został skonstruowany. Są pytania, skale wartości, testy uzdolnień mocno obciążone czynnikiem kulturowym. Poza tym testy uzdolnień, zainteresowań, wiadomości szkolnych zawsze są trafne tylko do określonego przedziału czasu. Pozycje testowe starzeją się. Np. Skala Inteligencji dla Dorosłych Wechslera powstała w 1939 roku i była dwukrotnie modyfikowana (1955 i 1981). Kultura tak samo podlega zmianom jak człowiek. Dobry test musi być modyfikowany.
Następna ważna sprawa to zasady adaptacji lingwistycznej, które najogólniej rzecz ujmując są następujące:
1) przetłumaczony test powinien mierzyć tę samą cechę psychologiczną;
2) treść testu powinna być ekwiwalentna, równoważna
( mająca identyczny zakres)
3) specyficzne zastosowanie testu powinno zostać potwierdzone poprzez zastosowanie określonych procedur badawczych np. badania walidacyjne.
Kryteria równoważności testu:
To, że test (w wersji oryginalnej) został już sprawdzony pod względem psychometrycznym, nie zwalnia od obowiązku przeprowadzenia badań psychometrycznych raz jeszcze. Test adaptowany poza kryteriami psychometrycznymi musi spełniać kryterium przystawalności kulturowej do oryginału. Do tego potrzebna jest dobra znajomość specyficzności kulturowej i dobra znajomość danego języka (jego struktur głębokich).
Wymienia się kilka kryteriów oceny poprawności adaptacji.
1. równoważność fasadowa - po której dany test rozpoznaje się, czyli wygląd przypominający oryginał;
2. równoważność psychometryczna – przystawalność obu wersji testu pod względem trafności, rzetelności, macierzy interkorelacji pozycji, średnich i wariancji, struktur czynnikowych itp.;
3. równoważność funkcjonalna – dotyczy zgodności celów (diagnoza różnicowa, selekcja, prognoza), do których realizacji został skonstruowany test oryginalny;
4. równoważność (wierność) tłumaczenia z uwzględnieniem stopnia nasycenia poszczególnych pozycji testu czynnikiem kulturowym;
5. równoważność (wierność) rekonstrukcji związana jest z podobieństwem scenariuszy konstrukcji testu oryginalnego i jego adaptacji.
Stronniczość testów psychologicznych
Stronniczość to pojęcie związane z szeroko rozumianą przynależnością grupową – rasową, klasową, narodowościową, religijną, czy na przykład ze względu na wiek. Stronniczość wpływa na wyniki testów w stały sposób. Przyczyną może być stosowanie pojęć specyficznych, właściwych dla wąsko pojętej podkultury, bardzo rzadko używanych w populacji, włączanie do testu pojęć nieznanych w danej kulturze, źle przetłumaczonych z innego języka. Wielu autorów definiuje stronniczość jako wskaźnik braku trafności testu. Test jest stronniczy wtedy, gdy przewidywanie zachowań osób badanych należących do różnych grup ( ze względu na wiek, płeć, rasę) z tej samej populacji ogólnej jest obarczone stałym błędem tzn. otrzymują zbyt wysokie lub zbyt niskie wyniki.
RODZAJE TESTÓW
Ze względu na sposób przeprowadzania badań można wyróżnić testy testy grupowe i indywidualne.
Testy zamknięte (wybór rozwiązania poprawnego) i otwarte ( badany sam formułuje odpowiedź).
Ze względu na materiał użyty do badań można wyróżnić testy papierowe i aparaturowe oraz testy werbalne i wykonaniowe.
W zależności od wskaźników stosowanych przy ocenie wykonania, można wyróżnić testy szybkości i testy mocy, ponadto różnią się one stopniem trudności zadań. W testach szybkości zadania są z założenia łatwe – wskaźnikiem jest szybkość wykonania lub liczba zadań wykonanych. Natomiast w testach mocy zadania są zróżnicowane pod względem trudności; czas wykonania takich testów zwykle nie jest ograniczony.
Testy inteligencji i testy mierzące poszczególne zdolności.
1
StanleyKing