Ekwiwalencja pomiarowa skali Experience in Close Relationships-Revised w grupach zróżnicowanych pod względem wieku oraz płci badanych Katarzyna Lubiewska a Karolina Głogowska a Kinga Mickiewicz a Ewa Wyrzykowska a Cezary Wiśniewski b Paweł Izdebski a a Instytut Psychologii, Uniwersytet Kazimierza Wielkiego w Bydgoszczy b Miejski Ośrodek Pomocy Rodzinie w Toruniu (artykuł został złożony 22.09.2015 do recenzji w Przeglądzie Psychologicznym) Adres do korespondencji: Katarzyna Lubiewska Instytut Psychologii Uniwersytetu Kazimierza Wielkiego w Bydgoszczy Ul. Staffa 1 85-867 Bydgoszcz tel.: 785 633 642 lubkat@ukw.edu.pl 1
Abstract The Experience in Close Relationships-Revised (ECR-R; Fraley, Waller & Brennan, 2000) is one of the most popular self-report instruments assessing adult attachment based on avoidance and anxiety indicators. Although the scale is used in Poland, its psychometric properties are not well documented. We set out in the study to estimate measurement equivalence (invariance) in groups of adults differentiated by gender and age. The sample was composed of 781 adults between the age of 16 and 81 (52% were above the age of 40; and 51% were females). MGCFA was used to test the construct, measurement unit and scalar invariance. Two forms of ECR-R were tested: 36-items scale, and short 16-items form (Lubiewska et al., in review). Results revealed full measurement invariance in comparisons between males and females. Nonetheless, item bias was found when younger and older adults were compared allowing for establishing of partial scalar equivalence. Observable means comparisons between groups unfolded that males are more insecure than females and, in line with previous research, that older adults are less anxious than younger adults. Key words: attachment, close relationships, measurement invariance/equivalence, psychometric assessment 2
Streszczenie Skala Experience in Close Relationships-Revised (Fraley i in., 2000) jest jedną z współcześnie najpopularniejszych skal do badania przywiązania mierzonego poziomem unikania i niepokoju w bliskich związkach. Właściwości psychometryczne skali nie zostały dotychczas dokładnie przeanalizowane w próbie polskiej. Wypełniając tą lukę postawiliśmy sobie w niniejszym badaniu cel oszacowania poziomu ugruntowania ekwiwalencji pomiaru przy użyciu skali w grupach osób zróżnicowanych pod względem płci oraz wieku. Próba badawcza składała się z 781 osób w wieku pomiędzy16 i 81 roku życia (51% kobiet oraz 52% osób poniżej 40 roku życia). Ekwiwalencję pomiarową skali oszacowaliśmy przy użyciu multigrupowej konfirmacyjnej analizy czynnikowej. Wyniki wykazały ugruntowanie ekwiwalencji pomiaru wskazując na trafność porównań wyników w grupach kobiet i mężczyzn. Niemniej, porównania grup zróżnicowanych wiekiem wykazały pewien zakres stronniczości pytań, która jednak nie miała praktycznego znaczenia dla porównań i wartości średnich. Analizy wykazały wyższy poziom nieufności przywiązaniowej u mężczyzn, aniżeli u kobiet oraz wyższy poziom nipokoju przywiązaniowego u młodszych, aniżeli u starszych dorosłych. Słowa klucze: przywiązanie, pomiar psychometryczny, ekwiwalencja pomiarowa, środowisko R 3
Ekwiwalencja pomiarowa skali Experience in Close Relationships-Revised w grupach zróżnicowanych pod względem wieku oraz płci badanych Współcześnie analiza właściwości psychometrycznych skal coraz częściej nie kończy się na oszacowaniu struktury skali i poziomu jej spójności wewnętrznej. Poszerza się ją o analizę tego, czy pomiar dokonany za pomocą skali jest równoważny, tożsamy (ekwiwalentny) w różnych grupach osób badanych (np. różniących się płcią, czy kulturą). Analizy tego typu zawdzięczamy w znacznej mierze psychologii międzykulturowej, w której dostrzeżono, że jednostka pomiarowa skali Likerta, czy średnia arytmetyczna w zakresie podskali mogą nieść ze sobą zupełnie inne znaczenia w różnych kulturach i kontekstach ekologicznych. Taki brak ekwiwalencji pomiarowej sprawia, że wyniki pomiaru są de facto nieporównywalne, zaś ich porównanie (np. średnich) może prowadzić do nieadekwatnych konkluzji (van de Vijver, Leung, 1997). Dalsze badania nad znaczeniem ekwiwalencji w pomiarze psychologicznym wykraczające poza ramy różnic kulturowych i zastosowane wewnątrz kultur wykazały także, iż analiza ekwiwalencji pomiarowej w grupach zróżnicowanych w zakresie kohorty wiekowej w wielu kulturach jest równie zasadna (Lubiewska, van de Vijver, Mayer, Trommsdorff, Nauck, w przygotowaniu). Co więcej, przynajmniej jedno z badań dotyczących przywiązania wskazuje na konsekwencje braku kontroli w zakresie ugruntowania ekwiwalencji pomiarowej w grupach zróżnicowanych pod względem wieku (Lubiewska i van de Vijver, w recenzji). Autorzy badania przeanalizowali różnice w zakresie niepokoju i unikania przywiązaniowego pomiędzy trzema pokoleniami Polaków w dwojakiego rodzaju warunkach - ignorując lub kontrolując brak ekwiwalencji pomiarowej (skalarnej). Analizy wykazały, że średni poziom niepokoju nastolatków był wyższy, aniżeli poziom niepokoju ich matek i babć, ale tylko wtedy, gdy zignorowano brak ugruntowania ekwiwalencji pomiarowej. Analiza dokonana z kontrolą braku ekwiwalencji (wyłączenie z międzypokoleniowych porównań 4
średnich pytań obarczonych brakiem ekwiwalencji) doprowadziła do wniosku o braku różnic w poziomie niepokoju przywiązaniowego pomiędzy nastolatkami i ich matkami oraz babciami. Zatem, pomimo trwających nadal dyskusji o konsekwencjach braku ekwiwalencji pomiarowej, standardem w psychologii międzykulturowej jest jej testowanie (Datta, Marcoen, Poortinga, 2005). Są też przesłanki wskazujące na to, że brak ekwiwalencji w grupach zróżnicowanych wiekiem badanych nie jest również problemem o trywialnym znaczeniu dla teorii przywiązania. Poziomy ekwiwalencji pomiarowej Wyróżnia się trzy zróżnicowane poziomy ekwiwalencji pomiarowej. Ekwiwalencja konstruktu (ekwiwalencja strukturalna) jest najsłabszym poziomem porównywalności pomiaru. W tym zakresie porównuje się równoważność struktury czynnikowej skali w analizowanych grupach. Jej brak sprowadza problem pomiaru do próby porównania nie dwóch jabłek, a jabłka z pomarańczą. Poziom umiarkowanej ekwiwalencji wiąże się z równoważnością jednostki pomiarowej w analizowanych grupach i nosi nazwę ekwiwalencji metrycznej. Przykładem może być temperatura mierzona w stopniach Kelvina i Celsjusza. Pomimo tego, że punkt startowy pomiaru temperatury ma inną wartość na obu skalach (-273 lub 0), jednostka pomiaru jest tożsama. Problem na tym poziomie polega na tym, że pomimo stałej jednostki pomiaru nie możemy (nie znając stałej różnicy początkowej) porównać bezpośrednio średnich wartości temperatury w obu jednostkach. Takie porównanie jest możliwe dopiero na poziomie ugruntowania (udowodnienia) mocnej ekwiwalencji, zwanej ekwiwalencją skalarną (lub pełną porównywalnością wyników). Na tym poziomie testuje się równoważność wartości stałej regresji. Dopiero ugruntowanie tego poziomu ekwiwalencji pozwala na porównywanie średnich wartości wyników w skali z pewnością, co do ich pełnej równoważności w zakresie konstruktu jednostki pomiaru i źródła średniej wartości wyniku (np. van de Vijver, Leung,1997; van de Vijver, Tanzer, 2004). 5
Niestety, w badaniach trudność ugruntowania ekwiwalencji wzrasta wraz z jej poziomem. Wzorem praktyki w psychologii międzykulturowej stało się też podejmowanie decyzji o rezygnacji z porównywania poziomów średnich analizowanych skal (np. poprzez analizę wariancji) w grupach kulturowych, w sytuacji braku ugruntowanej ekwiwalencji skalarnej (Datta, Marcoen, Poortinga, 2005) i poprzestawanie na analizowaniu ścieżek testowanego modelu (np. korelacji, czy regresji). Jednakże, zanim taka decyzja zostanie dokonana podejmuje się najczęściej próby ugruntowania nie całkowitej, lecz częściowej ekwiwalencji pomiarowej (konfiguralnej, metrycznej, czy skalarnej). Jej ugruntowanie polega na uwolnieniu restrykcji równości z (zazwyczaj) kilku parametrów danego poziomu (Byrne, Shavelson, Muthen, 1989; Byrne, van de Vijver, 2010). Brak ekwiwalencji w pomiarze psychologicznym wynika zazwyczaj ze stronniczości pytań (faworyzujących np. jedną grupę wiekową w zakresie poziomu średniej) wynikającej z różnych źródeł. Jednym z nich może być problem związany z tłumaczeniem pytań z języka obcego. Pomimo wartości tłumaczenia back-translation, strategia ta nie może zagwarantować (a czasami przeszkadza w uzyskaniu) trafności ekologicznej tłumaczenia. Innym źródłem braku ekwiwalencji mogą być różnice w interpretacji znaczenia treści pytań w analizowanych grupach. Mogą one wynikać z błędu pomiaru ale też wskazywać na różnice międzykulturowe lub międzypokoleniowe. Skala ECR-R w warunkach polskich Skala Experience in Close Relationship (Brennan, Clark, Shaver, 1998) oraz jej wersja zrewidowana Experience in Close Relationship Revised (Fraley, Waller, Brennan, 2000) jest dzisiaj jedną z najbardziej popularnych skal do pomiaru przywiązania w bliskich związkach u osób dorosłych (np. Ravitz, Maunder, Hunter, Sthankiya, Lancee, 2010). Przywiązanie jest tutaj mierzone na wymiarach niepokoju i unikania przywiązaniowego w bliskich związkach. Niski poziom obu wymiarów wskazuje na ufność przywizaniową; relatywnie wysoki poziom 6
unikania na przywiązanie lękowo-unikające; zaś wysoki poziom niepokoju na przywiązanie lękowo-ambiwalentne. Unikanie wiąże się z dyskomfortem w byciu blisko z obiektem przywiązania, preferencją do zachowania dystansu i większej autonomii. Niepokój przywiązaniowy wiąże się z lękiem dotyczącym tego, że osoba bliska (obiekt przywiązania) może nie akceptować, nie kochać osoby badanej i poczuciem, że osoba bliska może badanego porzucić lub odtrącić. Skala jest przeznaczona do badania różnic indywidualnych w zakresie przywiązania. Można stosować ją bez zgody autorów (z odwołaniem do odpowiedniej referencji) do pomiaru samoopisu funkcjonowania jednostki generalnie w bliskich związkach (przywiązanie generyczne) lub do pomiaru percepcji jednostki w konkretnym związku (np. z partnerem romantycznym). Parametry psychometryczne polskiej wersji skali zostały przez nas potwierdzone w zakresie dwuczynnikowej struktury skali złożonej z 36 pytań (model z bifaktorem kontrolujący wariancję pomiaru wynikającą z rekodowania 14 pytań). Zaproponowaliśmy również wersję skróconą skali składającą się z 16 pytań (Lubiewska i in., w recenzji). Cel badania W niniejszym badaniu postanowiliśmy oszacować poziom ugruntowania ekwiwalencji pomiarowej skali ECR-R w grupach zróżnicowanych w zakresie płci oraz wieku osób badanych. Spośród kontrolowanych przez nas zmiennych demograficznych dokonaliśmy wyboru wieku oraz płci respondentów, jako zmiennych grupujących, w których przetestujemy poziom ugruntowania ekwiwalencji pomiarowej z trzech względów. Po pierwsze, pomimo, że literatura w zakresie przywiązania raczej nie wskazuje na występowanie istotnych statystycznie różnic pomiędzy kobietami i mężczyznami (np. Fraley, 2015), wyniki te nie są jednoznaczne (Del Giudice, Belsky, 2010). Po drugie, płeć i wiek są zmiennymi kontrolowanymi w większości badań psychologicznych, zatem informacja o zasadności 7
porównań międzygrupowych w obu tych obszarach jest praktycznie istotna. Po trzecie, wybraliśmy wiek badanych ze względu na dotychczasowe wyniki badań sugerujące, że skala ECR-R może być stronnicza przy porównaniu grup osób młodszych i starszych (może preferować w poziomie wyniki jedna z grup). Dotychczasowe badania wskazują na to, że w wielu kulturach Zachodnich i nie-zachodnich ludzie starsi deklarują wyżaszą ufność przywiązaniową, aniżeli osoby młodsze (np., Chopik, Edelstein, Fraley, 2013; Lubiewska i in., w przygotowaniu). Zatem pytanie o to, czy wynik ten jest uwarunkowany różnicą wieku badanych, czy wynika ze stronniczości pomiaru wydaje się zasadne. METODA Osoby badane i przebieg badania Próba składała się z 781 osób. Rozpiętość wieku osób badanych w naszym badaniu wynosiła od 16 do 81 lat. Dokładny rozkład liczebności badanych podzielony na dekady jest zamieszczony w Tabeli 1. Przy takim podziale parametry wieku w próbach były następujące: M = 22,27 (SD = 1,97) dla grupy badanych w wieku od 16 do 25 lat; M = 30,39 (SD = 3,02) dla grupy badanych w wieku od 26 do 35 lat; M = 40,31 (SD = 2,77) dla badanych w wieku od 36 do 45 lat; M = 51,11 (SD = 2,82) dla grupy badanych w wieku od 46 do 55 lat; oraz M = 61,72 (SD = 4,96) dla badanych w wieku od 56 do 81 lat. Dzieląc badanych na dwie grupy wiekowe, z linią podziału w wieku 40 lat, można wyodrębnić grupę składającą się z osób pomiędzy 16 i 40 rokiem życia, ze średnią wieku 28,63 lat (SD = 6,45), oraz drugą grupę składającą się z osób pomiędzy 41 i 81 rokiem życia ze średnią wieku 53,67 lat (SD = 8,02). Grupa badana była zróżnicowana pod względem płci (51% kobiet), wykształcenia (70% badanych miała wykształcenie średnie lub wyższe), bycia aktualnie w związku intymnym (66,5%) oraz uzależnienia od alkoholu (28% uzależnionych). Wyniki różnic rozkładów w zależności od wieku osób badanych, przedstawione w Tabeli 1, wykazały brak istotnych statystycznie różnic tylko w zakresie płci badanych. 8
Badania z użyciem skali były prowadzone w latach 2011-2013 na terenie województw: Kujawsko-Pomorskiego, Pomorskiego, Warmińsko-Mazurskiego oraz Wielkopolskiego. Dobór do próby odbył się metodą kuli śnieżnej. Przed wręczeniem skali badani byli poinformowani o celu prowadzenia badań, anonimowości udziału w badaniu oraz możliwości zrezygnowania z uczestnictwa w badaniu. Procedura badania zajmowała od około 10 minut. Braki danych nie przekroczyły 5%. Polska wersja skali Experience in Close Relationships-Revised Oryginalna wersja skali została przetłumaczona na język polski przez trzech niezależnych tłumaczy będących psychologami. Po dokonaniu porównania tłumaczeń i uzgodnieniu ostatecznej wersji w odniesieniu do konstruktu teoretycznego, zwrócono się z prośbą o translację zwrotną do native speakera. Porównanie obu wersji tłumaczenia nie wykazało różnic, które mogłyby wpływać na rozumienie pozycji skali. Pełna wersja skali ECR-R składa się z 36 pytań, wśród których połowa (18) jest wskaźnikiem niepokoju, zaś druga połowa unikania przywiązaniowego. Dwanaście pytań (67%) podskali Unikania oraz dwa pytania podskali Niepokoju (11%) są sformułowane tak, że ich punktację należy przekodować celem zsumowania/uśrednienia ogólnego wyniku dla danej podskali. Wartości psychometryczne skali w polskiej próbie są zadowalające (Lubiewska i in., w recenzji). Zaproponowana przez nas (Lubiewska i in., w recenzji) skrócona wersja skali ECR-R złożona jest z 16 pytań i przedstawia w analizowanej przez nas próbie lepsze właściwości psychometryczne, aniżeli skala pełna. W puli pytań ECR-R zastosowaliśmy 7-stopniowy format odpowiedzi skali Likerta od (1) zdecydowanie się nie zgadzam do (7) zdecydowanie się zgadzam. Pełna i skrócona wersja skali ECR-R są załączone w innym miejscu (Lubiewska i in., w recenzji). Podskale Niepokoju i Unikania korelują ze sobą w sposób umiarkowany (r = 0,40, za Fraley, 2015; r = 9
0,44 dla skali pełnej i 0,35 dla skali skróconej w badaniach polskich w Lubiewska i in., w recenzji). WYNIKI Analizy statystyczne. Zanim przystąpiliśmy do analiz testujących dopasowanie teoretycznie oczekiwanego modelu skali do naszych danych, dokonaliśmy przeglądu pytań skali pod względem ich rozkładów jedno- i wielozmiennowych oraz danych w zakresie przypadków odstających. Analizy wykazały brak przypadków ekstremalnie odstających w zakresie udzielanych odpowiedzi. W matrycy odpowiedzi skali ECR-R nie było także braków danych. Zgodnie z naszymi przypuszczeniami rozkłady zmiennych okazały się nie być dopasowane do krzywej Gausa, co wiąże się z normatywnością przywiązania ufnego wobec nieufnego we wszystkich badanych dotychczas kulturach. Celem eliminacji potencjalnych problemów z tym związanych dokonaliśmy logarytmicznej transformacji danych oraz do oszacowania dopasowania modelu pomiarowego (w konfirmacyjnej analizie czynnikowej) zastosowaliśmy korektę Satorry-Bentlera (1994) oraz analizowaliśmy 90% interwały ufności wyniku uzyskane przy pomocy metod bootstrapowych. Celem naszej analizy było oszacowanie, czy pełna i skrócona wersja skali ECR-R zachowują niezmienne parametry pomiarowe w grupach osób badanych zróżnicowanych pod względem wieku oraz płci. Ze względu na liczebność próby w grupach wiekowych i ilość parametrów do oszacowania w modelu, nie analizowaliśmy pięciu grup wiekowych opisanych w Tabeli 1, lecz analizy oparliśmy na podziale badanych na dwie większe grupy z linią podziału grup w wieku 40 lat. Jedna grupa (n = 407) składała się z osób od 16 do 40 roku życia (M = 28,64; SD = 6,45), druga zaś (n = 369) z badanych w wieku od 41 do 81 roku życia (M = 53,58; SD = 8,02). W celu oszacowania tego, czy pomiar przy pomocy skali ECR-R zachowuje te same parametry w grupach zróżnicowanych pod względem wieku lub płci badanych dokonaliśmy 10
analizy ekwiwalencji (równoważności) pomiarowej na trzech poziomach: najniższym konstruktu/struktury skali; umiarkowanym jednostki pomiarowej; oraz najwyższym stałej regresji. Poziomy ekwiwalencji przetestowaliśmy przy pomocy wielogrupowej konfirmacyjnej analizy czynnikowej (MGCFA), opierając decyzję o ugruntowaniu ekwiwalencji tylko w sytuacji, kiedy wartość różnicy indeksów CFI pomiędzy dwoma sąsiednimi modelami była mniejsza lub równa 0,01. Granica ta jest uważana za wskaźnik praktycznie istotnej, w badaniach psychologicznych, zmiany poziomu dopasowania modelu do danych (Byrne, van de Vijver, 2010; Cheung, Rensvold, 2002). Przy pomocy metod boostrapowych oszacowaliśmy 90%-owe interwały pewności aproksymacji (RMSEA), sprawdzając zakres możliwego do popełnienia błędu. Analizy przeprowadziliśmy przy użyciu pakietu lavaan (Rosseel, 2012) oraz psych (Revelle, 2011) programu R (R Core Team, 2014). Ekwiwalencja pomiarowa Analizę ekwiwalencji pomiarowej skali pełnej i skróconej ECR-R zaczęliśmy od porównań w grupach kobiet i mężczyzn. Następnie analizowaliśmy porównywalność pomiaru przy użyciu obu wersji skali w grupach zróżnicowanych ze względu na wiek osób badanych. Ekwiwalencja pomiaru w grupach mężczyzn i kobiet Wyniki analiz ekwiwalencji pomiarowej w grupach zróżnicowanych ze względu na płeć zaprezentowane w Tabeli 2 wykazały, że obie wersje skali (pełna i skrócona) zachowują tą samą strukturę czynnikową (ekwiwalencję konstruktu) w badanych przez nas grupach kobiet i mężczyzn. Podobne rezultaty przyniosła analiza ekwiwalencji jednostki pomiarowej (ekwiwalencji metrycznej) obu wersji skali w grupie mężczyzn i kobiet. Najwyższy, i najtrudniejszy do uzyskania, poziom ekwiwalencji w zakresie stałych regresji (ekwiwalencja skalarna) został również ugruntowany. Oznacza to, że porównując średnie poziomy natężenia niepokoju, unikania lub nieufności przywiązaniowej pomiędzy kobietami i mężczyznami 11
możemy mieć pewność co do tego samego znaczenia średnich wartości wyników (przykładowo średnia 4,27 w obu grupach oznacza tą samą wartość). Ekwiwalencja pomiaru w grupach młodych i starszych dorosłych Wyniki analiz w zakresie ekwiwalencji pomiarowej w młodszej (16-40 lat) i starszej (41-81 lat) grupie badanych dorosłych wykazały ugruntowaną ekwiwalencję w zakresie struktury czynnikowej (ekwiwalencja konstruktu) oraz jednostki pomiarowej (ekwiwalencja metryczna). Analiza ekwiwalencji skalarnej została ugruntowana jedynie przy analizie skali skróconej ECR-R (Tabela 2). W przypadku skali pełnej musieliśmy uwolnić z restrykcji równości parametry dwóch pytań celem ugruntowania ekwiwalencji częściowej. Wynik ten oznacza, że dwa z pytań (po jednym z obu podskal, dokładnie pytania numer 10 i 23) zachowują się stronniczo w starszej i młodszej grupie wiekowej. Celem sprawdzenia, czy częściowy brak ekwiwalencji pełnej wersji skali ECR-R ma praktyczne znaczenie w badaniach psychologicznych przetestowaliśmy istotność statystyczną różnic średnich obserwowalnych niepokoju i unikania w podskalach, w których zostawiliśmy (niekontrolowana średnia) lub wyłączyliśmy, kontrolując brak pełnej ekwiwalencji skalarnej, oba pytania obarczone brakiem ekwiwalencji skalarnej w obu grupach wiekowych (kontrolowana średnia). Analizy wykazały niemal pełną korelację kontrolowanej i niekontrolowanej średniej (r = 1,00 dla Niepokoju oraz r = 0,98 dla Unikania). Brak istotnych statystycznie różnic znaleźliśmy również w przypadku porównania średnich poziomów kontrolowanej i niekontrolowanej średniej Niepokoju [F(1560) = 0,29; ni] oraz Unikania [F(1560) = 0,01; ni]. Ponadto, sprawdziliśmy także, czy problem z pozostawieniem w podskalach obu problematycznych pytań wpływa w sposób istotny statystycznie na wnioskowanie o różnicach poziomu unikania i niepokoju u osób starszych, w porównaniu z osobami młodszymi. Wyniki wykazały brak statystycznie istotnych różnic pomiędzy grupami wiekowymi przy analizie 12
niekontrolowanych [F(779) = 1,89; ni] oraz kontrolowanych [F(779) = 2,63; ni] średnich Niepokoju. Istotnych statystycznie różnic pomiędzy grupami wiekowymi nie wykryliśmy również przy porównaniu niekontrolowanych [F(779) = 0,37; ni] oraz kontrolowanych [F(779) = 1,45; ni] średnich wyników podskali Unikania. Średnie poziomy niepokoju i unikania w badanych grupach Jako, że wnioski na temat różnic w zakresie ufności przywiązaniowej pomiędzy kobietami i mężczyznami oraz osobami w średniej i późnej dorosłości stanowią jeden z ważnych celów większości badań psychologicznych, jako ostatni krok naszych analiz przetestowaliśmy różnice średnich poziomów unikania i niepokoju przywiązaniowego w analizowanych przez nas grupach. Wyniki przedstawione w Tabeli 3, wykazały istotnie wyższy poziom unikania i niepokoju przywiązaniowego w grupie mężczyzn, w porównaniu z grupą badanych kobiet. Wynik ten uzyskaliśmy przy zastosowaniu wersji pełnej (ekwiwalentnej) oraz skróconej wersji skali ECR-R. W przypadku porównania osób młodszych i starszych nie znaleźliśmy istotnych statystycznie różnic średnich unikania przywiązaniowego przy zastosowaniu obu wersji skali. W zakresie niepokoju przywiązaniowego nie znaleźliśmy istotnych statystycznie różnic pomiędzy młodszymi i starszymi dorosłymi przy zastosowaniu skali pełnej (ekwiwalentnej), niemniej różnice te wystąpiły przy zastosowaniu wersji skróconej skali. Dokładnie, poziom niepokoju przywiązaniowego osób starszych był istotnie statystycznie niższy, aniżeli u młodszych dorosłych. DYSKUSJA Celem niniejszego badania była weryfikacja poziomu ugruntowania ekwiwalencji pomiarowej pełnej i skróconej wersji skali ECR-R w grupach zróżnicowanych pod względem płci oraz wieku. Wykazaliśmy, iż pomiar przy użyciu obu (pełnej i skróconej) wersji skali cechuje ugruntowana ekwiwalencja pomiarowa w grupie mężczyzn i kobiet oraz ugruntowana 13
ekwiwalencja strukturalna, metryczna i częściowa skalarna w grupach zróżnicowanych w zakresie wieku. Stwierdziliśmy przy tym stronniczość dwóch pytań skali pełnej ECR-R w pomiarze przywiązania u osób w młodszej i starszej dorosłości. Ponadto wykazaliśmy również różnice w poziomie ufności przywiązaniowej w porównywanych przez nas grupach. Równoważność pomiaru w grupach zróżnicowanych pod względem płci oraz wieku Analiza równoważności (ekwiwalencji) pomiaru przy użyciu wersji pełnej i skróconej skali ECR-R, zgodnie z naszymi przewidywaniami, okazała się być odmienna w zależności od tego, czy analizowaliśmy grupy zróżnicowane w zakresie płci, czy wieku (młodsi versus starsi dorośli). Nasze analizy wykazały, że wyniki pomiaru przy pomocy skali ECR-R w wersji pełnej i skróconej są równoważne w grupie mężczyzn i kobiet. Oznacza to, że struktura skali, jednostka pomiarowa oraz wartość początkowa średniej wartości wyniku nie różnią się od siebie w grupie kobiet i mężczyzn. Wykazaliśmy przez to, że trafność porównywania wyników średnich pomiędzy kobietami i mężczyznami w zakresie podskal Unikania i Niepokoju jest w pełni uzasadniona i wskazuje jedynie na różnice w zakresie płci, nie wynika zaś ze stronniczości metody pomiaru, czy pytań skali. Analizując równoważność pomiaru w grupach zróżnicowanych pod względem wieku zestawiliśmy ze sobą dwie grupy wiekowe: (1) osoby młodsze - od 16 do 40 roku życia; oraz (2) osoby starsze - od 41 do 81 roku życia. Niestety wielkość naszej próby nie pozwalała na to, żebyśmy mogli przetestować zaproponowane przez nas modele pomiarowe w grupach osób badanych zróżnicowanych wiekiem o dekadę (Załącznik 1). Analizy zakresu ugruntowania różnych poziomów ekwiwalencji pomiarowej w obu grupach wykazały pełną równoważność pomiaru w wersji skróconej skali ECR-R. Oznacza to pełną porównywalność pomiaru, nieobarczonego stronniczością pytań, w grupie osób do i powyżej 40 roku życia. Niemniej, analiza równoważności pomiaru wersji pełnej skali ECR-R wykazała problemy wskazujące na częściową stronniczość pytań w obu grupach wiekowych. Dokładnie, założenie równości 14
skalarnej wszystkich pytań ECR-R w obu grupach wiekowych pogorszyło w sposób praktycznie istotny (Byrne, van de Vijver, 2010; Cheung, Rensvold, 2002) dopasowanie modelu do danych. Wprowadzenie nie całkowitej, a częściowej ekwiwalencji, związane z wyłączeniem dwóch pytań z restrykcji równości w obu grupach, pozwoliło na ugruntowanie ekwiwalencji skalarnej w przypadku większości pytań. Stronniczość pytania oznacza, że dane pytanie faworyzuje jedną z porównywanych grup (poprzez wyższy poziom początkowy średniej). Przyczyny tego problemu mogą być różne i dotyczyć np. odmiennego błędu pomiaru w porównywanych grupach. Niemniej, stronniczość pytania może wiązać się też z różnicami w zakresie rozumienia/interpretacji treści pytania w porównywanych grupach. Na podstawie naszych analiz nie jesteśmy w stanie stwierdzić co leży u podłoża problemu. Niemniej, analiza treści obu stronniczych w naszym badaniu pytań może nasuwać pewne przypuszczenia. Możliwe, że pytania - numer 10 Bliskie mi osoby sprawiają, że zaczynam w siebie wątpić, oraz numer 23 Nie czuję się dobrze, kiedy otwieram się przed bliskimi mi osobami są w odmiennym stopniu normatywne dla dorosłych w wieku poniżej i powyżej 40 roku życia. Z rozwojowego punktu widzenia pytanie 10 może być odmiennie wrażliwym wskaźnikiem niepokoju przywiązaniowego. Wsparcie bliskich w zakresie własnych możliwości w okresie budowania kariery zawodowej i dużej ilości zadań rodzinnych normatywnie występujących przed 40 rokiem życia, może być bardziej wrażliwym miernikiem niepokoju przywiązaniowego u młodych, aniżeli u starszych dorosłych. Wchodzenie w nowe role u młodych dorosłych może wiązać się z wyższym poziomem potrzeby wsparcia ze strony bliskich oraz niepewnym modelem Ja w bliskich związkach. Brak wsparcia ze strony bliskich może łatwiej niż u starszych dorosłych podwyższać poziom niepokoju o to, czy jest się akceptowanym w bliskich związkach. Z drugiej strony, doświadczeni już zawodowo i w zakresie pełnionych ról rodzinnych starsi dorośli są bardziej 15
doświadczeni i pewni siebie w bliskich związkach oraz mogą mieć też niższą potrzebę wsparcia w związku z osiągniętą już często stabilizacją zawodowo-rodzinną. I tak, odpowiedź bliskie osoby nie sprawiają, że zaczynam w siebie wątpić może u osób starszych wskazywać w mniejszym stopniu, aniżeli u młodszych, na ufność przywiązaniową (pozytywny model Ja), będąc w większym stopniu markerem jednostkowego doświadczenia w pełnionych rolach. Podobnie, pytanie 23 może wykazywać odmienną wrażliwość pomiaru unikania przywiązaniowego u młodszych i starszych dorosłych. Można przypuszczać, że doświadczone już życiowo osoby starsze mają już doświadczenie w bezpiecznym dla nich poziomie otwartości, jak i w związku partnerskim, w którym są. Zatem nie otwierają się przed bliskimi w stopniu wprowadzającym ich w dyskomfort. W przeciwieństwie do tego, młodzi dorośli testujący dopiero odpowiedni dla siebie poziom otwartości w bliskich związkach, eksperymentują częściej z poziomem otwartości w związku narażając się na częściej odczuwany dyskomfort. Stąd wartość początkowa średnich pytań wykazanych w naszym badaniu jako nieekwiwalentne może być inna, zaś ich średni wyniki nie jest porównywalny w obu grupach wiekowych, bo w każdej z nich oznacza coś innego. Przy tym, sprawdzając, czy brak ekwiwalencji obu pytań pozostawionych w pełnej wersji skali ECR-R wpływa w sposób istotny na wyniki średnich wartości podskal wykazaliśmy, że problem braku ekwiwalencji nie zmienia średniego poziomu wyników obu podskal. Należy jednak pamiętać, że przy zmniejszeniu ilości pytań podskal (odmiennym niż przez nas zaproponowane skróceniu skali) oraz analizach w innej próbie badawczej problem braku ekwiwalencji pytań oraz jego znaczenia dla wyników skali powinien być ponownie przetestowany. Warto zaznaczyć tutaj standardy badań w zakresie porównań średnich wyznaczone w obszarze psychologii międzykulturowej. Standard ten zakłada, że dopiero wykazanie 16
ekwiwalencji skalarnej uprawnia do porównywania poziomów średnich pomiędzy analizowanymi grupami. Pomimo znaczących podstaw teoretycznych i praktycznych zachowania owej ostrożności przy porównywaniu kultur, może pojawić się pytanie, do jakiego stopnia zasadna jest aż tak dalece posunięta ostrożność wnioskowania w obrębie jednej kultury, np. przy porównywaniu odmiennych grup wiekowych? Badania wcześniejsze pierwszej autorki niniejszego artykułu (Lubiewska i in., w przygotowaniu), w których testowano ekwiwalencję pomiarową pomiędzy 3 pokoleniami (nastolatkowie, ich matki i babcie) wewnątrz 14 kultur oraz pomiędzy kulturami wykazały, że brak ekwiwalencji pomiarowej jest równie duży (a czasami nawet większy) przy porównywaniu różnych pokoleń wewnątrz kultur, co pomiędzy kulturami. Wyniki przytoczonego oraz niniejszego badania wydają się wskazywać na istotność różnic w obrębie różnych kohort wiekowych w badaniach w obszarze przywiązania. Wyniki te wydają się wskazywać na konieczność zachowania ostrożności we wnioskowaniu na temat różnic międzypokoleniowych w sytuacji kiedy ekwiwalencja pomiarowa nie została udowodniona. Wyniki osób młodszych i starszych mogą po prostu wskazywać na coś innego, aniżeli różnice w poziomie analizowanych w badaniu konstruktów teoretycznych. Różnice międzygrupowe Nasze badania wykazały, że mężczcyźni mają wyższy poziom nieufności przywiązaniowej (niepokoju i unikania) w bliskich związkach, aniżeli kobiety. Ponadto, wykazaliśmy także, iż przy zastosowaniu skróconej wersji skali ECR-R osoby młodsze mają wyższy poziom niepokoju przywiązaniowego, aniżeli osoby starsze. Wynik ten jest zgodny z badaniami przeprowadzonymi w innych kulturach w zakresie przywiązania (Chopik i in., 2013; Klohnen, John, 1998; Noftle, Shaver, 2006), oraz spadku poziomu neurotyzmu (dzielącego wariancję wraz z niepokojem przywiązaniowym) wraz z wiekiem (Soto, John, Gosling, Potter, 2011). Niemniej, stoi on w sprzeczności z naszymi wcześniejszymi 17
badaniami, w których kontrola ekwiwalencji wykazała, że pomiędzy polskimi nastolatkami, ich matkami i babciami nie ma różnic w zakresie niepokoju przywiązaniowego (Lubiewska, van de Vijver, w recenzji). Należy jednak dodać, że w przytoczonym badaniu (w przeciwieństwie do niniejszego badania) analizowano trzy kohorty wiekowe przynależące do tych samych rodzin, co może wyjaśniać ich większe, aniżeli w innych badaniach, podobieństwo w zakresie niepokoju przywiązaniowego, który dzieli część wspólnej wariancji z neurotyzmem (Noftle, Shaver, 2006). Wskazówki praktyczne Nasze badanie zostało przeprowadzone na próbie 781 osób, która nie może być traktowana jako reprezentatywna i stanowiąca punkt porównania (normy) dla innych badań. Niemniej, w oparciu o wyniki naszych badań możemy sformułować pewne wskazówki dotyczące stosowania polskiej wersji skali ECR-R w dalszych badaniach w grupach zróżnicowanych w zakresie wieku i płci. Po pierwsze, stosowanie pełnej i skróconej wersji skali ECR-R w grupach dorosłych kobiet i mężczyzn nie wiąże się z ryzykiem stronniczości pytań, czy metody pomiaru. Po wtóre, stosowanie skali w grupach osób dorosłych poniżej i powyżej 40 roku życia jest niezagrożone stronniczością pytań tylko w przypadku użycia skali skróconej. Niemniej, użycie skali pełnej niesie za sobą takie ryzyko. Z tego powodu, jeżeli nie będzie możliwe przetestowanie ekwiwalencji pomiarowej w grupach osób do i powyżej 40 roku życia zalecamy wyłączenie z ogólnych wyników podskal dwóch pytań (10 i 23), których ekwiwalencja w grupach osób młodszych i starszych okazała się w naszym badaniu problematyczna. Niemniej, chcemy podkreślić, że przede wszystkim warto przy każdorazowym użyciu skali w nowej próbie potwierdzić strukturę skali oraz ponownie sprawdzić ekwiwalencję pomiarową narzędzia w porównywanych grupach. 18
Literatura: Brennan K. A., Clark C. L., Shaver P. (1998). Self-report measurement of adult attachment: An integrative overview. [W:] J. A. Simpson, W. S. Rholes (Red.), Attachment theory and close relationships, 46-76. New York: The Guilford Press. Byrne, M. B., Shavelson, R. J., Muthen, B. (1989). Testing for the equivalence of factor covartiance and mean structures: The issue of partial measurement equivalence. Psychological Bulletin, 105, 456-466. Byrne, M. B., van de Vijver (2010). Testing for measurement and structural equivalence in large-scale cross-cultural studies: Addressing the issue of nonequivalence. International Journal of Testing, 10, 107-132. Cheung, G. W., Rensvold, R. B. (2002). Evaluating goodness-of-fit indexes for testing measurement invariance. Structural Equation Modeling, 13, 531-542. Chopik, W. J., Edelstein, R. S., Fraley, R. C. (2013). From the cradle to the grave: Age differences in attachment from early adulthood to old age. Journal of Personality, 81, 171-183. Datta, P., Marcoen, A., Poortinga,Y. H. (2005). Recalled early maternal bonding and motherand self-related attitudes in young adult daughters: A cross-cultural study in India and Belgium. Internationa Journal of Psychology, 40, 324-338. Del Giudice, M., Belsky, J. (2010). Sex differences in attachment emerge in middle childhood: An evolutionary hypothesis. Child Development Perspectives, 4, 97-105. Fraley, R. C. (2015). Information on the Experiences in Close Relationships-Revised (ECR-R) Adult Attachment Questionnaire. Pobrano 2.03.2015 z: http://internal.psychology.illinois.edu/~rcfraley/measures/ecrr.htm 19
Fraley R. C., Waller N. G., Brennan K. A. (2000). An item-response theory analysis of selfreport measures of adult attachment. Journal of Personality and Social Psychology, 78, 350-365. Klohnen, E. C., John, O. P. (1998). Working models of attachment: A theory-based prototype approach. [W:] J. Simpson, S. Rholes (red.), Attachment theory and close relationships (s. 115-140). New York: Guilford. Linde-Usienkiewicz, J. (red.) (2005). Wielki słownik angielsko-polski. Warszawa: PWN. Lubiewska, K., Głogowska, K., Mickiewicz, K., Wyrzykowska, E., Wiśniewski, C, Izdebski, P. (w recenzji). Skala Experience in Close Relations-Revised: Struktura, rzetelność oraz skrócona wersja skali w polskiej próbie. Lubiewska, K., van de Vijver, A. J. R. (w recenzji). Attachment types or dimensions: Evidence from the Adult Attachment Scale across three generations. Lubiewska, K., van de Vijver, A. J. R., Mayer, B., Trommsdorff, G. i Nauck, B. (w przygotowaniu). Adult Attachment Scale: Mean differences across 14 cultures and 3 generations. Noftle, E. E., Shaver, P. R. (2006). Attachment dimensions and the big five personality traits: Associations and comparative ability to predict relationship quality. Journal of Research in Personality, 40, 179-208. R Core Team (2014). R: A language and environment for statistical computing. Pobrane z: http://cran.r-project.org. Ravitz P., Maunder R., Hunter J., Sthankiya B., Lancee W. (2010). Adult attachment measures: A 25-year review. Journal of Psychometric Research, 69, 419-432. Revelle, W. (2011). Package psych. Pobrane z: http://www.personality-project.org/r. Rosseel, Y. (2012). lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48, 1-36. Pobrane z: http://www.jstatsoft.org/v48/i02/. 20
Satorra, A., Bentler, P. M. (1994). Corrections to test statistics and standard errors in covariance structure analysis. [W:] A. von Eye, C. C. Clogg (red.), Latent variables analysis: Applications to developmental research (s. 399-419). Thousand Oaks: Sage. Soto, C. J., John, O. P., Gosling, S. D., Potter, J. (2011). Age differences in personality traits from 10 to 65: Big Five domains and facets in a large cross-sectional sample. Journal of Personality and Social Psychology, 100, 330-348. Van de Vijver, F., Leung, K. (1997). Methods and data analysis for cross-cultural research. Thousand Oaks: Sage. Van de Vijver, F., Tanzer, N. K. (2004). Bias and equivalence in cross-cultural assessment: and overview. Revue Europeenne de Psychologie Appliquée, 54, 119-135. 21
Tabela 1 Różnice Rozkładów Liczebności Próby w Różnych Grupach Wiekowych w Zależności od Płci, Wykształcenia, Bycia w Związku Romantycznym oraz Uzależnienia od Alkoholu (N = 781) Grupa Płeć Wykształcenie W związku intymnym Uzależnieni od alkoholu wiekowa (n) Kobiety Mężczyźni Podstawowe Zawodowe Średnie Wyższe Tak Nie Tak Nie 16-25 (167) 101 64 7 5 131 24 93 74 8 159 26-35 (157) 73 85 9 19 5 74 112 45 44 116 36-45 (155) 75 76 12 42 53 49 102 52 62 95 46-55 (152) 75 72 18 45 55 32 107 40 60 92 56-81 (145) 66 73 29 47 52 16 98 47 45 100 Total 390 370 75 158 348 195 512 258 219 562 (%) (51) (49) (9,6) (20,4) (44,8) (25,2) (67) (33) (28) (72) Braki danych (%) 21 (2,7) 5 (0,6) 11 (1,4) - χ 2 9,109 (4) 181,676 (12)*** 13,102 (4)* 65,454 (4)*** * p <.05.** p <.010. *** p <.001. 22
Tabla 2 Parametry Dopasowania Modeli Pomiarowych z Korektą Satorry-Bentlera 2-Czynnikowej Skali Experience in Close Relationships-Revised w Wersji Pełnej oraz Skróconej w Grupach Zróżnicowanych w Zakresie Płci oraz Wieku Obszar nałożonych restrykcji df χ2 RMSEA 90%CI CFI TLI CFI Płeć Pełna skala ECR-R + 400 1489,921 0,059 0,056; 0,062 0,907 0,899 - Struktura czynnikowa 800 1938,414 0,060 0,057; 0,063 0,901 0,892-0,006 Jednostka pomiarowa 828 1975,422 0,060 0,057; 0,063 0,900 0,895-0,001 Stałe regresji 856 2042,876 0,060 0,057; 0,062 0,897 0,895-0,003 Skrócona skala ECR-R ++ 103 394,005 0,060 0,055; 0,065 0,946 0,938 - Struktura czynnikowa 206 507,385 0,061 0,056; 0,067 0,943 0,034-0,003 Jednostka pomiarowa 220 532,540 0,060 0,055; 0,066 0,941 0,936-0,002 Stałe regresji 234 565,906 0,060 0,055; 0,066 0,937 0,936-0,004 Wiek (podział na dwie grupy 16-40 oraz 41-81 lat) Pełna skala ECR-R 400 1489,921 0,059 0,056; 0,062 0,907 0,899 - Struktura czynnikowa 800 1938,343 0,060 0,057; 0,063 0,905 0,897-0,002 Jednostka pomiarowa 828 1997,706 0,060 0,057; 0,063 0,903 0,898-0,002 Stałe regresji 856 2181,288 0,063 0,060; 0,066 0,890 0,888-0,013 Część stałych regresji (pytania 10 i 23 854 2133,432 0,062 0,059; 0,065 0,893 0,891-0,010 wolne od restrykcji) Skrócona skala ECR-R 103 394,005 0,060 0,055; 0,065 0,946 0,938 - Struktura czynnikowa 206 519,761 0,062 0,057; 0,068 0,943 0,934 0,003 Jednostka pomiarowa 220 544,251 0,061 0,056; 0,067 0,941 0,936 0,002 Stałe regresji 234 598,853 0,063 0,058; 0,069 0,934 0,932 0,007 Nota. Wszystkie wartości χ2 są istotne statystycznie na poziomie p < 0,001. + Model 2-czynnikowy z kowariancją pomiędzy podskalą Niepokoju (18 pytań) oraz Unikania (18 pytań) oraz drugorzędowym czynnikiem pytań rekodowanych (szczegóły w Lubiewska i in., w recenzji). ++ Model 2-czynnikowy z kowariancją pomiędzy podskalą Niepokoju (8 pytań: 2, 4, 6, 8, 12, 15, 16, 18) oraz Unikania (8 pytań: 20, 22, 24, 26, 28, 29, 30, 35). 23
Tabela 3 Różnice Średnich Wyników Podskal (SD) ECR-R w Grupach Zróżnicowanych Wiekiem i Płcią Pełnej-Ekwiwalentnej (Pełna-EQ) oraz Skróconej Wersji (Skrócona) Skali ECR-R Kryterium zróżnicowania Unikanie Niepokój grup (n/df) Pełna-EQ + Skrócona Pełna-EQ + Skrócona Płeć Kobiety (390) 2,89 (0,93) 2,45 (1,05) 3,05 (1,25) 2,88 (1,37) Mężczyźni (370) 3,16 (0,88) 2,77 (1,05) 3,37 (1,21) 3,24 (1,37) F(759) 17,00*** 17,95*** 12,86*** 12,98*** Wiek Młodsi (407) 3,04 (0,90) 2,58 (1,04) 3,27 (1,25) 3,14 (1,36) Starsi (374) 2,96 (0,93) 2,60 (1,06) 3,12 (1,20) 2,94 (1,38) F(780) 1,45 0,11 2,63 4,16* Nota. + Do obliczenia średnich wartości podskal unikania i niepokoju nie włączono pytań 10 i 23, utrudniających zachowanie ekwiwalencji pomiarowej podskal. * p <.05.** p <.010. *** p <.001. 24
Załącznik 1 Średnie Wyniki Podskal (SD) ECR-R w Różnych Grupach Wiekowych w Badaniach Fraley a oraz Polskich z Porównaniem Różnic Wyników Średnich (F) i korelacji (r) Polskiej Pełnej-Ekwiwalentnej skali ECR-R (Pełna-EQ) oraz Skróconej Wersji Skali ECR-R (Skrócona) Polskojęzyczna wersja skali ECR-R Anglojęzyczna wersja ECR-R ++ Unikanie Niepokój Wiek Pełna-EQ + Skrócona F r Pełna-EQ + Skrócona F r Wiek Unikanie Niepokój 16-25 4,547 (0,682) 5,312 (1,065) 18,060*** 0,895*** 3,268 (1,256) 3,007 (1,253) 9,130*** 0,957*** 20 2,88 3,59 26-35 4,760 (0,645) 5,589 (0,977) 19,157*** 0,850*** 3,133 (1,360) 2,903 (1,343) 7,866*** 0,963*** 30 2,96 3,55 36-45 4,688 (0,756) 5,311 (1,142) 13,311*** 0,887*** 3,225 (1,333) 3,068 (1,365) 5,027*** 0,958*** 40 3,04 3,51 46-55 4,688 (0,887) 5,265 (1,146) 12,905*** 0,883*** 2,979 (1,317) 2,851 (1,310) 4,413*** 0,963*** 50 3,12 3,47 56-81 4,937 (0,792) 5,494 (1,133) 12,299*** 0,899*** 3,057 (1,361) 2,915 (1,402) 4,348*** 0,960*** 60 3,20 3,43 Nota. + Do obliczenia średnich wartości podskal unikania i niepokoju nie włączono pytań 10 i 23, utrudniających zachowanie ekwiwalencji pomiarowej podskal. ++ Dane (przewidywane wartości średnich) zebrane przy pomocy oryginalnej (36 itemowej) anglojęzycznej skali ECR-R dostępne na stronie internetowej Fraley a, http://internal.psychology.illinois.edu/~rcfraley/measures/ecrr.htm. *** p < 0,001. W obu badaniach użyto 7-stopniowej skali Likerta. 25