Dr hab. Adam Putko, prof. UAM Instytut Psychologii Uniwersytet im. A. Mickiewicza w Poznaniu

Dr hab. Adam Putko, prof. UAM Instytut Psychologii Uniwersytet im. A. Mickiewicza w Poznaniu Recenzja rozprawy doktorskiej mgr Anny Cwojdzińskiej pt. Wpływ czynników afektywnych na funkcjonowanie w obszarze teorii umysłu, przygotowanej pod kierunkiem prof. dra hab. n. med. Filipa Rybakowskiego Recenzowana rozprawa podejmuje zagadnienie wpływu nastroju na rozpoznawanie i wnioskowanie o stanach mentalnych innych osób. Uwzględnione zostały również czynniki, które mogą moderować ten wpływ lub są związane z procesami mentalizacji u osób dorosłych. Biorąc pod uwagę niewielką liczbę dotychczasowych badań nad tym zagadnieniem, przedstawiony w pracy projekt, oparty na planie badania eksperymentalnokorelacyjnego, jest w swoim zamyśle wartościowy poznawczo. Jednak w praktyce okazał się trudny do zrealizowania, głównie ze względu na problemy z rekrutacją do badań osób z zaburzeniami depresyjnymi. Doceniając ambitny cel, który Doktorantka postawiła sobie w swojej pracy, należy zauważyć, że zmagając się z literaturą przedmiotu nie uniknęła w swoich rozważaniach pewnych terminologicznych potknięć, a w analizie wyników pozostało miejsce na jeszcze bardziej wnikliwe przyjrzenie się uzyskanym rezultatom. Rozprawa liczy 112 stron, w tym 10 stron wykazu literatury cytowanej, pozostałą część stanowią obszerne załączniki (ok. 60 stron). Wyodrębnione zostały cztery rozdziały poprzedzone Wstępem. Rozdział 1 przedstawia kontekst teoretyczny pracy, rozdział 2 problem i metodę badania własnego, rozdział 3 analizę wyników badania własnego, a rozdział 4 interpretację i dyskusję wyników. W rozdziale 1, zatytułowanym Czynniki afektywne a proces tworzenia Teorii Umysłu, przedstawiony został konstrukt teorii umysłu, scharakteryzowane zostały czynniki afektywne (emocje i nastrój) oraz dokonany został przegląd badań nad wpływem czynników afektywnych i innych zmiennych na funkcjonowanie w obszarze teorii umysłu. Przedstawiając konstrukt teorii umysłu (theory of mind, ToM), definiowany w pracy jako

2 zdolność do rozpoznawania i wnioskowania o stanach mentalnych innych osób (s. 4), Autorka porusza wiele różnych zagadnień, m.in. ważne z punktu widzenia tematu pracy rozróżnienie na afektywną i poznawczą teorię umysłu, wpływ nastroju na wnioskowanie o stanach mentalnych u osób bez zaburzeń (badanie Converse a i in., 2008), a także zagadnienie nieprawidłowości w procesach mentalizowania jak proponuję nazywać procesy interesujące Doktorantkę u osób z różnymi rodzajami zaburzeń, w tym u osób z zaburzeniami nastroju (afektywnymi). Niewątpliwie ze względu na fakt, iż w badaniu własnym Doktorantki przedmiotem zainteresowania są osoby z epizodem depresyjnym, właśnie ostatnie z ww. zagadnień powinno stać się jednym z centralnych w pracy. Tymczasem zagadnieniu nieprawidłowości w tym obszarze funkcjonowania u osób z zaburzeniami depresyjnymi oraz zaburzeniami afektywnymi dwubiegunowymi (CHAD) poświęcone zostały dwa podrozdziały, każdy o objętości niespełna półtorej strony (s. 35-37). To trochę mało, biorąc pod uwagę dostępną na ten temat literaturę, tak bogatą, że w ostatnich latach pojawiły się trzy opracowania prezentujące wyniki metaanaliz jedna dotycząca zdolności mentalizacyjnych u osób z zaburzeniami depresyjnymi (Bora i Berk, 2016) oraz dwie dotyczące tych zdolności u osób z CHAD (Bora i in., 2016; Samamé i in., 2015). Prac tych nie ma w wykazie cytowanej literatury i ich braku nie rekompensuje fakt, iż Autorka w swoich rozważaniach powołuje się na jedną z ostatnich prac o charakterze przeglądowym (Bora i Özerdem, 2017), dotyczącą jednakże zdolności mentalizacyjnych u krewnych osób z CHAD. Kolejna uwaga, którą nasuwa lektura części teoretycznej pracy, dotyczy problemów językowo-terminologicznych, związanych przede wszystkim z posługiwaniem się niespotykanym w polskiej literaturze przedmiotu terminem tworzenie teorii umysłu. Termin ten występuje w tytule rozdziału 1 i w wielu innych miejscach pracy. Chociaż sam termin teoria umysłu, jak już zauważyłem wcześniej, został w pracy zdefiniowany i jest to ogólnie biorąc akceptowalna definicja, to próżno szukać w pracy wyjaśnienia, co Doktorantka rozumie pod terminem tworzenie teorii umysłu. Praca nie zawiera również żadnej wzmianki na temat ewentualnego odpowiednika tego terminu w literaturze angielskojęzycznej ani też komentarza Autorki, iż napotkała pewną trudność w adekwatnym oddaniu w języku polskim znaczenia pewnego terminu i proponuje w związku z tym posługiwać się właśnie takim, a nie innym polskim terminem. W konsekwencji zdezorientowany czytelnik, na podstawie licznych w pracy przypadków użycia tego terminu,

3 dochodzi do sprzecznych wniosków. Niektóre bowiem ze zdań (np. s. 8: W toku badań dotyczących mechanizmów tworzenia Teorii Umysłu powstały liczne konceptualizacje. ) pozwalają podejrzewać, że pod terminem tworzenie teorii umysłu należy być może rozumieć rozwój zdolności do rozpoznawania i wnioskowania o stanach umysłowych. Za taką interpretacją mógłby przemawiać fakt, iż jeden z podrozdziałów został zatytułowany: Cechy środowiska społecznego a rozwój ToM (s. 12). Niestety inne stwierdzenia pojawiające się w pracy (np. s. 8: rozwój zdolności tworzenia Teorii Umysłu zależny jest od ) taką ontogenetyczną interpretację rozwiewają. Najwyraźniej więc pod terminem tworzenie teorii umysłu ukrywa się jednak coś innego niż rozwój teorii umysłu lub co gorsza ten sam termin używany jest w różnych znaczeniach bez wyraźnego sygnalizowania tego czytelnikowi. Wydawać by się mogło, że problem znaczenia opisywanego tu terminu został wreszcie rozwiązany na s. 23-24, na których znajduje się zdanie mówiące o obniżonych umiejętnościach społecznych osób z depresją, w tym obniżonej zdolności nawiązywania kontaktu wzrokowego, niezbędnego do prawidłowego odczytywania intencji i stanów innych ludzi, czyli tworzenia Teorii Umysłu. Niestety, pominąwszy skrót myślowy zawarty w tym stwierdzeniu (stany innych ludzi), niewiele się ono różni od definicji samej teorii umysłu znajdującej się na s. 4 pracy. Drobne potknięcia terminologiczne widoczne są również w innych miejscach pracy (np. na s. 8, gdy mowa o doświadczeniu, które dostarcza danych do zmian w już istniejących formułach ; na s. 15, gdy mowa o zakłóceniach teorii umysłu ). Sądzę, że tego typu problemy nie pojawiłyby się, gdyby Autorka zajrzała do polskojęzycznych prac na temat teorii umysłu. Zauważyłaby wówczas, że termin tworzenie teorii umysłu nie pojawia się w nich i że opisując czynność rozpoznawania lub wnioskowania o stanach mentalnych używa się niekiedy, zwłaszcza w nowszych pracach, np. terminu mentalizowanie (termin, który skądinąd pojawia się sporadycznie w pracy, np. na s. 35). Z faktu, iż wykaz cytowanej literatury nie zawiera żadnej z takich prac, wnioskuję, że do tych prac Doktorantka nie sięgnęła. Podsumowując: zawartość części teoretycznej pracy świadczy o kontakcie Autorki z literaturą przedmiotu, aczkolwiek klarowność przedstawionych rozważań obniżają problemy językowo-terminologiczne, związane z nieadekwatnym wyrażaniem w języku polskim specjalistycznych pojęć funkcjonujących w literaturze angielskojęzycznej. Poza tym,

4 zbyt mało uwagi poświęcono kluczowej w świetle badań własnych problematyce nieprawidłowości w procesach mentalizacji u osób z zaburzeniami afektywnymi. W rozdziale 2, bardzo dobrze zorganizowanym pod względem podziału treści, przedstawione zostały: problemy i hipotezy badawcze, plan i etapy badań, dobór osób do badań, procedura i organizacja badań oraz schemat statystycznej analizy danych. Celem badania własnego było rozstrzygnięcie dwóch problemów badawczych (s. 43): (1) Jak funkcjonują w obszarze Teorii Umysłu osoby o różnych charakterystykach funkcjonowania afektywnego? (2) Czy między osobami doświadczającymi różnych rodzajów nastroju istnieją podobieństwa/różnice w zakresie wybranych charakterystyk i czy charakterystyki te różnicują osoby w epizodzie depresji od osób z grupy kontrolnej w wybranych warunkach eksperymentalnych? Należy zauważyć, że użycie w pytaniu 2 terminu warunki eksperymentalne jest mało eleganckie, ponieważ oznacza użycie języka operacjonalizacji zmiennych w opisie problemów badawczych wyrażonych w kategoriach konstruktów teoretycznych, czego powinno się unikać. Podobne zacieranie różnic między tymi dwiema płaszczyznami opisu widoczne jest również w sposobie sformułowania dwóch hipotez (nr 4 i 5), w których pojawiają się nazwy narzędzi. Badanie własne przeprowadzono w schemacie eksperymentalno-korelacyjnym. Zastosowanie planu eksperymentalnego jest niewątpliwie silną stroną przeprowadzonego przez Doktorantkę badania i należy to docenić, biorąc pod uwagę przede wszystkim fakt, iż jedną z badanych grup były osoby z depresją. Należy również z uznaniem odnieść się do podjętych po zakończeniu badania działań związanych z wyprowadzaniem jego uczestników z sytuacji badania. Niewątpliwie Doktorantka dołożyła wszelkich starań, aby usunąć lub złagodzić ewentualne negatywne skutki zastosowanej procedury indukcji nastroju. Badanie uzyskało zresztą pozytywną opinię stosownej komisji ds. etyki badań. W skład zastosowanych narzędzi wchodziły: (1) kwestionariusz NEO-FFI; (2) Neuroafektywne Skale Osobowości; (3) Skala LEIDS-R; (4) Skala Depresji Becka; (5) Skala Uczuć Pozytywnych i Negatywnych (SUPIN); (6) Test Twarze; (7) Test Oczy; (8) Test Sortowania Kart z Wisconsin (WCST); (9) Samoocena nastroju badanego; (10) Wywiad ustrukturyzowany. Opis większości narzędzi zawiera podstawowe na ich temat informacje, brakuje jednak ważnych informacji o ich własnościach psychometrycznych, pochodzących chociażby z danych dostępnych w literaturze. Wyjątkiem jest Skala LEIDS-R, gdzie zostały podane wyniki analizy rzetelności uzyskane we własnych badaniach.

5 Rozdział 3 zawiera statystyczną analizę wyników. Prezentowane są statystyki opisowe badanych zmiennych, wyniki testów istotności różnic międzygrupowych, analizy korelacji oraz moderacji. Ogólnie biorąc, Doktorantka kompetentnie stosuje różne techniki wnioskowania statystycznego. Wyniki analiz przedstawiane są w przejrzyście zbudowanych tabelach i na wykresach. Badaną próbę stanowiło 31 osób z rozpoznaniem epizodu depresji (grupa kliniczna) i 64 osoby bez zaburzeń (grupa kontrolna). Niestety obie grupy nie zostały dopasowane do siebie przede wszystkim pod względem wieku, podczas gdy takie dopasowanie jest standardem w tego typu badaniach. Średni wiek grupy klinicznej wyniósł 42,58 lat (SD = 12,06), a grupy kontrolnej 27,95 lat (SD = 6,80). Niedopasowanie obu grup pod względem wieku jest poważnym ograniczeniem badania, z czego Doktorantka zdaje sobie sprawę i tłumaczy przede wszystkim trudnościami w rekrutacji do badań osób z zaburzeniami afektywnymi. Niestety w ślad za tym nie zostały podjęte w statystycznej analizie wyników odpowiednie działania, które pozwoliłyby sprawdzić, czy obraz uzyskanych wyników zmieni się, jeżeli uwzględni się wiek uczestników badania. Co więcej, jak wynika z przedstawionych w pracy danych (ryc. 6 i 8 na s. 59 i 63) brak dopasowania obu grup dotyczy również poziomu wykształcenia: w grupie klinicznej tylko ok. 16% badanych miało wykształcenie wyższe, a pozostali reprezentowali niższe poziomy wykształcenia do podstawowego włącznie; natomiast w grupie kontrolnej aż ok. 56% badanych miało wykształcenie wyższe, a reszta co najmniej średnie/niepełne wyższe (osoby studiujące). Dopasowanie obu grup pod względem wieku i poziomu wykształcenia, gdzie ta ostatnia zmienna może stanowić pośrednią miarę inteligencji, jest ważne, biorąc pod uwagę, że przedmiotem pomiaru były m.in. zdolności mentalizowania oraz funkcje wykonawcze. Do tego problemu powrócę nieco niżej. W analizie istotności różnic między grupą kliniczną i kontrolną, ze względu na dużą dysproporcję w liczebnościach porównywanych grup, zastosowano nieparametryczny test U Manna-Whitneya. Chociaż decyzja ta jest uzasadniona i analizy zostały przeprowadzone poprawnie, to jednak słabą stroną tej części analiz jest brak przeprowadzenia analiz uzupełniających, sprawdzających wpływ wieku oraz wykształcenia na wariancję odpowiednich zmiennych zależnych. Wprawdzie nieparametryczne testy będące odpowiednikiem analizy kowariancji (ANCOVY), która byłaby tutaj najlepszym rozwiązaniem, nie są dostępne w popularnych pakietach statystycznych, nie oznacza to, że takich testów nie

ma 1 i że nie można było ich zastosować. Inna możliwość to sprawdzenie, czy zostały spełnione inne założenia analizy wariancji dla danej zmiennej zależnej i w przypadku pozytywnej weryfikacji przynajmniej ich części przeprowadzenie ANCOVY pomimo różnicy w liczebnościach obu porównywanych grup. Tak czy inaczej, w pracy na poziomie doktoratu oczekiwałbym bardziej dogłębnej analizy wyników, rozważenia wszystkich za i przeciw zastosowaniu określonych testów oraz wykorzystania wszelkich możliwych środków, aby rozwiać wątpliwości związane z uzyskanymi wynikami w jakim stopniu odzwierciedlają one wpływ stanu klinicznego lub nastroju badanych, a w jakim stopniu wpływ zmiennych ubocznych, takich jak przede wszystkim wiek i poziom wykształcenia? O tym, że są to zmienne, których nie można pominąć w przypadku badań nad zdolnościami mentalizowania oraz funkcjami wykonawczymi, świadczą dane dostępne w literaturze przedmiotu na temat testu RMET 2, który był w badaniu Doktorantki główną miarą zdolności mentalizacyjnych, oraz na temat testu WCST 3, który był miarą funkcji wykonawczych. Autorka zdaje się bagatelizować wpływ wieku na wyniki w testach teorii umysłu u osób dorosłych, stwierdzając na s. 15, że dostępne wyniki badań są niekonkluzywne. Niestety nie można się z tym stwierdzeniem zgodzić, gdyż z wyjątkiem pierwszego badania dotyczącego tego zagadnienia (Happé i in., 1998) większość pozostałych pokazała, że wyniki w testach mentalizacji u osób dorosłych w mniejszym lub większym stopniu, w zależności od zastosowanego testu, obniżają się jednak wraz z wiekiem. W przypadku testu RMET, zastosowanego przez Doktorantkę, tendencje spadkowe raportowane w literaturze są wyraźne. Uwagi szczegółowe dotyczące analizy wyników: 1. Nie sprawdzono istotności różnicy między badanymi grupami (kliniczną i kontrolną) pod względem wieku, wykształcenia oraz proporcji liczby kobiet i mężczyzn. Przedstawione w pracy dane pozwalają przypuszczać, że tylko pod względem płci obie grupy nie różniły się istotnie. Nie przedstawiono również danych na temat zmiennych demograficznych osób tworzących grupy wyodrębnione na podstawie 1 Np. Lawson, A. (1983). Rank analysis of covariance: alternative approaches. Journal of the Royal Statistical Society Series D, 32(3), 331-337. 2 W sprawie związanych z wiekiem różnic w wynikach testu RMET por. np. Jankowiak-Siuda, K. i in. (2016). Psychometric evaluation of the Reading the Mind in the Eyes test with samples of different ages from a Polish population. Studia Psychologica, 58(1), 18-31. W sprawie związku między poziomem inteligencji a wynikiem w RMET por. np. Ahmed i Miller (2011) artykuł cytowany w pracy. 3 Dane na temat wieku i poziomu wykształcenia w relacji do wyników w teście WCST por. np. Jaworowska, A. (2002). Test Sortowania Kart z Wisconsin. Podręcznik. Warszawa: Pracownia Testów Psychologicznych PTP. s. 12-13 i 15-16. 6

7 poziomu nastroju. Czy grupy te były równoważne pod względem tych zmiennych? Czy ewentualne różnice między nimi mogły mieć wpływ na wyniki? 2. Nie jest dla mnie jasne, dlaczego w analizie wyników dotyczących wpływu nastroju na rozpoznawanie stanów mentalnych (np. tabela 27, s. 73) jedna z grup identyfikowana jest jako brak zmian nastroju, a pozostałe jako negatywny i pozytywny nastrój. Przecież deklarowany przez uczestnika badania brak zmiany nastroju po poddaniu się procedurze indukcji nastroju nie musi oznaczać, że osoba ta znajdowała się w nastroju neutralnym. Równie dobrze mogła znajdować się w nastroju pozytywnym lub negatywnym, który nie uległ zmianie w wyniku indukcji nastroju. 3. Analiza wyników w Teście Twarze oparta jest na wynikach ogólnych będących sumą wyników uzyskanych w 20 próbach. Tymczasem w skład tych 20 prób w Teście Twarze wchodzi 10 prób mierzących rozpoznawanie emocji podstawowych i 10 mierzących rozpoznawanie emocji złożonych (por. badanie Barona-Cohena 4 dotyczące tego testu). Dane dotyczące rozpoznawania tych dwóch rodzajów emocji w Teście Twarze nie zostały przeanalizowane. 4. Nieporozumieniem jest umieszczenie w tabeli 15 na s. 64 wśród zmiennych odnoszących się do wyników w teście WCST zmiennej o nazwie długość reguły. Przyjmuje ona wartość średnią równą 10 i SD = 0. Nie jest to wskaźnik wykonania testu, lecz parametr jego przebiegu raportowany przez program PEBL ( run length to move to next category = 10 ), informujący o tym, że reguła sortowania zmieniała się po poprawnym posortowaniu 10 kart z rzędu. W przeciwieństwie do rozdziału 2, którego bardzo dobra organizacja ułatwiała jego lekturę, śledzenie rozważań Autorki przedstawionych w rozdziale 4 ( Interpretacja i dyskusja wyników ) jest utrudnione ze względu na brak wyraźnego sygnalizowania, do której hipotezy w danym momencie się odnosi. Jeden z wyników, który jest dyskutowany, dotyczy faktu, że w warunkach nastroju pozytywnego odnotowano w badaniu własnym istotne różnice między grupą kliniczną i kontrolną w zakresie RMET, ale nie Testu Twarze; natomiast w warunkach nastroju negatywnego istotne różnice międzygrupowe były w obu tych miarach mentalizacji. W każdym przypadku różnice były na niekorzyść grupy klinicznej. 4 Baron-Cohen, S., Wheelwright, S., Jolliffe, T. (1997). Is there a language of the eyes? Evidence from normal adults and adults with autism or Asperger syndrome. Visual Cognition, 4, 311-331.

8 Próbując wyjaśnić te wyniki Autorka wskazuje m.in. na różnicę w stopniu trudności/złożoności obu testów (RMET trudniejszy niż Test Twarze) oraz na ograniczający zasoby poznawcze wpływ negatywnego nastroju. Moje pytanie jest takie: jak można pogodzić tę interpretację z faktem (por. wyniki analiz na s. 82), że osoby z grupy klinicznej uzyskiwały tym lepsze wyniki w teście RMET, w im bardziej negatywnym były nastroju? Oprócz interpretacji uzyskanych wyników w rozdziale 4 wskazane zostały ograniczenia badania własnego oraz implikacje praktyczne dla terapii psychologicznej zaburzeń nastroju. Są to ważne kwestie i dobrze, że Doktorantka je zauważa, ale ze względu na fakt, że praca nie ma charakteru czysto aplikacyjnego byłbym ciekaw, jako czytelnik pracy, czy jej Autorka dostrzega również implikacje teoretyczne wyników swoich badań. Np., czy rzucają one światło na problem natury upośledzeń w procesach mentalizacji u osób z zaburzeniami nastroju? Konkluzja Pomimo pewnych niedociągnięć części teoretycznej i empirycznej pracy, które wskazałem w mojej recenzji, przedstawiony projekt badawczy, oparty na badaniu eksperymentalnym, a nie tylko korelacyjnym, należy ocenić jako interesującą próbę rozwiązania ważnego problemu badawczego, której nie można odmówić oryginalności i wartości poznawczej. To skłania mnie do konkluzji, iż przedłożona do recenzji rozprawa doktorska mgr Anny Cwojdzińskiej spełnia wymogi określone w ustawie z dnia 14 marca 2003 roku o stopniach i tytule naukowym. W związku z powyższym wnoszę o przyjęcie recenzowanej rozprawy przez Radę Wydziału Psychologii Uniwersytetu SWPS w Warszawie oraz dopuszczenie Doktorantki do publicznej obrony. / dr hab. Adam Putko, prof. UAM / Poznań, 30 grudnia 2018 r.