STRATEGIE PRZESZUKIWANIA POLA WZROKOWEG O PODCZAS WYKONYWANIA ZADAŃ RO TACJI UMYSŁOWEJ*

Podobne dokumenty
WPŁYW ZŁOŻONOŚCI OBIEKTU I WIELKOŚCI KĄTA ROTACJI NA RUCHY OCZU PODCZAS WYKONYWANIA ROTACJI UMYSŁOWEJ

Historia okulografii. Historia okulografii. Historia okulografii. Historia okulografii. Historia okulografii. Eyetracking = Okulografia

Automatyczne tworzenie trójwymiarowego planu pomieszczenia z zastosowaniem metod stereowizyjnych

Metody badawcze Marta Więckowska

ANALIZY ILOŚCIOWE I JAKOŚCIOWE DANYCH OKORUCHOWYCH W PSYCHOLOGII POZNAWCZEJ

PERCEPCJA WZROKOWA- ROZWÓJ I ZABURZENIA FUNKCJI WZROKOWYCH.

Wprowadzenie do analizy korelacji i regresji

Złudzenia optyczne. . Złudzenia optyczne dzieli się na cztery kategorie:

Polski Przegląd Medycyny i Psychologii Lotniczej, 2012, 2(18), 63-76

Percepcja, język, myślenie

WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA

Jak obracać trójkąt, by otrzymać bryłę o największej. objętości?

Poznawcze znaczenie dźwięku

Plan. Struktura czynności myślenia (materiał, operacje reguły)

Porównywanie populacji

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Percepcja jako zmysłowy odbiór bodźców Procesy percepcji Percepcja jako proces Definicja percepcji/spostrzegania Odbiór wrażeń Percepcja rejestracja

Percepcja, język, myślenie

Skuteczna prezentacja PowerPoint. Opracowanie: Anna Walkowiak

wprowadzenie do badań eyetrackingowych

Wśród prostokątów o jednakowym obwodzie największe pole. ma kwadrat. Scenariusz zajęć z pytaniem problemowym dla. gimnazjalistów.

Prawdopodobieństwo warunkowe Twierdzenie o prawdopodobieństwie całkowitym

Wystawa MÓZG. Wystawa zaskakuje, bawi i ilustruje najnowsze osiągnięcia neuronauk.

istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy

Wykład 5: Statystyki opisowe (część 2)

Notacja Denavita-Hartenberga

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Narzędzia myślenia Słowa - wyobrażenia - pojęcia Wiesław Gdowicz

Neuronalne korelaty przeżyć estetycznych (Rekonstrukcja eksperymentu)

Metody: rozmowa, obserwacja, opowieść ruchowa, gra

1. TESTY PSYCHOLOGICZNE

Analiza i projektowanie oprogramowania. Analiza i projektowanie oprogramowania 1/32

Reprezentacje poznawcze

KRYTERIA OCENIANIA W CHEMII ZGODNIE Z PSO

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 2. ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ

Liczba zadań a rzetelność testu na przykładzie testów biegłości językowej z języka angielskiego

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

========================= Zapisujemy naszą funkcję kwadratową w postaci kanonicznej: 2

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Trafność czyli określanie obszaru zastosowania testu

NAZYWANIE KSZTAŁTÓW, KSZTAŁTOWANIE NAZW. Bartosz Mozyrko O znaczeniu asemantycznych skojarzeń nazw dla projektowania logo

Szkoła Główna Służby Pożarniczej Zakład Ratownictwa Technicznego i Medycznego. Laboratorium Bezpieczeństwa Ratownictwa.

Ruch jednostajnie przyspieszony wyznaczenie przyspieszenia

WYMAGANIA EDUKACYJNE Z JĘZYKA POLSKIEGO - OCENIANIE BIEŻĄCE, SEMESTRALNE I ROCZNE (2015/2016)

Faza Określania Wymagań

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

r. rok szkolny 2012/2013

Przekształcenia widmowe Transformata Fouriera. Adam Wojciechowski

Maciej Piotr Jankowski

Różne sposoby widzenia świata materiał dla ucznia, wersja z instrukcją

Zadania ze statystyki, cz.6

Metodologia badań psychologicznych

Wstęp do kognitywistyki. Wykład 7: Psychologia poznawcza: nietrwałe reprezentacje mentalne

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Percepcja, język, myślenie

Przemysław Majkut Gimnazjum N analiza efektów kształcenia na podstawie wyników egzaminów zewnętrznych

Wyszukiwanie binarne

Uczenie się pojedynczego neuronu. Jeśli zastosowana zostanie funkcja bipolarna s y: y=-1 gdy z<0 y=1 gdy z>=0. Wówczas: W 1 x 1 + w 2 x 2 + = 0

13. Równania różniczkowe - portrety fazowe

V Konkurs Matematyczny Politechniki Białostockiej

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Pozycja jednostki ICHOT w zakresie konkurencji ogólnopolskiej zdeterminowana jest siłą przyciągania miejsca, w tym przypadku miasta.

Spostrzeganie jako proces kategoryzacji percepcyjnej.

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2017/2018 CZĘŚĆ 2. ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ

Mierzymy długość i szybkość fali dźwiękowej. rezonans w rurze.

Struktura spostrzeżeń.

EGZAMIN ÓSMOKLASISTY od roku szkolnego 2018/2019

Koryna Lewandowska, Barbara Wachowicz dla. What if...?

Algorytm SAT. Marek Zając Zabrania się rozpowszechniania całości lub fragmentów niniejszego tekstu bez podania nazwiska jego autora.

Projekt Własnego Pomysłu Badawczego

Programowanie celowe #1

Niepewność pomiaru. Wynik pomiaru X jest znany z możliwa do określenia niepewnością. jest bledem bezwzględnym pomiaru

Przekształcanie wykresów.

Politechnika Poznańska Wydział Elektryczny. Metoda Elementów Skończonych

Zadania ze statystyki cz.8. Zadanie 1.

Metody doboru próby do badań. Dr Kalina Grzesiuk

Sposób wykorzystywania świadectw wzorcowania do ustalania okresów między wzorcowaniami

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Prezentacja, którą czytacie jest jedynie zbiorem sugestii. Nie zawiera odpowiedzi na pytania wprost. Jeżeli nie wiedzielibyście jak odpowiedzieć na

Hierarchiczna analiza skupień

Scenariusz lekcji opartej na programie Program nauczania informatyki w gimnazjum DKW /99

Wojewódzki Konkurs Przedmiotowy z Matematyki etap szkolny. Przykładowe rozwiązania i propozycja punktacji rozwiązań

Szukanie rozwiązań funkcji uwikłanych (równań nieliniowych)

Metody badań w naukach ekonomicznych

RAPORT ZBIORCZY z diagnozy Matematyka PP

BUCKIACADEMY FISZKI JAK ZDOBYĆ NOWE KOMPETENCJE? (KOD NA PRZEDOSTATNIEJ KARCIE) TEORIA ĆWICZENIA

Spis treści. Definicje prawdopodobieństwa. Częstościowa definicja prawdopodobieństwa. Wnioskowanie_Statystyczne_-_wykład

ODRZUCANIE WYNIKÓW POJEDYNCZYCH POMIARÓW

EGZAMIN W KLASIE TRZECIEJ GIMNAZJUM W ROKU SZKOLNYM 2016/2017 CZĘŚĆ 2. ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

Ocena błędów systematycznych związanych ze strukturą CCD danych astrometrycznych prototypu Pi of the Sky

Analiza procesu odzyskiwania środków z masy upadłości banków

Jak to widzi homo sapiens

Zasady tworzenia prezentacji multimedialnych

Wymagania na poszczególne oceny w klasie II gimnazjum do programu nauczania MATEMATYKA NA CZASIE

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

Transkrypt:

ROZDZIAŁ III Piotr Francuz Katolicki Uniwersytet Lubelski Jana Pawła II STRATEGIE PRZESZUKIWANIA POLA WZROKOWEG O PODCZAS WYKONYWANIA ZADAŃ RO TACJI UMYSŁOWEJ* Podmiotowe i przedmiotowe determinanty ruchu gałek ocznych podczas przeszukiwania pola percepcyjnego Od czasów wynalezienia techniki rejestracji ruchu gałek ocznych, czyli od końca XIX wieku, badacze percepcji wzrokowej stawiają pytanie, dlaczego podczas oglądania sceny wizualnej oczy obserwatora poruszają się w taki, a nie w inny sposób. Czy ruch oczu jest przypadkowy, czy też podlega jakimś twardym regułom? Jeśli nie jest chaotyczny, to w jakim zakresie jest wyznaczony przez cechy lub potrzeby obserwatora, a w jakim przez własności sceny wizualnej? Odpowiedź na pytanie o przypadkowość vs "logikę" trajektorii ruchu gałek ocznych1 została rozstrzygnięta już na początku XX wieku (zob. np. Buswell, 1922; Huey 1908/1968). Na podstawie wyników badań opisanych przez Buswella ( 1935) w jego książce poświęconej analizie ruchów gałek ocznych podczas oglądania różnych scen wizualnych przedstawionych na fotografiach wiadomo na przykład, że istnieje wyraźna zależność między długością sakkad (skokowych ruchów oczu) i czasemfiksacji a znajomością sceny wizualnej. W pierwszej fazie swobodnego oglądania nowej sceny wizualnej sakkady są dłuższe, a czasy fiksacji istotnie krótsze niż na późniejszych etapach. Gdy obraz jest już rozpoznany, wówczas sakkady skracają się, natomiast wydłuża się czas fiksacji w punktach ' Artykuł został opracowany na podstawie wyników badań prowadzonych w ramach grantu Ministerstwa Nauki i Szkolnictwa Wyższego, nr N NI06 064135. Dziękuję Mikołajowi Chumakowi za opracowanie programów komputerowych niezbędnych do przeprowadzenia badań, Pawłowi Augustynowiczowi za opracowanie graficzne materiału bodźcowego i przygotowanie programów komputerowych służących do analizy i prezentacji danych oraz Julicie Długosz za pomoc w przeprowadzeniu eksperymentów. Dziękuję również Magdalenie Szubielskiej i Oldze Grabowskiej za krytyczne przeczytanie i uwagi do pierwszej wersji niniejszego tekstu. 1 Pod pojęciem " trajektoria ruchów gałek ocznych " kryje się zbiór takich parametrów jak: liczba (gęstość) fiksacji w jednostce czasu lub przypadająca na określoną powierzchnię pola percepcyjnego, czasy poszczególnych punktów fiksacji, długości i kierunki sakkad oraz porządek kolejnych punktów fiksacji w odniesieniu do danego pola percepcyjnego. W zależności od programu badawczego wszystkie lub wybrane parametry trajektorii ruchów gałek ocznych są mierzone z uwzględnieniem fazy skanowania pola percepcyjnego.

44 Piotr Francuz znajdujących się w niewielkiej odległości od siebie. Buswell (1935) pokazał również, że podczas swobodnego oglądania obrazów lub zdjęć, na których znajdują się ludzie, obserwatorzy poświęcają im znacznie więcej uwagi, tzn. częściej i dłużej fiksują na nich wzrok niż na innych elementach sceny (np. na obiektach nieożywionych lub tle). Na początku lat 70. XX wiekunoton i Stark (197la; 197lb), za Rebbem (1968), zaproponowali, aby trajektorię ruchów gałek ocznych rozumieć jako drogę skanowania (scanpath) pola wzrokowego. Zgodnie z tą koncepcją zarejestrowany ruch gałek ocznych odzwierciedla subiektywną "logikę" przeszukiwania pola percepcyjnego podporządkowaną określonym potrzebom obserwatora lub cechom obrazu. W swoich badaniach Noton i Stark ustalali charakterystyczne dla różnych sytuacji bodźcowych wzorce ścieżek skanowania. Prawie 30 lat później Brandt i Stark ( 1997) wykazali, że wzorce te mogą być również odzwierciedlane podczas przypominania sobie widzianych uprzednio obiektów (por. także Laeng, Teodorescu, 2002). Od klasycznych badań prowadzonych przez Yarbusa (1967) do współczesnych (zob. np. Nguyen, Isaacovitz, Rubin, 2009) wielokrotnie stwierdzano, że istnieją stałe wzorce przeszukiwania pola percepcyjnego, charakterystyczne dla określonych bodźców, np. twarzy ludzkiej. Jedną z typowych tendencji jest fiksowanie wzroku przede wszystkim na oczach i ustach oraz systematyczne pomijanie innych elementów twarzy. Zasada ta dotyczy jednak głównie sytuacji przyglądania się znanej twarzy, bowiem liczba jej części eksplorowanych podczas pierwszego oglądu jest znacznie bogatsza i obejmuje również nos, uszy, brwi i czoło (Henderson, Williams, Falk, 2005). Yarbus (1967) zademonstrował również, w jaki sposób pytanie stawiane osobom, które oglądają dany obraz, wpływa na formowanie się charakterystycznego wzorca trajektorii ruchu gałek ocznych. Na przykład pytanie o wiek osób znajdujących się w scenie wizualnej koncentruje uwagę odbiorców przede wszystkim na ich twarzach, zaś pytanie o ich status majątkowy - na meblach, obrazach i ubiorach. Również w odniesieniu do złożonych scen wizualnych, np. rzeźb lub przestrzeni wewnątrz budynku (Babcock, Lipps, Pelz, 2002), a także powtarzających się wzorów graficznych i tekstów (np. Andrews, Coppola, 1999) stwierdzano, że ludzie mają tendencję do wykonywania ruchów gałek ocznych o podobnych parametrach przestrzennych i czasowych. Badania nad poszukiwaniem odpowiedzi na pytanie o źródła charakterystycznych wzorców ruchów gałek ocznych nabrały rozmachu począwszy od lat 80. XX wieku, w związku z wynikami badań opublikowanych przez Justa i Carpenter (1980). Badaczy tych interesowała relacja między trajektorią ruchu gałek ocznych a poziomem rozumienia treści tekstu czytanego. Stwierdzili oni ścisłą zależność między głębokością poznawczego przetworzenia czytanego tekstu a długością fiksacji wzroku na jego istotnych wyrazach, zdaniach i akapitach. Wyniki te stały się podstawą sformułowania tzw. hipotezy rozumienia, zgodnie

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 45 z którą proces fizjologiczny (np. ruch gałek ocznych) jest ściśle podporządkowany wyższemu procesowi poznawczemu (np. rozumieniu). Oznacza to, że ruch gałek ocznych jest mocnym wskaźnikiem wyższego procesu poznawczego i - mówiąc metaforycznie- może być traktowany jako " okno umysłu " (mind's eye). Oczywiście hipoteza Justa i Carpenter nie tyle rozwiązała problem relacji między charakterystycznymi cechami ruchów gałek ocznych i przebiegiem wyższych procesów poznawczych, ile zainspirowała nowe badania i dyskusje na ten temat. Przede wszystkim starano się ustalić, jaką rolę w kształtowaniu się określonego wzorca ruchu gałek ocznych pełnią cechy obrazu (np. jego kontrastowość, kolorystyka lub kompozycja), a jaką znaczenie poszczególnych elementów sceny. Jeszcze w 1967 roku Mackworth i Morandi stwierdzili, że podczas pierwszych 2 sekund oglądania sceny wizualnej ludzie zwracają uwagę przede wszystkim na te miejsca w obrazie, które niosą najwięcej informacji. Loftus i Mackworth (1978) wykazali, że badani znacznie częściej zwracają uwagę na elementy nietypowe lub nieprzewidywane w obrazie niż na przewidywane i typowe. Nietypowe elementy obrazu są traktowane jako bardziej znaczące dla sceny wizualnej niż elementy typowe, ponieważ to one nadają specyficzny sens całej scenie. Loftus i Mackworth sugerują, że identyfikacja nietypowych elementów w scenie wizualnej ma związek z selekcyjną funkcją widzenia peryferycznego. Zgodnie z ich interpretacją widzenie peryferyczne pełni funkcję wstępnej identyfikacji i różnicowania typowych i nietypowych fragmentów sceny wizualnej. Na podstawie tej informacji planowany jest ruch gałek ocznych w kierunku tych elementów, które są bardziej znaczące dla sceny. Chociaż większość badaczy ruchów gałek ocznych jest zgodna co do tego, że ważnym czynnikiem wpływającym na specyficzny przebieg ruchu gałek ocznych jest znaczenie elementów obrazu, to jednak są także wyniki badań, w których te zależności nie zostały potwierdzone. Na przykład dane zgromadzone przez De Graefa i współpracowników ( 1990) oraz Hendersona i współpracowników ( 1999) wyraźnie przeczą doniesieniom, zgodnie z którymi badani znacznie częściej fiksują wzrok na miejscach ważnych informacyjnie niż na miejscach nieistotnych. Przeciwnie- stwierdzili oni, że zwłaszcza na wstępnych etapach oglądania sceny wizualnej badani równie często fiksują wzrok w miejscach o dużym znaczeniu dla sceny, jak i w miejscach o niewielkim znaczeniu. Do podobnych wniosków doszedł Hodgson i współpracownicy (2000). Wykazali oni, że podczas rozwiązywania problemów wymagających konstruowania w pamięci operacyjnej czynności przenoszenia krążków w klasycznym zadaniu znanym jako Tower oj London lub Tower oj Hanoi badani często fiksowali wzrok na docelowym układzie krążków oraz wielokrotnie na tych krążkach, których aktualne położenie nie przybliżało ich do rozwiązania problemu. Nie przeszkadzało im to jednak poprawnie wykonać zadanie. Hodgson i jego współpracownicy konkludują, iż kategoria sensow-

46 Piotr Francuz ności (znaczenia) danego elementu w scenie jest znacznie bardziej skomplikowana niż się na pozór wydaje i sama wymaga odrębnych badań. Podsumowując wyniki badań nad czynnikami determinującymi położenie punktów fiksacji oczu na obrazie podczas jego swobodnego oglądania, Hendersan i Hollingworth (1999) sugerują, iż niezgodność przytoczonych wyników badań prawdopodobnie wskazuje na to, że przebieg ruchu gałek ocznych jest, z jednej strony, wypadkowąfizycznych (tzw. lokalnych i globalnych) charakterystyk obrazu, a z drugiej strony- wiedzy obserwatora dotyczącej kategorii, w ramach której lokalizuje on daną scenę wizualną. Fizykalne, a zwłaszcza optyczne charakterystyki obrazu są przetwarzane za pośrednictwem przedpoznawczych procesów percepcyjnych ( bottom-up ), natomiast wiedza i nastawienie obserwatora są przejawem wyższych procesów poznawczych, które odgórnie (top-down) ukierunkowują ruch gałek ocznych, przeszukujących pole percepcyjne. Podobne niespójności w zakresie wyników badań dotyczących wpływu fizycznych cech obrazu i jego semantyki na przebieg ruchu gałek ocznych odnoszą się do czasu fiksacji, zwłaszcza kilku lub kilkunastu pierwszych punktów fiksacji lokowanych w ramach określonego obszaru obrazu. W wielu publikacjach podkreśla się stałą, wprost proporcjonalną zależność między semantyczną informatywnością danego regionu a długością poświęcanego mu czasu (por. np. De Graef, i in., 1990; Friedman, 1979; Henderson, i in., 1999; Loftus, Mackworth, 1978). Nodine, Locher i Krupinski (1991) zaobserwowali także, że długość fiksacji może być uwarunkowana formalną informatywnością danego regionu. Stwierdzili oni, że doświadczeni artyści z większą uwagą przyglądają się kompozycji obrazu (tzn. dłużej fiksują wzrok na relacjach między różnymi regionami obrazu) niż nowi CJusze. Jednocześnie na przykład Molnar (1981) wykazał, że zależność między ważnością określonego regionu a czasem fiksacji wzroku na nim jest zapośredniczona rodzajem zadania, które ma do wykonania obserwator. Porównywał on czas fiksacji gałek ocznych osób, których zadaniem było dokonanie oceny estetycznej obrazów malarskich, oraz osób, których zadaniem było jak najdokładniejsze zapamiętanie szczegółów tych obrazów. Okazało się, że gdy badani dokonywali oceny estetycznej obrazu, wówczas znacznie dłużej fiksowali wzrok na różnych jego częściach, niż wtedy gdy usiłowali zapamiętać jak najwięcej jego szczegółów. Molnar (1997), opierając się na założeniach sformułowanych przez Julesza i Schumera (1981) oraz Marra (1982), stwierdził, że podczas dokonywania oceny estetycznej obrazu dłuższy czas fiksacji wzroku na różnych jego częściach wyraźnie wiąże się z określonymi ich cechami fizycznymi, np. zmianami jasności. Na podstawie analizy obrazu Eduarda Maneta Olimpia dostrzegł on jednak zaskakującą prawidłowość. Stwierdził, że istnieje pewien charakterystyczny

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 4 7 związek między semantycznie znaczącymi a optycznie silniej podkreślonymi miejscami tego dzieła. Być może, jak sugeruje, między formą wyróżnienia przez artystę niektórych elementów obrazu za pomocą koloru, jasności lub kontrastu a znaczeniem tych elementów dla całej sceny wizualnej zachodzi jakaś szczególna korelacja. Zdaniem Molnara, różne fizykalne cechy sceny wizualnej dostrzegane na przedpoznawczym etapie percepcji wzrokowej stanowią fundament kompozycji sceny wizualnej, która podlega ocenie estetycznej. W ramach dyskusji na temat czynników wpływających na długość czasu fiksacji wzroku zwraca się również uwagę na płeć obserwatorów. Miyahira i współpracownicy (2000a) stwierdzili, że średni czas fiksacji wzroku u kobiet jest istotnie dłuższy niż u mężczyzn i w rezultacie liczba punktów fiksacji oraz długość trajektorii ruchu gałki ocznej w stałej jednostce czasu w grupie kobiet jest niższa niż w grupie mężczyzn. Różnice te dotyczą jednak raczej osób starszych niż młodzieży i osób dorosłych (por. Miyahira i in., 2000b ). Podsumowując przegląd badań nad czynnikami wpływającymi na przebieg trajektorii ruchu gałek ocznych, można stwierdzić, że wiadomo już nieco na temat roli czynników wizualnych (opisywanych za pomocą fizycznych cech obrazu) oraz semantycznych (dotyczących znaczenia całej sceny lub jej fragmentów), a także zmiennych osobowych, takich jak płeć, wiek czy kompetencje obserwatorów. Hendersan i Hollingworth (1999) sugerują natomiast, że niezwykle istotnym, a zarazem bardzo rzadko uwzględnianym w dotychczasowych badaniach czynnikiem modyfikującym przebieg ruchu gałek ocznych jest rodzaj zadania. Ukierunkowuje ono ruch gałek ocznych zgodnie z instrukcją definiującą określony cel poznawczy, ze względu na który dana scena wizualna jest oglądana. Z tego punktu widzenia na uwagę zasługują tylko nieliczne prace, m.in. Ballarda (1991), Hodgsona i współpracowników (2000), Landa i Fumeaux (1997), Molnara (1981), Raynera (1978) i Yarbusa (1967). Warto również w tym miejscu dodać, że w długiej historii badań okułograficznych tylko kilkakrotnie prowadzono je w paradygmacie rotacji umysłowych (zob. np. Carpenter, Just, 1978; De'Sperati, 2003; De'Sperati, Santandrea, 2005; Irwin, Brockmole, 2000; Just, Carpenter, 1976; 1985; Nakatani, Pollatsek, 2004). Gdyby zgodnie z sugestią Hendersona i Hollingwortha (1999) przyjąć jako kluczową rolę zadania w formowaniu się wzorca trajektorii ruchu gałek ocznych, wówczas zupełnie innych strategii należałoby oczekiwać w sytuacji swobodnego przeszukiwania pola wizualnego, przeszukiwania pola percepcyjnego ze względu na jakąś wskazówkę, np. zawartą w pytaniu lub też ze względu na sugerowaną w instrukcji zadania oczekiwaną aktywność obserwatora po obejrzeniu danej sceny. Jeżeli bowiem przyjmujemy poznawczo-sensmyczną jedność systemu percepcyjnego, wówczas aktywność neurologiczna, np. narządu wzroku, musi być ściśle związana z celami tej aktywności jako odpowiedź na fundamentalne pytania

48 Piotr Francuz o charakterze epistemologicznym stawiane sobie przez obserwatora: po co lub dlaczego oglądam to, co właśnie oglądam i co mam zrobić z danymi wizualnymi, kiedy już je sobie przyswoję. Przeszukiwanie pola percepcyjnego w zadaniu rotacji umysłowych Badania nad rotacjami umysłowymi zostały zapoczątkowane w latach 70. XX wieku przez Rogera Sheparda i jego współpracowników (zob. np. Cooper, Shepard, 1973b; Robins, Shepard, 1977; Shepard, Judd, 1976; Shepard, Metzler, 1971). Przeciwstawiając się wciąż jeszcze pokutującej wówczas w psychologii tezie o zasadniczej niemożliwości prowadzenia badań naukowych nad procesami zachodzącymi w " czarnej skrzynce ", Shepard opracował oryginalną metodę badania wyobrażeń wizualnych. Metoda ta pozwala na rejestrację przebiegu procesu ratowania w pamięci figur lub obiektów przestrzennych z dokładnością nieodbiegającą od poziomu precyzji oferowanej przez uznane techniki rejestracji wskaźników behawioralnych lub psychofizycznych. Istota tej techniki, znanej jako metoda Sheparda-Metzler, zasadza się na założeniu, że proces wyobrażeniowy, a w szczególności rotacja umysłowa, przebiega na wizualnych danych sensorycznych zmagazynowanych w pamięci operacyjnej wtedy, gdy brane pod uwagę figury lub obiekty nie są już rejestrowane przez narząd wzroku lub też są rejestrowane, ale w innym położeniu niż podczas ich zapamiętywania. Innymi słowy, zakłada się, że proces widzenia i proces wyobrażeniowy mogą przebiegać równocześnie, ale nie rozstrzyga się, czy i/lub w jakim zakresie owa równoczesność jest źródłem ewentualnej interferencji tych dwóch procesów. Technika Sheparda-Metzler składa się z dwóch następujących po sobie faz. W pierwszej fazie osoba badana ogląda jakąś figurę lub obiekt, najczęściej przedstawiony na monitorze komputerowym, w formie rysunku, zdjęcia lub grafiki 3D. W zależności od specyficznych warunków eksperymentu osoba badana może przyglądać się temu przedmiotowi tak długo, jak chce lub w czasie jego ekspozycji ograniczonym do kilku sekund. Zarówno przed, jak i po ekspozycji przedmiotu, przez kilka sekund pokazuje się osobie badanej szarą maskę, najczęściej z zaznaczonym w środku krzyżykiem, na którym ma ona fiksować wzrok. W drugiej fazie ponownie eksponowany jest ten sam co poprzednio przedmiot, ale teraz znajduje się on w innym położeniu- jest zrotowany o określony kąt wokół jednej lub więcej niż jednej osi. Każdy obiekt może być nie tylko obrócony, ale również przedstawiony w odbiciu lustrzanym. Przyglądając się nowemu położeniu obiektu, zadaniem osoby badanej jest udzielenie odpowiedzi na pytanie, czy widziany przedmiot jest tylko zrotowany, czy jednocześnie jest zrotowany i znajduje się w lustrzanym odbiciu. W niektórych wariantach tego

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 49 eksperymentu pytanie jest uproszczone do formy: " czy to jest ten sam obiekt, tylko zrotowany, czy też inny? ". Czas prezentacji obiektu w drugiej fazie najczęściej nie jest ograniczony. Podczas drugiej fazy badania rejestruje się zarówno czas, jak i rodzaj podjętej decyzji. Stanowią one wskaźniki procesu wyobrażeniowego. Zakłada się, że udzielenie odpowiedzi na postawione pytania dokonuje się w wyniku przeprowadzenia przez obserwatora umysłowego procesu wyobrażeniowego, który polega na dopasowaniu danych pamięciowych, dotyczących uprzedniego położenia obiektu, do aktualnie dostępnych danych wzrokowych. Ponieważ w drugiej fazie obiekt jest obrócony, więc dopasowanie poprzedniego położenia do aktualnego wymaga również wykonania umysłowego procesu obrócenia reprezentacji tego obiektu. Jeżeli w wyniku tego procesu osoba badana stwierdza, że przetworzony obraz pamięciowy obiektu pasuje do widzianego właśnie obiektu znajdującego się w nowym położeniu, wówczas uznaje, że jest on tylko 21 otowany. Jeśli jednak obraz pamięciowy i percepcyjny nie pasują do siebie, wówczas uznaje, że obiekt jest nie tylko zrotowany, ale również znajduje się w lustrzanym odbiciu. Wyniki licznych badań, w których wykorzystuje się technikę Sheparda Metzler wskazują na to, że wraz ze wzrostem kąta rotacji do 180 w dowolnej płaszczyźnie wzrasta czas i zmniejsza się poprawność odpowiedzi na pytanie o charakter transformacji obiektu w drugim jego położeniu (przegląd badań, zob. np. Shepard, 2001). Zidentyfikowano także zmienne, które w mniejszym lub większym stopniu znoszą te efekty. Shepard i Cooper (1973a) wykazali, że można za pomocą instrukcji modyfikować szybkość wykonania rotacji umysłowej, niezależnie od jej kąta. Bethell-Fox i Shepard (1988), De Lisi i Wolford (2002), Duesbury i O'Neil (1996) oraz Vanlierde i Wanet-Defalque (2005) badali wpływ treningu na wykonanie zadania rotacji umysłowej i stwierdzili, że im częściej jest ono wykonywane w wyobraźni, tym staje się łatwiejsze. Nie bez znaczenia jest także płeć osób badanych: generalnie mężczyźni lepiej radzą sobie z zadaniami wymagającymi rotacji umysłowej niż kobiety (Geary, Gilger, Elliott-Miller, 1992; Jordan, i in., 2002; Levin, 2005; Thomsen, i in., 2000). Pomimo że technika Sheparda-Metzler jest opracowana w celu rejestracji przebiegu procesu wyobrażeniowego, w znacznym stopniu angażuje ona wzrok. Osoba badana dwukrotnie ogląda ten sam przedmiot w dwóch położeniach. Wobec tego powstaje dość oczywiste pytanie, w jaki sposób przygląda się ona temu obiektowi eksponowanemu w obu pozycjach. Mówiąc dokładniej: czy istnieją jakieś specyficzne strategie lub wzorce oglądania obiektów prezentowanych w zadaniu rotacji umysłowej, które torowałyby poprawne wykonanie zadania, bądź takie, które zwiększałyby prawdopodobieństwo pojawienia się błędów oraz wydłużały czas reakcji? Opierając się na wynikach dotychczasowych badań nad strategiami przeszukiwania pola percepcyjnego, należałoby oczekiwać, że podczas pierwszej pre-

50 Piotr Francuz zentacji obiektu badani będą się starali możliwie jak najdokładniej go rozpoznać i zapamiętać. W zapisie trajektorii ruchu gałek ocznych powinno to ujawnić się w postaci zwiększonej gęstości krótkotrwałych fiksacji w tzw. obszarach najbardziej informatywnych. Jeżeli oglądanymi figurami są na przykład schematyczne rysunki przedmiotów rzeczywistych, wówczas można przypuszczać, że kontury tych rysunków lub kontury ich części składowych powinny w największym stopniu przyciągnąć wzrok obserwatora. Oprócz zapamiętania szczegółów badani najprawdopodobniej powinni również zapamiętać relacje przestrzenne między nimi. Podobne oczekiwania można sformułować w odniesieniu do drugiej fazy eksperymentu. Jeżeli badany ma udzielić odpowiedzi na pytanie o położenie aktualnie widzianego przedmiotu w stosunku do jego poprzedniego położenia, to powinien skoncentrować wzrok na zapamiętanych wcześniej fragmentach danego przedmiotu oraz na przestrzennych relacjach między nimi. Odtwarzając w pamięci te elementy, będzie w stanie udzielić odpowiedzi na pytanie o charakter transformacji obiektu w drugim położeniu. Strategie przeszukiwania pola percepcyjnego w zadaniu rotacji umysłowej - wyniki badań własnych W celu weryfikacji przedstawionych hipotez przeprowadzono badanie, podczas którego rejestrowano ruchy gałek ocznych osób wykonujących zadanie Sheparda-Metzler. W badaniu wzięło udział 14 studentów - siedem kobiet i siedmiu mężczyzn. Ich zadaniem było udzielenie odpowiedzi na pytanie, czy widziany w drugim położeniu obiekt jest tylko zrotowany, czy zarazem zrotowany i w lustrzanym odbiciu. W badaniu wykorzystano trzy schematyczne rysunki fotela, ryby i ciężarówki (zob. ryc. 1). Obiekty prezentowano na 23" monitorze komputerowym z rozdzielczością 1200 x 1920 pikseli z odległości ok. 70 cm od oczu osoby badanej. Ryc. l. Schematyczne rysunki fotela, ryby i ciężarówki w położeniu niezrolowanym

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 51 Każda osoba badana oglądała przez 3 sekundy jeden z obiektów przedstawionych na ryc. l w położeniu niezrotowanym, a następnie w położeniu zrotowanym o jeden z kątów: 60, 120, 180, 240 lub 300 stopni, zgodnie z kierunkiem wskazówek zegara. Podczas ekspozycji obiektów zrotowanych połowa z nich była nie tylko obrócona o określony kąt, ale jednocześnie znajdowała się w zwierciadlanym odbiciu. Tak więc każda osoba badana oglądała 30 losowo eksponowanych par obiektów w dwóch położeniach (3 obiekty x lo ich prezentacji, z czego 5 było tylko zrotowanych i 5 - zrotowanych i w zwierciadlanym odbiciu). Po obejrzeniu obiektów w każdej parze badani podejmowali decyzję dotyczącą położenia danego obiektu podczas drugiej jego ekspozycji. Mierzono czas i rodzaj podjętej decyzji. Pomiar ruchów gałek ocznych był prowadzony podczas całego badania za pomocą eyetrackera SMI iview X Hi-Speed 1250. Analizę danych okułograficznych przeprowadzono oddzielnie dla wszystkich osób badanych razem oraz dla poszczególnych osób indywidualnie. Celem pierwszej analizy grupowej była identyfikacja poziomu zainteresowania różnymi częściami oglądanych obiektów zarówno podczas ich ekspozycji w położeniu niezrotowanym, jak i zrotowanym. Każdy obiekt został podzielany na 25 kwadratów o boku równym średnicy pola projektowanego przez dołek centralny obserwatora, czyli ok. 7,3 cm. Następnie dla każdego kwadratu obliczono wskaźnik gęstości fiksacji równy sumie punktów fiksacji zlokalizowanych w danym rejonie przez wszystkie osoby badane. Wszystkie wskaźniki gęstości fiksacji obliczono dla obiektów znajdujących się w takim położeniu, w jakim były one eksponowane w pierwszej lub w drugiej fazie eksperymentu. W celu prezentacji i porównania wyników dotyczących obiektów niezrotowanych i zrotowanych dane dotyczące obiektów zrotowanych przekształcono do położenia niezrotowanego (zob. ryc. 2). Jak widać na ryc. 2, zagęszczenie punktów fiksacji nie jest równomierne na powierzchni całych obiektów. Przeciwnie - osoby badane były zainteresowane wybranym fragmentem obiektu zarówno podczas oglądania go w położeniu niezrotowanym, jak i zrotowanym. Charakterystyczne jest również to, że w odniesieniu do określonych obiektów były to niemal dokładnie te same obszary. Można oczywiście dyskutować, czy były to regiony o najwyższej informatywności dla identyfikacji obiektu, ale z całą pewnością w większości przypadków były wystarczające do poprawnego rozwiązania zadania rotacji umysłowej. Zrozumiałe, że sumaryczny czas fiksacji wzroku w regionach o większej ich gęstości był znacznie dłuższy niż w regionach o mniejszej gęstości punktów fiksacji. Oprócz analizy gęstości i sumarycznego czasu fiksacji wzroku w różnych regionach obrazu sprawdzono również, czy średni czas fiksacji wzroku w regionach o większej gęstości fiksacji i w regionach o mniejszej gęstości był podobny, czy różny (zob. ryc. 3).

52 Piotr Francuz Ryc. 2. Obszary zainteresowania obiektami niezrolowanymi (wiersz górny) i zrolowanymi (wiersz dolny) w zadaniu Sheparda-Metzler. Nasycenie czerniąjest wprost proporcjonalne do gęstości punktów fiksacji w danym regionie matrycy 5 x 5 Ryc. 3. Średnie czasy fiksacji wzroku na obszarach zainteresowania obiektami niezrolowanymi (wiersz górny) i zrotowanymi (wiersz dolny) w zadaniu Sheparda-Metzler. Nasycenie czernią jest wprost proporcjonalne do średniej długości fiksacji w danym regionie matrycy 5 x 5

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 53 Okazało się, że średni czas fiksacji w regionach o większej gęstości punktów był wyraźnie dłuższy niż w regionach o mniejszej gęstości. Wszystkie korelacje między gęstością punktów fiksacji a średnim czasem fiksacji w konkretnych regionach obrazu były wyższe niż 0,98. Oznacza to, że badani nie tylko częściej spoglądali na niektóre fragmenty prezentowanych obiektów, ale na oglądanie ich poświęcali średnio więcej czasu niż na obserwację tych regionów, do których zaglądali rzadziej. Podsumowując, czas pojedynczych fiksacji wzroku w obszarach o większej gęstości był dłuższy niż w obszarach o mniejszej gęstości. Analiza zapisów ruchów gałek ocznych poszczególnych osób badanych także ujawniła kilka interesujących prawidłowości. Niemal wszystkie osoby badane oglądały prezentowane im obiekty w charakterystyczny sposób. Na ogół nie fiksowały one wzroku ani na konturach całych przedmiotów, ani na konturach ich części. Rycina 4 zawiera przykładowe, a zarazem charakterystyczne dla większości osób badanych zapisy ruchów gałek ocznych podczas oglądania niezrotowanych obiektów (zob. ryc. 4). Ryc. 4. Zapisy ruchów gałek ocznych podczas oglądania niezrotowanych obiektów. Cyfry oznaczają kolejne punktyfiksacji Niezależnie od obiektu badani wykonywali bardzo podobny ruch oczami wzdłuż jednej linii. W przypadku ryby i ciężarówki był to ruch wzdłuż obiektu, natomiast patrząc na fotel, wiele osób nawet nie fiksowało wzroku na nim, tylko analizowało obszar wokół niego. Na podstawie niemal wszystkich zapisów ruchów gałek ocznych osób badanych oglądających obiekty w pozycji niezrotowanej w zadaniu Sheparda-Metzler można wyznaczyć charakterystyczną linię, która jednoznacznie wyznaczała kierunek skanowania (zob. ryc. 5). Drugą charakterystyczną cechą strategii oglądania niezrotowanych obiektów w zadaniu rotacji umysłowej był ograniczony obszar objęty skanowaniem. Najczęściej osoby badane nie oglądały całego obiektu, ale raczej koncentrowały wzrok na jakimś wybranym jego fragmencie (zob. ryc. 6).

54 Piotr Francuz KIERUNEK SKANOWANIA Ryc. 5. Linia wyznaczająca kierunek skanowania obiektu OBSZAR SKANOWANIA Ryc. 6. Obszar skanowania określony przez powierzchnię okręgów oznaczających pola projekcji dołka centralnego w kolejnych punktach fiksacji Obie przedstawione cechy strategii przeszukiwania pola percepcyjnego w zadaniu Sheparda-Metzler, czyli kierunkowość i ograniczony zakres skanowania, w odniesieniu do obiektów prezentowanych w położeniu niezrotowanym charakteryzowały również proces oglądania obiektów zrotowanych (zob. ryc. 7). Fotel zrotowany o 60 Ryba w lustrzanym odbiciu zrotowana o 300 Ciężarówka zrotowana o 300 Ryc. 7. Zapisy ruchów gałek ocznych podczas oglądania zrotowanych obiektów przedstawionych na ryc. 4

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadai1 rotacji umysłowej 55 Podobnie jak podczas oglądania obiektów niezrotowanych badani ustalali pewien kierunek skanowania, a następnie wzdłuż tej linii wykonywali kilka lub kilkanaście powtarzających się ruchów gałek ocznych. Po dopasowaniu obiektu zrotowanego do niezrotowanego i nałożeniu na siebie trajektorii ruchów gałek ocznych podczas oglądania tego samego obiektu w dwóch różnych położeniach okazuje się, że leżą one niemal dokładanie wzdłuż tej samej linii. Podczas oglądania obiektu zrotowanego najczęściej obejmują one jednak nieco mniejszy obszar niż podczas oglądania obiektu w położeniu niezrotowanym (zob. ryc. 8). Ryc. 8. Nałożone na siebie zapisy ruchów gałek ocznych podczas oglądania obiektów przedstawionych na ryc. 4 i 7. Szara linia oznacza zapis ruchu gałek ocznych podczas oglądania obiektu niezrotowanego, a biała- zapis ruchu gałek ocznych podczas oglądania obiektu zrotowanego W zdecydowanej większości przypadków zaprezentowana strategia oglądania obiektów w obu położeniach owocowała udzieleniem poprawnej odpowiedzi na pytanie, czy obiekt eksponowany jako drugi jest tylko zrotowany, czy też jest jednocześnie zrotowany i w zwierciadlanym odbiciu. Osoby badane różniły się ze względu na zakres obszaru skanowania, wyznaczony długością sakkad i liczbą punktów fiksacji. Na podstawie zgromadzonych danych można zidentyfikować trzy zasadnicze typy strategii: rozproszoną (długie sakkady i wiele punktów fiksacji), zrównoważoną (średniodługie sakkady i na ogół nie więcej niż l O punktów fiksacji), oszczędną (krótkie sakkady i niewiele punktów fiksacji). Analiza danych wskazuje na to, że rodzaj strategii przeszukiwania pola percepcyjnego można traktować jako względnie stałą cechę osób badanych. Czasem badani rezygnowali z charakterystycznej dla siebie strategii, co najczęściej powodowało błędy w ocenie położenia drugiego obiektu. Zapisy trajektorii ruchów gałek ocznych przedstawione na rysunkach 4-8 reprezentują strategię zrównoważoną. Charakteryzowała ona ok. 50% badanych. Około 114 osób badanych stosowała strategię oszczędną. Zarówno zakres ruchów gałek ocznych, której wskaźnikiem jest długość sakkad, jak i liczba punktów fiksacji są niewielkie (zob. ryc. 9). Interesujące, że osoby, które stosują

56 Piotr Francuz tę metodę oglądania obiektów, znacznie rzadziej podają błędne odpowiedzi na pytanie o położenie obiektu podczas drugiej ekspozycji niż badani stosujący strategię zrównoważoną. Ciężarówka w położeniu niezrotowanym Ciężarówka zrotowana 120 Nałożone na siebie zapisy obu trajektorii ruchów gałek ocznych Ryc. 9. Zapisy ruchów gałek ocznych podczas oglądania obiektów w zadaniu Sheparda-Metzler, charakterystyczne dla strategii oszczędnej Przeciwieństwem strategii oszczędnej jest strategia rozproszona. Była ona stosowana przez pozostałe 25% osób badanych, które nierzadko z takim rozmachem oglądały prezentowane im obiekty, że część fiksacji ich wzroku znajdowała się poza zakresem rejestrowanym przez eyetracker (zob. ryc. l 0). Ryba w położeniu niezrotowanym Ryba zrotowana 180 Nałożone na siebie zapisy obu trajektorii ruchów gałek ocznych Ryc. 10. Zapisy ruchów gałek ocznych podczas oglądania obiektów w zadaniu Sheparda-Metzler, charakterystyczne dla strategii rozproszonej

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 57 Badani, którzy stosowali strategię rozproszoną, podobnie do tych, którzy stosowali strategię oszczędną, na ogół popełniali nieco mniej błędów niż badani stosujący strategię zrównoważoną. Niezależnie jednak od przyjętej strategii skanowania pola percepcyjnego czynnikiem, który minimalizował liczbę błędów podczas wykonywania zadania rotacji umysłowej, była zgodność kierunku skanowania obiektów podczas oglądania ich w położeniu niezrotowanym i zrotowanym. Innymi słowy, niepoprawna odpowiedź na pytanie o położenie obiektu w czasie drugiej ekspozycji była konsekwencją zmiany kierunku ruchu gałek ocznych podczas jego oglądania w stosunku do kierunku wyznaczonego w momencie skanowania obiektu w położeniu niezrotowanym (zob. ryc. 11). Była to jedna z najczęstszych przyczyn trudności w ocenie położenia drugiego obiektu. Ryba w położeniu niezrolowanym Ryba zrolowana 120 Nałożone na siebie zapisy obu trajektorii ruchów gałek ocznych Ryc. 11. Zapisy ruchów gałek ocznych podczas oglądania obiektów w zadaniu Sheparda-Metzler, charakterystyczne dla błędu zmiany kierunku linii skanowania Oprócz błędu zmiany kierunku skanowania obiektu podczas jego ekspozycji w położeniu zrotowanym zidentyfikowano również drugi rodzaj błędu, który polegał na skanowaniu nieco innych fragmentów obiektu podczas jego pierwszej i drugiej ekspozycji (zob. ryc. 12). Warto również zauważyć, że w odniesieniu do obu rodzajów błędów powtarza się pewna prawidłowość dotycząca kierunku skanowania i położenia trajektorii ruchów gałek ocznych nie tyle w stosunku do samego obiektu, ile w stosunku do całego pola percepcyjnego, wyznaczonego przez powierzchnię monitora komputerowego, na którym eksponowano bodźce. Zarówno kierunek, jak i położenie trajektorii ruchów gałek ocznych na planie całego pola percepcyjnego podczas oglądania obiektu w położeniu niezrotowanym i zrotowanym w odniesieniu do obu rodzajów błędów są podobne (zob. ryc. 11 i 12). Wygląda to trochę tak, jakby podczas oglądania obiektu w położeniu zrotowanym osoby badane " włączyły "

58 Piotr Francuz Fotel w położeniu niezrotowanym Fotel zrotowany 180 ałożone na siebie zapisy obu trajektorii ruchów gałek ocznych Ryc. 12. Zapisy ruchów gałek ocznych podczas oglądania obiektów w zadaniu Sheparda-Metzler, charakterystyczne dla błędu skanowania różnych regionów eksponowanego obiektu taki sam program skanowania, jaki uruchomiły podczas oglądania tego obiektu w położeniu niezrotowanym. Być może, jest to wskazówka, że mamy do czynienia z jednym mechanizmem, który prowadzi do generowania błędnych odpowiedzi w zadaniu rotacji umysłowej, a nie z dwoma różnymi. Podsumowanie i dyskusja Podsumowując przegląd badań nad strategiami oglądania obiektów i scen wizualnych, można zauważyć, że zasadniczo wysiłek badaczy zmierza w kierunku poszukiwania odpowiedzi na pytanie o związek między daną trajektorią ruchów gałek ocznych a poziomem wykonania określonego zadania percepcyjnego. Do najczęściej wykonywanych przez osoby badane zadań percepcyjnych należy swobodne lub ukierunkowane pytaniami skanowanie dwu- lub trójwymiarowych scen wizualnych oraz czytanie. W badaniach nad oglądaniem scen wizualnych zasadniczym problemem jest pytanie, w jakim zakresie określona trajektoria ruchów gałek ocznych jest wyznaczona przez procesy oddolne (bottom-up), które są zdeterminowane przez optyczne własności oglądanej sceny, a w jakim przez procesy odgórne (top-down), ukierunkowujące ruch gałek ocznych w efekcie zajścia złożonych procesów umysłowych, takich jak np. interpretacja, wnioskowanie, rozumowanie lub testowanie hipotez. Z kolei w badaniach nad czytaniem dominuje pytanie o związek trajektorii ruchów gałek ocznych z rozumieniem czytanego tekstu. Jak zauważają Hendersan i Hollingworth (1999), bardzo rzadko analizowanym w dotychczasowych badaniach czynnikiem, który może mieć decydujący wpływ na charakterystykę trajektorii ruchu gałek ocznych, jest instrukcja zadania percepcyjnego. Znamienne, że tylko w nielicznych badaniach analizowano ruchy

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 59 gałek ocznych rejestrowane podczas wykonywania przez osoby badane specyficznych zadań, takich jak np. rozwiązywanie problemów lub rotacje mentalne. Wyniki badań własnych przedstawione w niniejszym artykule ujawniają interesujące zależności między wykonaniem zadania rotacji umysłowej, zgodnie z paradygmatem Sheparda-Metzler, a zarejestrowaną trajektorią ruchów gałek ocznych podczas oglądania przez osoby badane obiektów w dwóch położeniach: niezrotowanym i zrotowanym. W rezultacie analizy danych zidentyfikowano kilka strategii oglądania obiektów percepcyjnych w zadaniu rotacji umysłowej. Niektóre z nich torują, a inne utrudniają udzielenie poprawnej odpowiedzi na pytanie o położenie danego obiektu podczas drugiej ekspozycji w porównaniu z jego położeniem podczas pierwszej prezentacji. Strategie, które wysoko korelowały z poprawnością wykonania zadania rotacji umysłowej, można opisać za pomocą dwóch cech: podobieństwa liniowości (kierunkowości) oraz zgodności zakresu skanowania podczas oglądania tego samego obiektu w dwóch różnych położeniach. Strategie te zidentyfikowano w trzech wariantach: rozproszonym, zrównoważonym i oszczędnym, różniących się długością sakkad i liczbą fiksacji. Z kolei strategie utrudniające wykonanie zadania rotacji umysłowej charakteryzowały się tym, że łamały albo zasadę podobieństwa liniowości, albo zasadę zgodności zakresu skanowania podczas oglądania tego samego obiektu w dwóch różnych położeniach. Szczególnie interesującym problemem, który wyłonił się w trakcie analizy omawianych wyników badań, jest pytanie o powody dość nieoczekiwanego przebiegu trajektorii ruchów gałek ocznych podczas wykonywania zadania Sheparda-Metzler. Dlaczego większość osób badanych fiksowała wzrok na dość przypadkowych - wydawać by się mogło - elementach obrazu położonych wzdłuż jednej linii, zamiast na podkreślonych konturem różnych szczegółach oglądanych obiektów? W jakim sensie zawartość skanowanych fragmentów obrazu była na tyle informatywna, że pozwalała na prawidłową ocenę położenia zrotowanego obiektu podczas drugiej jego ekspozycji? Zaprezentowane wyniki badań nie dają jednoznacznej odpowiedzi na te pytania. Warto jednak rozważyć dwie hipotetyczne interpretacje tego zjawiska. Przede wszystkim należy zwrócić uwagę na to, że zadanie rotacji umysłowej ma bardzo precyzyjnie sformułowaną instrukcję. Zadaniem osób badanych jest udzielenie odpowiedzi na pytanie, czy podczas drugiej prezentacji widziany wcześniej obiekt jest tylko zrotowany czy też zarazem zrotowany i w zwierciadlanym odbiciu. Tak ujęte zadanie zwalnia osobę badaną z wykonywania złożonych operacji umysłowych, jak np. rozpoznawania obiektu, dokonania jego oceny estetycznej lub rozumienia sensu sceny wizualnej. Wyniki badań nad rotacjami obiektów semantycznych i asemantycznych (Francuz, Oleś, Chumak, 2007) oraz obiektami różniącymi się poziomem złożoności (Bethell-Fox, Shepard, 1988; Cooper, 1975; Cooper, Podgomy, 1976) wskazują na to, że obydwa te czynniki mają

60 Piotr Francuz niewielki wpływ na poziom poprawności wykonania zadania rotacji umysłowej. Wiele zatem wskazuje na to, że aby poprawnie rozwiązać zadanie Sheparda-Metzler należy raczej badać wizualne własności fizyczne ratowanych obiektów, niż zajmować się ich semantyczną interpretacją. W tym kontekście uzasadnione staje się zatem pytanie: co rejestruje mózg osoby badanej, kiedy wzrok przesuwa się z jednego miejsca w inne? Na rycinie 13 schematycznie przedstawiono zawartości fragmentów pola percepcyjnego, uzyskane od jednej z osób badanych w trybie widzenia centralnego (joveal visżon) i peryferycznego, które wyłoniły się przed nią podczas oglądania niezrotowanego (a) i zrotowanego (b) obiektu. OBSZAR ZAREJESTROWANY PERYfERYJNIE OBSZAR ZAREJESTROWANY CENTRALNIE Ryc. 13. Centralna i peryferyczna zawartość pola percepcyjnego, określonego przez sumaryczną powierzchnię okręgów oznaczających pola projekcji dołka centralnego w kolejnych punktach fiksacji podczas skanowania obiektu niezrotowanego (A) i zrotowanego (B) Pierwsza interpretacja opiera się na zawartości wizualnej obszaru zarejestrowanego centralnie podczas oglądania obiektu w pozycji niezrotowanej i zrotowanej. W obu jego położeniach szczególną uwagę zwraca jasna linia złamana pod kątem prostym, która oddziela szoferkę i burtę skrzyni nadwozia od plandeki. Odcinki jasnej linii od miejsca złamania do krawędzi pola widzenia centralnego mają różną długość. Bardzo podobny obraz zawartości pola zarejestrowanego centralnie zidentyfikowano u wielu osób badanych, które poprawnie odpowiedziały na pytanie zawarte w instrukcji zadania wyobrażeniowego. W jakim jednak sensie taka informacja wizualna jest wystarczająca do poprawnego rozwiązania zadania Sheparda-Metzler?

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 61 Żeby odpowiedzieć na to pytanie, warto najpierw ustalić minimalne warunki, jakie musi spełniać widziany obiekt, aby osoba badana w ogóle miała możliwość udzielenia poprawnej odpowiedzi na pytanie o jego położenie podczas drugiej ekspozycji. Jeżeli na przykład obiekt jest symetryczny, to w lustrzanym odbiciu wygląda dokładnie tak samo jak oryginał. W takiej sytuacji badany nie ma wystarczających przesłanek do rozstrzygnięcia, czy dany obiekt jest tylko zrotowany, czy zrotowany i w zwierciadlanym odbiciu. Oznacza to, że jednym z najważniejszych warunków rozwiązania zadania rotacji umysłowej jest niesymetryczność obiektu. Poszukując najprostszego z możliwych niesymetrycznego obiektu, okazuje się, że jest nim trójkąt nierównoboczny, wyznaczony przez trzy punkty znajdujące się w różnej odległości od siebie. Zwierciadlane odbicie takiego obiektu zawsze jest inne niż oryginał. A to znaczy, że niesymetryczność obiektu jest warunkiem koniecznym (choć niewystarczającym) do poprawnego rozwiązania zadania rotacji umysłowej. Wracając do pytania o informacyjną zawartość obszaru zarejestrowanego centralnie w przykładzie przedstawionym na rycinie 13, bez trudu odnajdziemy w nim formę, która przypomina trójkąt nierównoboczny. Być może, to jest właśnie najprostszy model, którego poszukuje mózg/umysł obserwatora podczas rozwiązywania zadania rotacji wyobrażeniowej. Badani, którzy go zidentyfikują, nie mają większych problemów z rotowaniem całych obiektów. Weryfikacja tej hipotezy wymaga jednak dalszych badań. Druga interpretacja specyficznego ruchu gałek ocznych podczas wykonywania zadania rotacji umysłowej odnosi się do zawartości wizualnej obszaru zarejestrowanego peryferyjnie. Henderson i Hollingworth (1999) zwracają uwagę na to, że w procesie percepcji nadal niejasna jest rola widzenia peryferycznego. Na ogół przypisuje się jemu funkcję wstępnej oceny semantycznej tych regionów, które znajdują się poza widzeniem centralnym (zob. np. Rybak i in., 1998, 2005). Z punktu widzenia prezentowanych wyników badań własnych możliwa jest również alternatywna interpretacja. Być może, nie chodzi tu o semantyczną analizę peryferyjnych regionów sceny wizualnej, ale o peryferyjną analizę fizycznych własności oglądanego obiektu, a zwłaszcza jego konturu. Zastanawiający jest bowiem dość mechaniczny ruch gałki ocznej wzdłuż jednej linii. Gdyby przyjąć, że linia ta wyznacza oś podziału obiektu na dwie części, to zauważymy, że kontury tych części zasadniczo różnią się od siebie. Różnice między nimi są wystarczająco duże, żeby zarejestrować je pomimo braku ostrości, charakterystycznej dla widzenia peryferycznego. Jednocześnie ich identyfikacja w zupełności wystarcza do tego, aby poprawnie rozwiązać zadanie rotacji umysłowej. Również i ta interpretacja ma status hipotezy. W świetle przeglądu literatury przedmiotu oraz przedstawionych wyników badań własnych wydaje się, że dalsze badania nad "logiką" ruchów gałek ocznych podczas widzenia koniecznie powinny uwzględniać dwie okoliczności. Po pierw-

62 Piotr Francuz sze, niezbędne jest gromadzenie danych o ruchach gałek ocznych podczas wykonywania przez osoby badane różnych zadań percepcyjnych. Doniesienia z niektórych badań oraz przedstawiona analiza własnych danych jednoznacznie wskazują na to, że strategia skanowania pola percepcyjnego jest w dużym stopniu zależna od instrukcji zadania. Żeby zrozumieć trajektorię ruchu gałki ocznej, koniecznie trzeba wziąć pod uwagę zadanie, jakie stawia się osobie badanej. Po drugie, w analizach zapisów trajektorii ruchów gałek ocznych należałoby zwrócić znacznie większą uwagę na funkcję widzenia peryferycznego oraz na zawartość sceny wizualnej, która jest rejestrowana peryferycznie. Z całą pewnością natura nieprzypadkowo obdarzyła nas dwoma odrębnymi, ale nie niezależnymi systemami widzenia " co? " i " gdzie? ", które czerpią z danych pobieranych zarówno z dołka centralnego, jak i peryferycznych części siatkówki oka. Bibliografia Andrews T. J., Coppola D. M. (1999), ldiosyncratic characteristics of saccadic eye movements when viewing di ferent visual environments, "Vision Research ", 39, 2947-2953. Babcock J. S., Lipps M., Pelz J. B. (2002), How people look at pictures before, during and after scene capture: Buswell revisited, [w:] B. E. Rogowitz, T. N. Pappas (eds.), Human Vislon and Electronic Imaging VII, SPIE Proceedings, vol. 4662, 34-47. Baceino T., Manunta Y. (2005), Eye-.fixation-related-potentials:!nsight in to parafoveal processing, "Joumal of Psychophysiology ", 19,204-215. Ballard D. H. (1991 ), Animate vision, "Artificial Inteligence ", 48, 57-86. Bethell-Fox C. E., Shepard R. N. (1988), Mental rotation: Effects oj stimulus complexity and familiarity, "Joumal of Experimental Psychology: Human Perception and Performance ", 14, 12-23. Brandt S. A., Stark L. W. (1997), Spontaneous eye movements during visual imagery refleci the eontent of the visual scene, "Joumal of Cognitive Neuroscience ", 9, 27-38. Buswell G. T. (1935), How People Look at Pictures, Chicago, IL: University of Chicago Press. Buswell G. T. (1922), Fundamental reading habits: A study oj their development, Chicago, IL: University o f Chicago Press. Caplovitz G. P., Fendrich R., Hughes H.C. (2008), Failures to see: Attentive blank stares revealed by change blindness, "Consciousness and Cognition ", 17, 877-886. Carpenter P. A., Just M. A. (1978), Eye.fixations during mental rotation, [w:] J. W. Senders, D. F. Fisher, R. A. Monty (eds.), Eye movements and the higher psychological functions, Hilldale, NJ: Erlbaum, 115-133. Cooper L. A. (1975), Mental rotation oj random two-dimensional shapes, "Cognitive Psychology ", 7, 20-43. Cooper L. A., Podgomy P. ( 1976), Mental transformations and visu al compartsan processes: Effects oj complexity and similarity, "Joumal of Experimental Psychology: Human Perception and Performance ", 2, 503-514. Cooper L. A., Shepard R. N. (1973a), Chronometrie studies oj t he rotalian oj mental images, [w:] W. G. Chase (ed.), Visual information processing. New York: Academic Press, 75-176. Cooper L.A., Shepard R. N. ( 1973b ), The time required to prepare for a rotated stimulus, "Memory and Cognition ", l, 246-50.

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 63 De Graef P., Christiaens D., d'y d ewaile G. (1990), Perceptual effects oj scene context on object identificalion, "Psychological Research", 52, 317-329. De Lisi R., Walford J. L. (2002), lmproving chi/dren s mental rotalian accuracy with computer game playing, " The Journal o f Genetic Psychology", 163, 272-282. De'Sperati C. (2003), Precise oculomotor corre/ales oj visuospafial mental rotalian and circular motion imagery, "Journal of Cognitive Neuroscience", 15, 1244-1259. De'Sperati C., Santandrea E. (2005), Smooth pursuit-like eye movements during mental extrapolalian of motion: The facilitalory effect oj drowsiness, " Cognitive Brain Research", 25, 328-338. Duesbury R. T., O'Neil H. F. Jr. (1996), Effect oftype af praclice in a computer-aided design environmenl in visualizing three-dimensional objecis fi om two-dimensional orthographic projections, "Journal of Applied Psychology ", 81, 249-260. Findlay J. M., Brown V. (2006a), Eye scanning oj mufti-element displays: J. Scanpath planning, "Vision Research ", 46, 179-195. Findlay J. M., Brown V. (2006b), Eye scanning oj mufti-element displays: II. Saccade planning, " Vision Research", 46, 216-227. Francuz P., Oleś M., Chumak M. (2007), The influence of the semantic context on the speed and correctness oj mental rotation,. [w:] K. A. Fanti (red.), Psychological Science: Research, Theory and Fult/re Directions, Athens: ATINER Press, 37-54. Friedman A. ( 1979), Framing pictures: The role of knowledge in automatized encoding and mem01y for gist, "Journal of Experimental Psychology: General", 108,316-355. Garezea L., Harrisb J. M., Barenghic C. F., T admara Y. (2008), Characterising patterns oj eye movements in natura/ images and visu al scanning, "Joumal o f Modern Optics", 55, 533-555. Geary D. C., Gilger J. W., Elliott-Miller B. (1992), Gender di ferences in three-dimensional mental rotation: A replication, "Journal o f Genetic Psycho1ogy", 153, 115-117. Hebb D. O. (1968), Concerning imagery, "Psychological Review", 75, 466-477. Hendersan J. M., Hollingworth A. ( 1999), High-level scene perception, " Annual Review of Psychology ", 50, 243-271. Hendersan J. M., Weeks P. A., Jr, Hollingworth A. (1999), The effects of semantic consistency on eye movements during scene viewing, "Journal of Experimental Psychology: Human Perception and Performance ", 25, 210-228. Hendersan J. M., Williams C. C., Falk R. J. (2005), Eye movements are functional during face learning, "Memory and Cognition", 33, 98-106. Hodgson T. L., Bajwa A., Owen A. M., Kennard C. (2000), The strategie eontroi oj gaze direction in the Tower oj London Task, "Journal o f Cognitive Neuroscience ", 12, 894-907. Hollingworth A., Schrock G., Hendersan J. M. (2001), Change detection in the flicker paradigm: The role offixation position within the scene, " Memory and Cognition", 29, 296-304. Huey E.B. (190811968), The psychology and pedagogy of reading, Cambridge, MA: MI T Press. lrwin D. E., Brockmole J. R. (2000), Mental rotalian is suppressed during saccadic eye movements, Psychonomic Bulletin & Review", 7, 654-661. " Jordan K., Wustenberg T., Heinze H. J., Peters M., Jancke L. (2002), Women and men exhibit dif ferent cortical activation patterns during mental rotalian tasks, " Neuropsychologia", 40, 2397-2408. Julesz B., Schumer R. A. (1981), Early visual perception, "Annual Review of Psychology", 32, 575-627. Jus t M. A., Carpenter P. A. (1980), A theory oj reading: from eye fixations to comprehension, "Psychological Review", 87 329-354. Jus t M. A., Carpenter P. A. (1985), Cognitive coordinate systems: accounts oj mental rotalian and individual difference in spatial ability, " Psychological Review", 92, 137-172.

64 Piotr Francuz Just M., Carpenter P. A. (1976), Eyefixations and cognitive processes, " Cognitive Psychology ", 8, 441-480. Laeng B., Teodorescu D. S. (2002), Eye scanpaths during visual imagery reenact those of perception o f the same visu al scene, " Cognitive Sciences ", 26, 207-231. Levin S. (2005), Common ground for spatial cognition A behavioral andfmri study oj sex di ferences in mental rotalian and spatial working memory, " Evolutionary Psychology ", 3, 227-254. Loftus G. R., Mackwortb N. H. (1978), Cognitive determinants offixation location during picture viewing. " Journal of Experimental Psychology: Human Perception and Performance", 4, 565-572. Mackworth N. H., Morandi A. J. (1967), The gaze selects informative details within pictures, " Perception & Psychophysics ", 2, 547-552. Mannan S. K., Ruddock K. H., Wooding D. S. (1997), Fixation sequences made during visual examination oj brie.fly presented 2D images, " Spatial Vision ", 11, 157-178. Miyahira A., Morita K., Yamaguchi H., Morita Y., Maeda H. (2000a), Gender di ferences and reproducibility in explorat01y eye movements oj normai subjects, " Psychiatry and Clinical Neurosciences ", 54, 31-36. Miyahira A., Morita K., Yamaguchi H., Nonaka K., Maeda H. (2000b ), Gender di ferences oj exp/oratory eye movements: A life span study, " Life Sciences ", 68, 569-577. Molnar F. (1981 ), About t he role oj visual exploration in aesthetics, [w:] H. I. Day ( ed.), Advances in lntrinsic Motivation and Aesthetics, ew York: Plenum Press, 385-413. Molnar F. ( 1997), A science oj vision for visual ar t, " Leonardo ", 30, 225-232. Najemnik J., Geisler W. S. (2005), Optima! eye movement strategies in visual search, " Nature ", 434, 387-391. Nakatani C., Pollatsek A. (2004), A n eye movement ana/ysis oj" mental rotalian" of simple scenes, " Perception & Psychophysics", 66, 1227-1245. Nguyen H.T., lsaacovitz D. M., Rubin P. A. D. (2009), Age- and fatigue-related markers of human faces: an eye-tracking study, " Ophthalmology ", 116, 355-360. Nodine C.F., Locher P.J., Krupinski E.A. (1991), The role oj formai art training on perceplian and aesthetic judgment oj ar t composition, " Leonardo ", 26, 219-227. Noton D., Stark L. W. ( 1971 a), Scanpaths in saccadic eye movements while viewing and recognizing patterns, " Vision Research ", li, 929-942. Noto n D., Stark L. W. ( 1971 b), Scanpaths in eye movements during perception, " Science ", 171, 308-311. Rayner K. ( 1978), Eye movements in reading and information processing, " Psychological Bulletin ", 85, 618-660. Rensink R. (2002), Change detection, " Annual Review of Psychology ", 53, 245-277. Robins C., Shepard R. N. (1977), Spalio-temporai probing oj apparent rotational movement, " Perception & Psychophysics ", 22, 12-18. Rybak I. A., Gusakova V. I., Golavan A. V., Podladchikova L. N., Shevtsova N. A. (2005), Attention-guided recognition based on what and where representations, [w:] L. Itti, G. Rees, J. K. Tsotsos (red.), New obiology oj Attention, New York, NJ: Elsevier/Academic Press, 663-670. Rybak I. A., Gusakova V. I., Gołovan A. V., Podladchikova L. N., Shevtsova. A. (1998), A model oj attention-guided visual perceplian and recognition, " Vision Research ", 38, 2387-2400. Shepard R. (200 l), Perceptual-cognitive universals as re.flections oj t he world, " Behavioral and Brain Sciences ", 24, 581-601. Shepard R. N., Judd S. A. (1976), Perceptual illusion oj rotalian oj three-dimensional objects, " Science", 191, 952-54. Shepard R. N., Metzler J. (1971 ), Mental rotalian oj three-dimensiona/ objects, " Science ", 171, 701-703.

Strategie przeszukiwania pola wzrokowego podczas wykonywania zadań rotacji umysłowej 65 Thomsen T., Hugdahl K., Ersland L., Bamdon R., Lundervold A., Smievol A. I., Roscher B. E., Sundberg H. (2000), Functional magnetic resonance imaging (fmri) study oj sex differences in a mental rotation task, " Medical Science Monitor", 6, 1186-1196. Vanlierde A., Wanet-Defalque M.-C. (2005), The role ojvisual experience in mental imagery, " Journal ofvisual Impairment & Blindness", March l, 165-178. Yagi A., Imanishi S., Konishi H., Akashi Y., Kanaya S. (1998), Brain potentials associated with eye fixations during visu al tasks under different lighting systems, " Ergonomics", 41, 670-677. Yarbus A. ( 1967), Eye movements and vision, New York: Plenum Press.