mgr inż. Agnieszka Stankiewicz dr inż. Tomasz Marciniak prof. dr hab. inż. Adam Dąbrowski Wydział Informatyki Katedra Sterowania i Inżynierii Systemów Pracownia Układów Elektronicznych i Przetwarzania Sygnałów Politechnika Poznańska ul. Piotrowo 3a, 60-965 Poznań dr hab. n. med. Marcin Stopa dr n. med. Piotr Rakowicz lek. med. Elżbieta Marciniak Oddział Kliniczny Okulistyki z Pododdziałem Okulistyki Dziecięcej Szpitala Klinicznego im. H. Święcickiego Uniwersytetu Medycznego w Poznaniu ul. Grunwaldzka 16/18, 60-780 Poznań Katedra Optometrii i Biologii Układu Wzrokowego Uniwersytetu Medycznego w Poznaniu ul. Rokietnicka 5D, 60-806 Poznań Metody poprawy dokładności automatycznej segmentacji obrazów w interfejsach biometrycznych OCT Słowa kluczowe: optyczna tomografia koherentna (OCT), odszumianie i segmentacja obrazów, dyfuzja anizotropowa, progowanie falkowe STRESZCZENIE W artykule przedstawiono analizę skuteczności wybranych metod redukcji szumu w obrazach (tzw. B- skanach) siatkówki oka ludzkiego uzyskiwanych za pomocą optycznej tomografii koherentnej. Jakość procesu odszumiania za pomocą filtracji uśredniającej oraz medianowej, dyfuzji anizotropowej, progowania falkowego, progowania falkowego bloku obrazów oceniano na podstawie poprawności przebiegu procesu automatycznej segmentacji warstw siatkówki, którego precyzja jest istotna w diagnostyce okulistycznej. Badania eksperymentalne odszumiania a następnie segmentacji przeprowadzono dla zestawu skanów 3D o niskim wskaźniku jakości dla 10 osób zdrowych oraz 10 pacjentów z patologiami. Wskazano, które metody są skuteczniejsze dla poszczególnych grup osób badanych. 1. WPROWADZENIE Zastosowanie zaawansowanych interfejsów człowiek-komputer (ang. human machine interface, HMI) w dziedzinach medycznych (np. w okulistyce) pozwala na przyspieszenie rozwoju diagnostyki, a najnowsze technologie pomiarowe umożliwiają automatyczną wizualizację i analizę tkanek dotkniętych patologiami. Proces ten może zostać dodatkowo rozszerzony przez zastosowanie zaawansowanych algorytmów analizy obrazów medycznych. Szczegółowe dane pomiarowe oraz odpowiednia reprezentacja grubości, objętości i rozmieszczenia badanych struktur (np. grubości warstw siatkówki) ułatwiają lekarzowi okuliście podjęcie decyzji o dalszym planie leczenia. Przykładem wykorzystania technik pomiarowych jest zastosowanie spektralnej optycznej tomografii koherentnej (ang. spectral domain optical coherence tomography, SD- XV Krajowa Konferencja Elektroniki 1
OCT) jako bezinwazyjnej metody obrazowania tkanek miękkich [1]. Technologia ta polega na oświetlaniu badanej tkanki wiązką światła podczerwonego, które, odbijając się od wewnętrznych struktur oka, jest analizowane interferometrycznie po przetworzeniu przez spektrometr. Otrzymane dane, reprezentujące warstwy siatkówki wzdłuż jednej linii wgłąb oka (tzw. A-skany), są następnie zbierane w obrazy będące przekrojami (tzw. B-skanami) wizualizującymi warstwową strukturę morfologiczną siatkówki. Zestawy tych warstw (czyli B-skanów) tworzą więc trójwymiarową wizualizację siatkówki (tzw. pomiar 3D). Za pomocą współczesnego urządzenia OCT możliwa jest akwizycja od 50 000 do 70 000 A-skanów [2] w ciągu jednej sekundy, co pozwala na wykonanie pomiaru 3D obejmującego 141 B-skanów o rozdzielczości 640 385 pikseli każdy w ciągu ok. 0.8 sekundy. Tak szybki pomiar pozwala zapobiec artefaktom związanym z mimowolnymi ruchami gałki ocznej, które mogą być dodatkowo minimalizowane przez zastosowanie w niektórych urządzeniach OCT technologii śledzenia ruchu gałki ocznej. B-skany uzyskiwane w wyniku akwizycji 3D OCT są zaszumione, co jest główną przyczyną błędów procesu automatycznej segmentacji warstw. Badania nad specyfiką szumu w obrazach OCT [3] dowiodły, iż nie jest to w pełni losowy szum, lecz ma on również wartość informacyjną. Ponadto jest on zależny od położenia na obrazie oraz od sposobu rozpraszania światła przez badane tkanki i nie jest możliwe dokładne określenie jego poziomu. Z tego względu eliminacja szumu w obrazach OCT jest zadaniem trudnym, przy czym niezbędnym do prawidłowej analizy struktury tkanek. Na rysunku 1 pokazano przykładowy B-skan uzyskany podczas badania 3D OCT. Obraz ten posiada niską jakość wynikającą z akwizycji, a także dodatkowo obejmuje zmiany chorobowe spowodowane trakcją witromakularną (rozrywaniem środkowej części siatkówki przez oddzielające się ciało szkliste). Czynniki te skutkują nieprawidłową segmentacją warstw siatkówki przy zastosowaniu metody automatycznej opisanej w pkt. 3 (rys. 1). (a) Rys. 1. Przykładowe przekroje (B-skany) przy badaniu 3D OCT: (a) B-skan z oznaczeniami warstw wykonanymi przez eksperta, (b) B-skan z błędnymi, automatycznymi oznaczeniami wybranych warstw siatkówki Metody redukcji szumu granulacyjnego (inaczej speklowego) można podzielić na dwie grupy obejmujące: metody uśredniania wielokrotnych skanów oraz algorytmy odszumiania pojedynczych obrazów. Pierwsza grupa metod bazuje na wielokrotnym skanowaniu badanego obszaru, uzyskując tym samym serię pojedynczych B-skanów, które następnie poddaje się uśrednianiu [4, 5]. Pozwala to na skuteczną redukcję szumu, który w każdym kolejnym przekroju ma inny przestrzenny rozkład, w przeciwieństwie do badanej tkanki. Dzięki uśrednieniu większej liczby skanów możliwa jest lepsza redukcja szumu i uwypuklenie struktury tkanek. Technika ta jest stosowana głównie przy wykonywaniu pojedynczego B-skanu, ze względu na wydłużenie czasu akwizycji. Ze względu na aktualne możliwości akwizycji obrazów przez urządzenia OCT nie jest możliwe zastosowanie tej techniki do pomiarów 3D, ponieważ długi czas wykonywania badania powodowałby przesunięcia i rotacje poszczególnych B-skanów w zestawie danych 3D. (b) 2
Druga grupa metod stosowana do odszumiania B-skanów w zestawach 3D, których akwizycja nastąpowała jednokrotnie, obejmuje techniki takie jak: filtracja uśredniająca i medianowa [6] metody regularyzacji [7] i lokalnej estymacji bayesowskiej [8] filtry dyfuzyjne, w tym nieliniowe filtry izotropowe [9, 10, 11] metody falkowe (m.in. filtry adaptacyjne [12], dwupoziomową zespoloną transformację falkową [13], falki typu curvlets [14]). Wyniki dotychczasowych badań przeprowadzonych przez Ozcan i in. [15] sugerują wyższość metod opartych na transformacjach falkowych w porównaniu do innych metod. Publikowane wyniki badań opracowane zostały dla danych pochodzących w większości z obrazowania różnych tkanek zwierzęcych (świni, szura, myszy) [4, 11], skóry człowieka [16, 17] oraz zdrowej siatkówki człowieka [5], lecz w wielu przypadkach metody redukcji szumu porównywane są na przykładach obrazów niemedycznych i syntetycznych [7, 9, 11]. Ponadto, nieliczne są przypadki analizy metod redukcji szumu speklowego na obrazach OCT pacjentów z patologiami siatkówki. Do jednego z najnowszych doniesień można zaliczyć pracę Abbirame et al., w której wykorzystano 30 pacjentów z 15 różnymi patologiami siatkówki [18]. W najnowszej literaturze można znaleźć również prace proponujące zastosowanie metody progowania falkowego bloku obrazów do skanów 3D ludzkiej skóry, wykorzystując informacje pochodzące z sąsiednich przekrojów w celu minimalizacji efektu rozmycia i zachowania szczegółów obrazu [16, 17]. W tej pracy badany jest wpływ wybranych metod odszumiania obrazów 3D OCT dla zdrowej siatkówki oraz siatkówki z patologią trakcji witromakularnej (ang. vitreomacular traction) na automatyczną segmentację warstw, niezbędną w procesie ewaluacji siatkówki. 2. METODY ODSZUMIANIA SKANÓW 3D OCT 2.1 Filtracja uśredniająca i medianowa Podstawowymi, najprostszymi metodami odszumiania obrazów, stosowanymi powszechnie są filtracja uśredniająca oraz medianowa, w których wykonywany jest dwuwymiarowy splot pomiędzy odszumianym obrazem a zdefiniowanym filtrem. Standardowo filtry te są definiowane jako tablice kwadratowe o nieparzystej liczbie wierszy i kolumn, chociaż zdarzają się implementacje filtrów prostokątnych o wymiarach np. 3 19 jak w [19]. Przykład zastosowania filtracji uśredniającej i medianowej na B-skanie OCT ilustrują rys. 2B i 2C. 2.2. Dyfuzja anizotropowa Dyfuzja anizotropowa (ang. aniosotropic diffusion, AD) jest wielowymiarową metodą redukcji szumu na obrazie zaproponowaną przez Peronę i Malika [20], którą można zdefiniować jako: gdzie to odszumiony obraz, określa operator Laplace a, a, to współczynnik dyfuzji, którego wartość zmienia się w przestrzeni obrazu zgodnie z funkcją: w której definiuje gradient, a jest parametrem (typowo przyjmującym wartości rzeczywiste z przedziału ), którego dobór jest uzależniony od poziomu szumu oraz stopnia oczekiwanego zachowania krawędzi na obrazie. W tej metodzie do znalezienia krawędzi wykorzystuje się gradient obrazu obliczany m.in. za pomocą operatora Prewitta, (1) (2) XV Krajowa Konferencja Elektroniki 3
który jest mało wrażliwy na szum [10]. Poprzez wybór mniejszego współczynnika dyfuzji można uniknąć rozmycia krawędzi, podczas gdy duża wartość współczynnika pozwala na ujednolicenie jasności obszarów pomiędzy poszczególnymi krawędziami. Dzięki temu, zachowywane są krawędzie, linie lub struktury istotne dla interpretacji danych w obrazie. Jest to technika, która pozwala również na redukcję szumu speklowego obecnego w obrazach OCT, co ilustruje rys. 2D. 2.3. Progowanie falkowe Powodem, dla którego metoda progowania falkowego (ang. wavelet thresholding, WT) uzyskuje dobre wyniki odszumiania obrazów OCT, jest równomierny rozkład szumu wśród współczynników falkowych, podczas gdy większość istotnej zawartości informacyjnej jest skoncentrowana wśród kilku największych współczynników. Pozwala to zarówno zredukować szum jak i zachować cechy charakterystyczne obrazu, przy czym problemem jest dobór wartości progowej [21]. W algorytmie tym pojedynczy B-skan o indeksie, reprezentowany w skali logarytmicznej jest poddawany dekompozycji za pomocą transformacji falkowej z maksymalnym poziomem dekompozycji, czego wynikiem są współczynniki aproksymacji i współczynniki szczegółowe, gdzie określa kierunek współczynników. W przeprowadzonych badaniach wykorzystano miękkie progowanie z transformacją z falką Haara (ang. discrete stationary wavelet transform, DSWT) [22]. Proces odszumiania polega na ograniczeniu współczynników szczegółowych dla pozycji obrazu na podstawie wagi : gdzie poszczególne wagi są obliczane przy użyciu progu według wzoru: (3). (4) Na rys. 2E zilustrowano przykładowy wynikowy B-skan uzyskany po wykonaniu odwrotnej transformacji falkowej dla tej metody. 2.4. Progowanie falkowe bloku ramek Metoda progowania falkowego wykorzystująca blok ramek (ang. wavelet multiframe thresholding, WMT), gdzie oznacza liczbę przetwarzanych B-skanów zakłada, że szum w -tym B-skanie jest nieskorelowany w stosunku do pozostałych B-skanów, oraz że jego odchylenie standardowe na pozycji jest w przybliżeniu takie samo jak w pozostałych B-skanach. Autorzy tej metody [4] proponują obliczanie wagi na podstawie współczynników szczegółowych, która pozwala na estymację szumu lokalnego, a nazwana została wagą znaczenia (ang. significance weight) oznaczoną jako i wyliczaną według poniższych wzorów: (5) 4
(6) gdzie to średniokwadratowa odległość współczynników szczegółowych pomiędzy poszczególnymi obrazami, parametr określa stopień redukcji szumu, a jest znormalizowanym parametrem określonym jako: (7) Po przeskalowaniu wartości współczynników szczegółowych oraz współczynników aproksymacji za pomocą powyższych wag dla wszystkich obrazów następuje ich uśrednienie, a następnie obliczenie transformaty odwrotnej. Algorytm ten został zaprojektowany do przetwarzania bloku ramek przestawiających ten sam obszar badanej tkanki jak jest w przypadku wykonywania wielokrotnie pojedynczego B-skanu poprzez środek siatkówki. Mając jednak na względzie, iż odległość pomiędzy sąsiednimi B-skanami w badaniu 3D wynosi ok. 50 μm (w związku z czym zmiana w strukturze tkanek na sąsiednich przekrojach jest niewielka), autorzy proponują wykorzystanie 3 sąsiadujących ramek w bloku 3D jako obrazów wejściowych do tej metody. Przykład wynikowego B-skanu obliczonego w ten sposób ilustruje rys. 2F. 3. BADANIA EKSPERYMENTALNE Jak wspomniano we wprowadzeniu, weryfikacji skuteczności metod odszumiania dokonano w oparciu o ocenę jakości procesu segmentacji. Określenie struktury morfologicznej siatkówki będące kluczowym etapem diagnostyki chorób oczu opiera się na wizualizacji i pomiarach grubości poszczególnych warstw siatkówki, których prawidłowa segmentacja umożliwia ich dokładną analizę. Dotychczasowe badania nad segmentacją obrazów medycznych określają metodę segmentacji warstw siatkówki opartą na teorii grafów [19] jako metodę posiadającą najlepszą skuteczność. Zastosowany algorytm przetwarza pojedynczy obraz (B-skan OCT) jako graf, w którym każdy piksel jest traktowany jako węzeł tego grafu, a połączenia pomiędzy węzłami są krawędziami. W przeprowadzonym eksperymencie wykorzystano implementację tego algorytmu zmodyfikowaną przez autorów [23, 24], w której poszukiwanie poszczególnych warstw dodatkowo jest ograniczone na podstawie wiedzy o tkankach w sąsiedztwie oraz informacji o jakości sygnału w danej kolumnie obrazu. Wpływ analizowanych metod na skuteczność automatycznej segmentacji został przebadany przy wykorzystaniu serii skanów 3D OCT otrzymanych przy użyciu urządzenia Avanti RTvue (firmy Optovue Inc., Freemont, USA). Do badań wykorzystano obrazy siatkówki 10 pacjentów z symptomami patologii interfejsu szklistkowo-siatkówkowego oraz 10 zdrowych osób. Średnia wieku badanych osób jest równa 71 lat dla grupy chorych oraz 39 lat dla grupy zdrowych. Każdy z badanych został poddany badaniu OCT plamki żółtej obejmującemu obszar o wymiarach 7 7 2 mm, reprezentowany przez 141 385 640 punktów skanu OCT (141 B-skanów o rozmiarach 640 385 pikseli). Uzyskane skany zostały poddane ręcznemu oznaczeniu poprawnej segmentacji wybranych siedmiu warstw siatkówki poprzez grupę ekspertów z Oddziału Okulistycznego Szpitala Klinicznego im. H. Święcickiego Uniwersytetu Medycznego im. K. Marcinkowskiego w Poznaniu. Oznaczenia te posłużyły w dalszej części eksperymentu jako oznaczenia referencyjne do obliczania błędu automatycznej segmentacji siatkówki. XV Krajowa Konferencja Elektroniki 5
W kolejnym kroku każdy obraz odszumiony został z wykorzystaniem badanych metod, tzn. filtracji uśredniającej (oznaczonej jako AVG), filtracji medianowej (MED), dyfuzji anizotropowej (AD), miękkiemu progowaniu falkowemu (DSWT) oraz progowaniu falkowemu bloku ramek (WMT). Przetwarzanie obrazów każdą z metod było testowane przy wykorzystaniu różnych wartości parametrów. Grupę testowanych parametrów dla każdej metody i ich wartości wybrane na podstawie testów wstępnych przedstawia tabela 1. Należy zauważyć, iż wartości parametrów dobrane dla automatycznego procesu segmentacji dla metody AD i DSWT są zdecydowanie mniejsze niż przy ręcznym oznaczaniu warstw przez specjalistów. Szarym kolorem zaznaczono wartości parametrów, dla których uzyskano najlepsze wyniki. Tab. 1 Wartości testowanych parametrów dla badanych metod odszumiania AVG MED AD DSWT WMT Parametr Rozmiar maski Rozmiar maski Wartość 1 3 3 3 3 1 1 0.1 Wartość 2 5 5 5 5 5 10 1 Wartość 3 7 7 7 7 10 30 10 Wartość 4 9 9 9 9 20 100 100 A B C D E F Rys. 2. Przykładowy B-skan (A), oraz ilustracja zastosowania poszczególnych metod redukcji szumu: (B) filtracją uśredniającą, (C) filtracją medianową, (D) dyfuzją anizotropową, (E) miękkim progowaniem falkowym, (F) wieloobrazowym progowaniem falkowym Rys. 2 przedstawia przykładowe wynikowe B-skany uzyskane po zastosowaniu każdej z metod. Porównując oryginalny B-skan (A) posiadający dużą ziarnistość obrazu z obrazami odszumionymi można zauważyć, iż metody B i C powodują rozmycie obrazu przy zachowaniu tej ziarnistości. Metoda E również rozmywa obraz jednak obszary poszczególnych tkanek są wygładzone. Największe ujednolicenie i wygładzenie tkanek widoczne jest dla metody D, jednak metoda ta redukuje również linię określającą błonę 6
PSNR [db] PSNR [db] graniczną ciała szklistego widoczną w lewej górnej części obrazu. Linia ta najbardziej uwypuklona została przez metodę F, dzięki której zachowujemy najwięcej informacji o rozkładzie patologii. Metoda F uzyskuje również niewielką ziarnistość obrazu i widoczne rozdzielenie obszarów poszczególnych tkanek siatkówki. Następnie wykonana została automatyczna segmentacja obrazów wykorzystująca metodę opartą na teorii grafów. Sprawdzenie poprawności zaimplementowanych metod obejmowało: obliczenie PSNR (ang. peak signal to noise ratio) oraz średniej arytmetycznej bezwzględnej wartości błędu pomiędzy ręcznymi oraz automatycznymi oznaczeniami. Ze względu na różnice w sposobie określania granicy pomiędzy warstwami dla ręcznej oraz automatycznej segmentacji, rozbieżności pomiędzy oznaczeniami mniejsze niż 5 pikseli zostały zakwalifikowane jako nieistotne (błąd równy zero). W przeprowadzonym eksperymencie wykorzystano algorytm zaimplementowany w środowisku Matlab/Simulink w celu oznaczenia następujących siedmiu granic warstw siatkówki: ILM (ang. inner limiting membrane), NFL/GCL (ang. nerve fiber layer / ganglion cell layer), IPL/INL (ang. inner plexiform layer / inner nuclear layer), INL/OPL (ang. inner nuclear layer / outer plexiform layer), OPL/ONL (ang. outer plexiform layer / outer nuclear layer), IS/OS (ang. inner segments / outer segments of photoreceptors) oraz RPE/Choroid (ang. retinal pigment epithelium). Wyniki skuteczności automatycznej segmentacji wybranych warstw siatkówki zostały obliczone oddzielnie dla grupy zdrowych osób oraz dla grupy pacjentów z patologią VMT. W tabeli 2 oraz na rys. 3 przedstawione zostały wartości otrzymanych wskaźników PSNR przy wybranych najlepszych parametrach metod odszumiania. Wykorzystywane urządzenie OCT oferuje automatyczną segmentację jedynie czterech warstw siatkówki (tzn. ILM, IPL/INL, IS/OS oraz RPE/Choroid) dlatego też nie dokonano porównania jej z wynikami uzyskanymi za pomocą autorskiej metody. Tab. 2 Wartości PSNR przy automatycznej segmentacji poszczególnych warstw siatkówki [db] Pacjenci z VMT Zdrowi pacjenci metoda AVG MED AD DSWT WMT AVG MED AD DSWT WMT Wszystkie warstwy 37,40 37,40 37,75 37,70 37,88 43,58 43,29 44,60 44,56 43,15 ILM 49,28 49,34 48,54 48,56 49,23 55,66 55,42 55,45 55,55 54,49 NFL/GCL 38,35 38,24 40,12 40,14 39,11 40,09 39,95 42,74 42,72 40,84 IPL/INL 35,56 35,50 35,84 35,80 35,94 44,31 43,68 44,26 44,16 42,62 INL/OPL 33,82 33,79 33,90 33,85 34,17 43,44 42,54 41,79 41,68 40,58 OPL/ONL 34,87 34,98 35,02 34,91 35,45 44,62 43,95 44,13 44,04 42,31 IS/OS 41,64 41,84 42,35 42,38 42,24 43,08 43,44 48,76 48,68 46,14 RPE/Choroid 45,67 45,53 46,52 46,47 46,20 43,91 44,01 45,11 45,34 45,51 38 37,8 37,6 37,4 37,2 37 Pacjenci z VMT AVG MED. AD DSWT WMT Rys. 3. Wykresy uzyskanych wartości PSNR automatycznej segmentacji wszystkich warstw siatkówki badanych grup pacjentów dla wybranych metod redukcji szumu 45 44 43 42 Zdrowi pacjenci AVG MED. AD DSWT WMT XV Krajowa Konferencja Elektroniki 7
4. PODSUMOWANIE Akwizycja obrazów za pomocą specyficznych interfejsów obrazowych HMI (takich jak urządzenia OCT) jest obarczona problemem stosunkowo niskiej jakości. Metody odszumiania za pomocą dyfuzji anizotropowej oraz progowania falkowego pozwalają na uzyskanie lepszej skuteczności segmentacji obrazów OCT dla obu badanych grup pacjentów. Dodatkowo, w przypadku obrazów z patologią VMT można uzyskać lepszą skuteczność segmentacji, wykorzystując odszumianie metodą progowania falkowego bloku ramek, podczas gdy dla grupy zdrowych osób metoda ta praktycznie nie poprawia wyników. Warto również zauważyć, że dla granic warstw charakteryzujących się dużą zmianą jasności na obrazie (jak np. ILM, IS/OS i RPE/Choroid) otrzymujemy znacznie lepsze wyniki segmentacji w obu badanych grupach, niezależnie od metody redukcji szumu. Ponadto, silnie wykształcona patologia VMT u jednego z pacjentów znacznie zaniżyła wyniki dla tej grupy osób badanych, gdyż dla tego pacjenta wskaźnik PSNR dla najlepszych parametrów wahał się w granicach 36,80 38,14 db, podczas gdy średnie wyniki dla pozostałych pacjentów mieściły się w granicach 43,78 44,42 db. Dla wszystkich pacjentów z patologią VMT błędna segmentacja warstw koncentrowała się w obszarze występującej patologii, a największa wartość błędu wyniosła 49 px. Segmentacja i analiza warstw siatkówki oraz miejsc występowania patologii wykorzystywana jest do obserwacji zmian i analizy postępu choroby. Precyzyjna segmentacja pozwala zauważyć zmiany w strukturze morfologicznej odpowiednio wcześnie i przeprowadzić dokładną ocenę stadium patologii. Dzięki temu możliwe jest zastosowanie terapii w odpowiednim momencie, co jest kluczowe dla uzyskania poprawy widzenia. BIBLIOGRAFIA [1] M. Wojtkowski, High-speed optical coherence tomography: basics and applications, Appl. Opt. 49(16), D30 D61 (2010). [2] RTVue XR 100 Avanti Edition, Podręcznik użytkownika, Optovue Inc., (2014). [3] B. Karamata, K. Hassler, M. Laubscher, and T. Lasser, Speckle statistics in optical coherence tomography, J. Opt. Soc. Am. A 22(4), 593 596 (2005). [4] M. A. Mayer et al., Wavelet denoising of multiframe optical coherence tomography data, Biomedical Optics Express 3(3), 572-589 (2012). [5] A. Baghaie, R. M. D'souza and Z. Yu, Sparse and low rank decomposition based batch image alignment for speckle reduction of retinal OCT images, Biomedical Imaging (ISBI), 2015 IEEE 12th International Symposium on, New York, 226-230, doi: 10.1109/ISBI.2015.7163855 (2015). [6] J. Rogowska, Image processing techniques for noise removal, enhancement and segmentation of cartilage OCT images, Physics in Medicine and Biology 47(4), 641 655 (2002). [7] D. L. Marks, T. S. Ralston, and S. A. Boppart, Speckle reduction by I-divergence regularization in optical coherence tomography, J. Opt. Soc. Am. A 22(11), 2366 2371 (2005). [8] A. Wong, A. Mishra, K. Bizheva, and D. A. Clausi, General Bayesian estimation for speckle noise reduction in optical coherence tomography retinal imagery, Opt. Express 18(8), 8338 8352 (2010). [9] R. Bernardes, C. Maduro, P. Serranho, A. Ara ujo, S. Barbeiro, and J. Cunha-Vaz, Improved adaptive complex diffusion despeckling filter, Opt. Express 18(23), 24048 24059 (2010). [10] P. Puvanathasan and K. Bizheva, Interval type-ii fuzzy anisotropic diffusion algorithm for speckle noise reduction in optical coherence tomography images, Opt. Express 17(2), 733 746 (2009). [11] W. Habib, A. M. Siddiqui and I. Touqir, Wavelet based despeckling of multiframe optical coherence tomography data using similarity measure and anisotropic diffusion filtering, Bioinformatics and Biomedicine (BIBM), IEEE International Conference on, Shanghai, 330-333 (2013). [12] Z. Hongwei, L. Baowang and F. Juan, Adaptive wavelet transformation for speckle reduction in Optical Coherence Tomography images, Signal Processing, Communications and Computing (ICSPCC), IEEE International Conference on, Xi'an, 1-5, doi: 10.1109/ICSPCC.2011.6061760 (2011). [13] S. Chitchian et al., Denoising during optical coherence tomography of the prostate nerves via wavelet shrinkage using dual-tree complex wavelet transform, J. Biomedical Optics 14(1), 14-31 (2009). [14] Z. Jian, L. Yu, B. Rao, B. J. Tromberg, and Z. Chen, Three-dimensional speckle suppression in optical 8
coherence tomography based on the curvelet transform, Optics Express 18(2), 1024 1032 (2010). [15] A. Ozcan, A. Bilenca, A. E. Desjardins, B. E. Bouma, and G. J. Tearney, Speckle reduction in optical coherence tomography images using digital filtering, J. Opt. Soc. Am. A 24(7), 1901 1910 (2007). [16] L. Wang et al., Adaptive Speckle Reduction in OCT Volume Data Based on Block-Matching and 3-D Filtering, IEEE Phot. Technol. Lett. 24(20), 1802 1804, Oct.15, doi: 10.1109/LPT.2012.2211582 (2012). [17] J. J. Gómez-Valverde et al., Evaluation of speckle reduction with denoising filtering in optical coherence tomography for dermatology, Biomedical Imaging (ISBI), 2015 IEEE 12th International Symposium on, New York, 494-497, doi: 10.1109/ISBI.2015.7163919 (2015). [18] K. S. Abbirame, N. Padmasini, R. Umamaheshwari and S. M. Yacin, Speckle noise reduction in spectral domain optical coherence tomography retinal images using fuzzification method, Green Computing Communication and Electrical Engineering (ICGCCEE), Int. Conf. on, Coimbatore, 1-6 (2014). [19] S. J. Chiu, et al., Automatic segmentation of seven retinal layers in SDOCT images congruent with expert manual segmentation, Opt. Express 18(18), 19413 19428 (2010). [20] P. Perona and J. Malik, Scale-space and edge detection using anisotropic diffusion, IEEE Trans. Pattern Anal. and Mach. Intell. 12, 629 639 (1990). [21] S. Mallat, A Wavelet Tour of Signals Processing, 3 rd Ed., Academic Press, London (2009). [22] G. Nason and B. Silverman, The stationary wavelet transform and some statistical applications, Lecture Notes in Statistics 103, 281 299 (1995). [23] A. Stankiewicz, T. Marciniak, A. Dąbrowski, M. Stopa, E. Marciniak, A New OCT-based Method to Generate Virtual Maps of Vitreomacular Interface Pathologies, Proc. of SPA 2014: Signal Processing Algorithms, Architectures, Arrangements, and Applications Conference Proceedings, pp. 83-88 (2014). [24] A. Stankiewicz, T.. Marciniak, A. Dąbrowski, M. Stopa, P. Rakowicz, E. Marciniak, Improvement of 3D retina layers segmentation based on graph theory approach for low quality OCT images, Metrology and Measurement Systems, 23(2) (2016). Praca powstała w wyniku realizacji projektu badawczego o nr 2014/15/N/ST6/00710 finansowanego ze środków Narodowego Centrum Nauki. XV Krajowa Konferencja Elektroniki 9
Methods for improving precision of automatic image segmentation in OCT biometric interfaces Keywords: optical coherence tomography (OCT), image denoising, image segmentation, anisotropic diffusion, wavelet thresholding ABSTRACT This article presents analysis of selected noise reduction methods used in optical coherence tomography (OCT) retina images (so-called B-scans). The tested algorithms included median and averaging filtering, anisotropic diffusion, soft wavelet thresholding and multiframe wavelet thresholding. The precision of the denoising process was evaluated based on the results of automated retina layers segmentation, since this stage (vital for ophthalmic diagnosis) is dependent from image quality. Experiments were conducted for a set of 3D low quality scans obtained from 10 healthy patients and 10 patients with vitreoretinal pathologies. Influence of each method on the image segmentation for both groups of patients was thoroughly described. Fig. 1. Example of 3D OCT cross-sections (B-scans): (a) B-scan with expert s manual segmentations, (b) B- scan with erroneous automatic segmentations of retina layers Fig. 2. Fig. 3. Original B-scan (A), and illustration of analyzed noise reduction methods: (B) average filtering, (C) median filtering, (D) anisotropic diffusion, (E) soft wavelet thresholding, (F) multiframe wavelet thresholding PSNR graph results of automatic retina layers segmentation for methods tested on the selected groups of patients Table 1. Table 2. Values of parameters chosen for tested denoising methods PSNR values for automatic segmentation of selected retina layers [db] 10