Wspomaganie diagnostyki mammograficznej: poprawa percepcji zmian patologicznych Anna Wróblewska
Plan prezentacji Mammografia Problemy detekcji i interpretacji badań Komputerowe wspomaganie diagnozy System MammoViewer Opis narzędzia Weryfikacja eksperymentalna Podsumowanie
Dlaczego mammografia % 40 30 20 10 0 Zarejestrowane zachorowania na najczęstsze nowotwory złośliwe u kobiet w Polsce w 2000 roku. Krajowy Rejestr Nowotworów Warszawa 2003 Piersi Jelito grube Płuca Szyjka macicy Trzon macicy Jajniki Żołądek Trzustka Nerka Mózg % 15 10 5 0 Struktura umieralności na nowotwory złośliwe u kobiet w Polsce w 2000 roku. Krajowy Rejestr Nowotworów Warszawa 2003 Piersi Jelito grube Płuca Żołądek Jajniki Szyjka Macicy Trzustka Pecherz mocz. Mózg Mammografia - badanie przesiewowe przyczyniające się do zmniejszenia śmiertelności spowodowanej przez raka piersi, -wykrywa zmiany nieme klinicznie (m.in. mikrozwapnienia), które często są jedynym objawem wczesnego nowotworu - badanie diagnostyczne pozwalające na dokładniejszą ocenę charakteru zmiany
Badanie mammograficzne RMLO LMLO RCC LCC
Ograniczenia detekcji i interpretacji badań duże zróżnicowanie właściwości obrazowanej informacji Złożona struktura tkanki piersi Duże różnice w wyglądzie normalnej tkanki brak standardu prawidłowej piersi Często słaba widoczność zmian Szczególnie trudne w detekcji gęste utkanie Mikrozwapnienia ukryte we włóknach
Ograniczenia detekcji i interpretacji Subiektywizm diagnozy Zmęczenie (duża ilość danych) Brak doświadczenia Warunki zewnętrzne: złe oświetlenie itp. Błędy: Przeoczenie widocznej zmiany Niewłaściwa ocena wykrytej patologii Poziom przekłamań w diagnozie ~30-40% decyzji FP ~10-30% decyzji FN
Rozwiązanie - komputerowe wspomaganie diagnozy Włączenie technologii komputerowej w proces diagnostyczny wspieranie decyzji radiologa metodami modelowania, przetwarzania, analizy i rozpoznawania danych/obrazów Ostateczną decyzję podejmuje lekarz przy wsparciu metod komputerowych
Schemat podejmowania decyzji diagnostycznej Cyfrowy obraz medyczny Komputer Wynik wspomagania Obraz medyczny -Przetworzony obraz -Wskazanie potencjalnej patologii: symbol -Wynik klasyfikacji: prawdopodobieństwo złośliwości Radiolog Decyzja diagnostyczna
Systemy wspomagania diagnostyki obrazowej cele i środki Cele Zmniejszenie liczby błędów detekcji Redukcja niewłaściwych interpretacji Obiektywizacja diagnozy Środki: Poprawa jakości obrazu Lepsza prezentacja zawartej informacji diagnostycznej Detekcja zmian potencjalnie patologicznych Klasyfikacja oszacowanie złośliwości
MammoViewer system wspomagania diagnostyki zaawansowana przeglądarka przeznaczona dla obrazów medycznych efektywne metody prezentacji, przetwarzania, analizy i interpretacji obrazów www.ire.pw.edu.pl/mammoviewer powszechnie stosowane opcje pracy z obrazami: wymiarowanie struktur, operowanie na regionach zainteresowania, zmiana zakresu widzianych wartości, definiowanie profili pakiet oprogramowania naukowego różne metody przetwarzania obrazów medycznych
MammoViewer schemat funkcjonalny MammoViewer Operacje na obrazach Wizualizacja obrazu Detekcja Klasyfikacja Obrazy w różnych formatach Obrazy mammograficzne, USG, CT Guzki w mammografii Mikrozwapnienia w mammografii Mikrozwapnienia w mammografii Poprawa percepcji Archiwizacja i indeksowanie Ontologia mammografii Mózg w CT Referencyjne bazy obrazów Mikrozwapnienia w mammografii Guzki w mammografii
Przetwarzanie obrazów medycznych cele i środki Cel przetwarzania: poprawa jakości obrazu, poprawa warunków percepcji zmian patologicznych = uwypuklenie oznak patologicznych dla radiologów diagnozujących badania (detekcja i interpretacja zmian) Środki: Odszumianie - usunięcie lub redukcja szumów Odrzucenie (wysegmentowanie) informacji nieistotnej dla diagnozy Zwiększenie lokalnego kontrastu Wykrycie krawędzi lub wzmocnienie konturów patologii Podkreślenie innych cech różnicujących zmiany patologiczne (tekstura wewnątrz patologii, kształt, relacja do tła)
Przetwarzanie mammogramów cele szczegółowe Poprawa jakości obrazu = obraz przyjazny dla oka radiologa (bez wyraźnej deformacji struktury zdrowej tkanki) Podkreślenie drobnych oznak patologii - szczegółów obrazu: mikrozwapnień, drobnych spikuli w guzach, małych zagęszczeń
Przetwarzanie mammogramów w dziedzinie falkowej Odszumianie i poprawa kontrastu 6 poziomów dekompozycji, falka: Taswell Biortogonal Symmetric Most-Regular (10) kontrast6
Przykład poprawy percepcja Guz spikularny z mikrozwapnieniami.
MammoViewer detekcja potencjalnych klastrów mikrozwapnień Wejście: mammogram Klaster mikrozwapnień Lokalizacja: centra jasnych plam Klasteryzacja - DBSCAN bazująca na gęstości obiektów Rekonstrukcja kształtów Znajdowanie konturu klastrów Wynik wspomagania detekcji
Wyniki wydajność detekcji Patologia dobrze wykryta Czułość: około 83% Średnia liczba fałszywych wskazań na obraz to 2 Fałszywe wskazania Systemy komercyjne (R2 ImageChecker, icad Secondlook): Czułość: około 98% FP na obraz: 0.5-1
Testy weryfikacyjne metody przetwarzania i automatycznej detekcji potencjalnych klastrów mikrozwapnień przy współudziale lekarzy radiologów
Testy weryfikacyjne organizacja, narzędzia Oryginały Ocena mammogramu MammoViewer jako przeglądarka medyczna, monitor medyczny Detekcja (skala 1-5 wyrażająca pewność detekcji patologii) + Opis morfologii + Diagnoza (BI-RADS) Przetworzone Ocena przetworzonego mammogramu (z możliwością weryfikacji na oryginałach) MammoViewer jako przeglądarka medyczna, monitor medyczny Detekcja + Opis morfologii + Diagnoza (BI-RADS) Ocena porównawcza z oryginałem test porównawczy Przetworzone + Automatyczne Wskazania Potencjalnych Klastrów Mikrozwapnień (AWPKM) Weryfikacja wskazań na obrazach przetworzonych (lub oryginalnych) Detekcja + Opis morfologii + Diagnoza (BI-RADS)
Interfejs dla radiologa: obrazy oryginalne
Interfejs dla radiologa: obrazy przetworzone
Interfejs dla radiologa: obrazy przetworzone + automatyczne wskazania potencjalnych klastrów mikrozwapnień
Testy weryfikacyjne obserwatorzy, realizacja Współpraca 3 radiologów o różnym doświadczeniu i stopniu umiejętności: Stażysta 2 miesiące praktyki Specjalista pośredni stopień zaawansowania (cyfrowe obrazy) Ekspert 20 lat doświadczenia w mmg skrinigowej (mammografia analogowa) Radiolodzy wiedzieli, że badana próba zawiera zarówno mammografie negatywne jak i badania z patologiami w losowym porządku, ale nie byli poinformowani w jakiej proporcji występują
Testy weryfikacyjne materiał Baza mammografii skrinigowej DDSM (http://marathon.csee.usf.edu/mammography/database.html): przeznaczona do badań naukowych, testowania i porównywania skuteczności działania algorytmów CAD opis przypadków: gęstość, stopień trudności zmiany, diagnoza (BI-RADS) Wybór próby do testów: Stopień trudności detekcji (trudne badania) oraz typ utkania (gęste) Wybrano zbiór 51 zdiagnozowanych badań mammograficznych (po 4 obrazy) o rozdzielczości 43.5 i 45.5 mikronów/piksel z 12-bitową głębią koloru
Testy weryfikacyjne materiał 51 przypadków: 18 norm, 33 - ze zmianami patologicznymi (9 guzów + 24 mikrozwapnienia) histogram gęstości histogram subtelności 25 14 20 12 10 15 10 mikrozwapnienia guzy norma 8 6 mikrozw apnienia guzy 4 5 2 0 1 2 3 4 0 1 2 2,5 3 4 5 Średnia gęstość: 2.96 normy guzy mikrozwapnienia Najtrudniejsze zmiany 3.1 3 2.83 Średnia subtelność: 2.35 guzy mikrozwapnienia 2.5 2.29 Oczywiste zmiany
Analiza ROC ( Receiver Operating Characteristics ) (1) Analiza ROC powszechnie stosowana, uznana metoda szacowania trafności działania systemu diagnostycznego Krzywa ROC graficzna reprezentacja zależności pomiędzy czułością a specyficznością testu diagnostycznego
Parametry analizy pole pod krzywą Trzy charakterystyczne krzywe ROC: - dla przypadku idealnego, - możliwego testu rzeczywistego - testu niezdeterminowanego przedstawiającego wynik uzyskany przy przypadkowej selekcji Pole pod krzywą najczęściej używany parametr Test idealny pole pod krzywą AUC=1 Wybór losowy pole pod krzywą AUC=0.5
Analiza statystyczna - DBM MRMC DBM MRMC - algorytm Dorman a-berbaum a Met za umożliwiający obliczenie i porównanie statystycznej istotności różnicy pomiędzy wskaźnikami analizy ROC, w sytuacji kiedy wydajność narzędzia diagnostycznego zależy zarówno od populacji obserwatorów jak i populacji przypadków DBM MRMC przeprowadza analizę statystyczną dla następujących przypadków: - przypadkowi obserwatorzy i losowo dobrane przypadki - losowo dobrane przypadki - losowo dobrani obserwatorzy TEST - ustaleni obserwatorzy, losowe przypadki
ROC wszyscy radiolodzy wszyscy radiolodzy: sta + spe + eks 1 0,8 0,6 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1 oryginały przetworzone przetworzone+ AWPKM ACC dokładność SE czułość SPE specyficzność AUC pole pod krzywą ROC Oryginały Przetworzone Przetworzone + AWPKM ACC=54.9% SE=43.4% SPE=75.9% AUC=0.656 ACC=60.1% SE=55.6% SPE=68.5% AUC=0.687 ACC=65.4% SE=63.6% SPE=68.5% AUC=0.742
Wyniki testu - oceniany parametr pole pod krzywą ROC 3 radiologów Oryginalne - przetworzone FRRC P=0.4320 Oryginalne przetworzone + AWPKM P=0.0051 FRRC fixed readers, random cases P poziom istotności MULTIREADER-MULTICASE ROC ANALYSIS OF VARIANCE TRAPEZOIDAL AREA ANALYSIS
ROC analiza dla poszczególnych radiologów 1 1 eks spe sta 0,8 0,8 0,6 0,6 0,4 0,4 oryginały: AUC=0.773 AUC=0.617 oryginały: AUC=0.691 przetworzone: AUC=0.818 AUC=0.743 przetworzone: AUC=0.581 przetworzne przetworzone + AWPKM: + AWPKM: AUC=0.833 przetworzone + AWPKM: AUC=0.789 AUC=0.723 0,2 0,2 00 0 0,2 0,2 0,4 0,4 0,6 0,6 0,8 0,8 1 1
Wyniki: czułość i specyficzność Sta Oryginały Przetworzone Przetworzone + AWPKM SE=30.3% SPE=88.9% AUC=0.635 SE=33.3% SPE=77.8% AUC=0.592 SE=45.5% SPE=77.8% AUC=0.679 SE czułość SPE specyficzność AUC pole pod krzywą ROC Spe SE=60.6% SE=75.8% SE=84.8% SPE=38.9% SPE=27.8% SPE=27.8% AUC=0.616 AUC=0.68 AUC=0.726 Eks SE=39.4% SE=57.6% SE=60.6% SPEC=100% SPEC=100% SPEC=100% AUC=0.773 AUC=0.818 AUC=0.833 Dla wszystkich radiologów czułość rośnie przy diagnozie na badaniach przetworzonych oraz z AWPKM
Krzywe ROC dla 2 radiologów Radiolodzy: spe + eks 1 0,8 0,6 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1 oryginały przetworzone przetworzone+awpkm ACC - dokładność SE czułość SPE specyficzność AUC pole pod krzywą ROC Oryginały Przetworzone Przetworzone + AWPKM ACC=56.9% SE=50.0% SPE=69.4% AUC=0.642 ACC=65.7% SE=66.7% SPE=63.9% AUC=0.729 ACC=69.6% SE=72.7% SPE=63.9% AUC=0.758
Wyniki testu - oceniany parametr pole pod krzywą ROC 2 radiologów Oryginalne - przetworzone Oryginalne przetworzone + AWPKM FRRC P=0.0455 P=0.0022 FRRC Fixed Readers, Random Cases RRRC Random Readers, Random Cases P poziom istotności MULTIREADER-MULTICASE ROC ANALYSIS OF VARIANCE TRAPEZOIDAL AREA ANALYSIS
Test oceny porównawczej - organizacja Radiolodzy porównywali obrazy (badania) przetworzone z oryginalnymi: obserwowali jakość obrazu, strukturę tkanki i oznaki patologii. Skala ocen Opis słowny charakteryzujący jakość obrazu 3 Zdecydowanie lepsza 2 Lepsza 1 Nieznacznie lepsza 0 Porównywalna z oryginałem -1 Nieznacznie gorsza -2 Gorsza -3 Zdecydowanie gorsza
Test oceny porównawczej - wyniki 80 histogram ocen histogram ocen: badania zawierające mikrozwapnienia 7045 6040 35 50 30 40 25 30 20 20 15 mikrozwapnienia: AM=1.65 (2.15) guzy: AM=1.04 (1.28) normy: AM=1.28 (1.68) AM średnia ocena 10 10 0 5 0-1 0 1 2 3-1 0 1 2 3
Test porównawczy - wyniki Subtelności Gęstości Średnia ocen 1 2 Najtrudniejsze zmiany 1.48 (1.91) 2.5-4 1-2 3 4 1.49 (1.92) 1.40 (1.81) 1.35 (1.75) 1.51 (1.98)
Opinie radiologów Przetwarzanie generalnie poprawia obrazy: struktura tkanki umiarkowanie lepsza lub lepsza, po przetworzeniu lepiej widać mikrozwapnienia i łatwiej je policzyć oraz ocenić ich morfologię, przetwarzanie daje też wyraźniejsze różnice w gęstości, wątpliwości eksperta przy detekcji guzów: czasami obrazy wysoko skontrastowane sprawiają, że guzy znikają (jeden przypadek w teście). MammoViewer narzędzie wygodne w użyciu, zawierające wszystkie niezbędne elementy przy diagnozowaniu mammografii Automatyczna sugestia potencjalnych klastrów mikrozwapnień pomaga, aby nie przeoczyć tych bardzo subtelnych zmian
Konkluzje Radiolodzy powinni nabrać doświadczenia w czytaniu zmienionych obrazów (przetworzonych) i pracy z automatycznymi wskazaniami potencjalnych patologii W czasie eksperymentu stwierdzono istotną statystycznie poprawę efektywności diagnostycznej u bardziej doświadczonych radiologów używających MammoViewer a Możliwe jest zwiększenie czułości i trafności decyzji radiologów poprzez poprawę diagnostycznie istotnych cech obrazów (uwydatnienie oznak patologii) oraz zasugerowanie lokalizacji zmian Analiza testów przeprowadzona bez uwzględnienia zmian, które radiolodzy błędnie interpretowali jako łagodne (sta: 7 przypadków, spe: 4 przypadek, eks: 4 przypadków) problemem była niewłaściwa interpretacja cech patologii
W testach zostały użyte monitory medyczne EIZO RadiForce GS320 3 mp wypożyczone dzięki uprzejmości firmy Alstor. Program wykorzystany w pracy: www.ire.pw.edu.pl/mammoviewer Kontakt: awroble@ire.pw.edu.pl