Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej

diagnostyka laboratoryjna Journal of Laboratory Diagnostics 2012 Volume 48 Number 2 127-152 Kontrola jakości Quality Control Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej Interlaboratory EQA programmes realised in 2011 by Centre for Quality Assessment in Laboratory Medicine Andrzej M. Brzeziński, Barbara Przybył-Hac Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej, Łódź Streszczenie Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej prowadził w 2011r. osiem programów międzylaboratoryjnych i zorganizował 28 różnych sprawdzianów dla 250-1700 uczestników. W ciągu roku opracowano ponad 800 tys. wyników kontrolnych, wśród nich ponad 250 tys. wyników powszechnego programu chemicznego i ponad 300 tys. wyników programu hematologicznego. Ponieważ każdy wynik kontrolny powiązany jest z dodatkowymi co najmniej 10 informacjami, tworzy to ogromną bazę 8-10 milionów danych rocznie, zarządzanie i archiwizacja której stwarza poważne problemy logistyczne i techniczne. Bardzo efektywnie następuje modernizacja wykorzystywanego wyposażenia, głównie analizatorów chemicznych i immunochemicznych analizatorami firm Roche i Siemens oraz analizatorów hematologicznych aparatami firm Sysmex i ABX Horiba. Równolegle poprawia się jakość oznaczeń kontrolnych ponieważ przyjęte dopuszczalne granice błędu są rygorystycznie wąskie, osiągana jest poprawność tylko 92-95% ocenianych wyników. Niewątpliwe trudności powoduje występująca czasem bimodalność ocenianych zbiorów, spotykana w wypadku kilku odczynników tego samego producenta dla określonych oznaczeń, zmianą producenta odczynników dla określonego analizatora albo wprowadzane udoskonalenia metod czy aparatury nie wykorzystywane przez użytkowników programów. Niestety uległ zahamowaniu proces elektronicznego przekazu danych między uczestnikami, a organizatorami sprawdzianów z powodu wprowadzonej blokady etatów, uniemożliwiającej zatrudnienie drugiego informatyka. W programach w których taka forma łączności została wprowadzona, czas między wykonaniem oznaczeń kontrolnych a otrzymaniem ocen uzyskanych wyników uległ kilkukrotnemu skróceniu. Summary Polish Centre for Quality Assessment in Laboratory Medicine realised during year 2012 eight various EQA programmes and organised 28 different surveys for 250-1700 users. During the year more than 800 000 control results were evaluated, among them over 250 thousands results in general chemistry programme (27 constituents, our surveys a year with two different samples each) and over 300 thousands for basic haematological programme. As each control result is connected with at least 8-10 additional information, it creates a countless number of 8-10 millions of datas per year the management and archiving of such huge amount of information creates a serious logistic and technical question. Very impressive is efficient modernisation, mainly chemical and immunochemical analysers from Roche and Siemens as well as haematological analysers from Sysmex and Horiba. The quality of control results increase too as the allowable error limits are rather narrow, the percentage of acceptable control results only 92-95 per cent are archived. Besides technical also essential progress is observed N-terminal atrial natriuretic peptide is very spectacular example (2008 32, 2009 60, 2010 97, 2011 109 labs). Some problems are created with bimodal distribution of results, connected from time to time with different reagents for the same method and analyser, with change the producer of reagents, with introducing new improvement of method or equipment or contrary to the producers rules of exploitation of analysers. Unfortunately extremely useful process of electronic connection between programme users and organisers has stopped, as the Centre cannot obtain the possibility to employ an additional professional worker. For programmes in which such improvement has been realised the time between estimation of control samples and obtainment of results appreciation has been shortened several times. 127

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... Słowa kluczowe: sprawdziany międzylaboratoryjne, ocena wyników kontrolnych, rozkład wyników kontrolnych, elektroniczny przekaz danych Key words: interlaboratory surveys, evaluation of control results, distribution of control results, electronic data transfer Wstęp Niepostrzeżenie minął jubileusz 30 lat realizacji sztandarowego (ale nie najstarszego!) programu sprawdzianów międzylaboratoryjnych powszechnego programu chemicznego (1981-2011). W pierwszym sprawdzianie, obejmującym tylko 10 podstawowych składników chemicznych, uczestniczyło blisko 1200 laboratoriów, nadsyłając dla dwóch wykorzystanych materiałów niemal 15,5 tys. wyników oznaczeń kontrolnych, z których jako poprawne oceniono zaledwie 59,7% (dla wapnia 42,9%). Była to zupełnie inna epoka, dla większości obecnych pracowników diagnostyki laboratoryjnej czasy antyczne. Gros stosowanych wówczas metod i niemal cała aparatura pomiarowa zostały odesłane do lamusa, a duża część uległa całkowitemu zapomnieniu, np. oznaczanie cholesterolu reakcją Liebermanna i Burcharda z bezwodnikiem kwasu octowego i stęż. kwasem siarkowym (w r. 1981 niemal 100% uczestników), miareczkowe oznaczanie chlorków (78% uczestników) czy refraktometryczne oznaczanie białka (31% uczestników). Aż 64% nadesłanych wyników kontrolnych zostało wyznaczonych własnymi odczynnikami przygotowanymi w laboratorium wykonawcy (!), a ponad 50% - wykorzystując własne wzorce i kalibratory. Paradoksalnie ocena wyników kontrolnych była wówczas znacznie łatwiejsza. Sprzyjała temu duża unifikacja metod i aparatury pomiarowej 93% wyników 5 podstawowych składników chemicznych oznaczanych kolorymetrycznie wyznaczonych zostało spektrofotometrami Spekol (NRD). Dodatkowo proste metody manualne są znacznie mniej wrażliwe na efekt podłoża, niż nowoczesne, wysoce skomplikowane analizatory, wykorzystujące bardzo uproszczone metody (najchętniej jednoodczynnikowe) o wysokiej czułości. Jeszcze w r. 2011 wśród 12874 wartości kontrolnych wyznaczonych manualnie ap. Epoll jako poprawne vs Xog. oceniono 78,2% nadesłanych wyników, a vs średnie systemowe 82,1% (Δ = 3,9%), a dla 2139 wyników wyznaczonych ap. Pointe 180 zaledwie Δ = 2,0%! Z nowoczesnymi, w pełni zautomatyzowanymi analizatorami sytuacja jest odmienna. Poza formalnie łatwym do wytłumaczenia przykładem ap. Vitros (Δ = 38,1%), różnica w odsetku wyników poprawnych vs średnie ogólne, a średnie systemowe wynosiła w r. 2011 dla ap. Dimension 18,6%, dla ap. AU Beckman Coulter (d. Olympus) 15,7%. a dla ap. Architect 13,6% (tab. III). Nie ułatwia to oceny porównawczej wyników kontrolnych. Zgodnie ze standardami wdrożonymi rozporządzeniem Ministra Zdrowia z dn. 23 marca 2006 r. (Dz.U. Nr 61 poz.435) wraz z modyfikacjami z dn. 29 stycznia 2009r. (Dz.U. Nr 22 poz. 128), w organizowanych przez Centralny Ośrodek programach sprawdzianów powinny uczestniczyć wszystkie działające w kraju medyczne laboratoria diagnostyczne (MLD). Aczkolwiek nie podano, kto i jak weryfikuje praktyczne wdrażanie tych standardów oraz czy grożą jakiekolwiek sankcje za niepodporządkowanie się rozporządzeniom, wydaje się, że ogromna większość laboratoriów (wszystkie?) już wcześniej nawiązała współpracę z Centralnym Ośrodkiem. Było to tym łatwiejsze, że choć formalnie laboratoria powinny włączyć do oceny wszystkie oznaczenia objęte programami Centralnego Ośrodka, to w praktyce jest to nie do wyegzekwowania laboratoria same decydują, czy i jakie składniki poddają ocenie. Dodatkową zachętą może być fakt, że błędne wyniki oznaczeń kontrolnych nie grożą żadnymi konsekwencjami zgodnie ze standardem istotne jest samo uczestnictwo czyli odesłanie wyników. Brak zresztą sankcji także za nieodesłanie wyników, a więc zmarnowanie częstokroć kosztownych materiałów kontrolnych, dostarczanych nieodpłatnie przez Centralny Ośrodek (z budżetu Ministerstwa Zdrowia). Sporadycznie, najczęściej w sprawdzianach hematologicznych, po ewent. monitach o fakcie nieodesłania wyników informowani są specjaliści wojewódzcy ds. diagnostyki laboratoryjnej, ale ich obowiązki są odmienne, a możliwości reakcji także bardzo ograniczone. W r. 2011 w ramach prowadzonych przez Centralny Ośrodek działań realizowano 8 różnych programów międzylaboratoryjnej oceny wyników, organizując 28 sprawdzianów dla 251-1676 uczestników i oceniając ponad 800 tys. nadesłanych wyników oznaczeń kontrolnych (tab.i). Ponieważ każdy wynik kontrolny związany jest z co najmniej 10 informacjami dodatkowymi, tworzy to co roku ogromną bazę 8-10 milionów danych. Sprawne zarządzanie tą bazą stwarza bardzo poważny problem logistyczny, a nawet techniczny. Uczestnicy programów Zestawienie laboratoriów współpracujących z Centralnym Ośrodkiem w ramach podstawowego powszechnego programu chemicznego podano w tab. II. Wielokroć już podkreślano, że wdrożona w 1976 r. kategoryzacja laboratoriów na 5 pionów organizacyjnych (nawet z wprowadzonymi modyfikacjami), a zwłaszcza na 4 klasy wielkości zależnie od liczebności zatrudnionego personelu fachowego jest anachronizmem, całkowicie nieadekwatnym do aktualnych standardów organizacji i pracy brak jednak innego podziału. W tabeli podano liczebność 20 podgrup laboratoriów. W wierszu górnym każdego pola po stronie prawej podano przeciętną liczbę badań (z ocenianych 27) oznaczanych przez laboratoria danej podgrupy, a w wierszu dolnym średnią punktową ocenę regularności nadesłanych oznaczeń kontrolnych, uzależnioną od liczby zaliczonych w ciągu roku sprawdzianów dla poszczególnych oznaczeń. Skala ocen od 5 pkt. (dla ocenianego składnika zaliczone wszystkie 4 sprawdziany czyli nadesłano komplet 8 wyników uznanych za poprawne) do 0 pkt. (oceniany składnik w żadnym z 4 sprawdzianów nie został zaliczony ). W tabeli podano 128

Tabela I Realizowane w r. 2011 programy sprawdzianów. Podano nazwę programu, liczbę sprawdzianów w ciągu roku, liczbę wykorzystywanych równolegle materiałów kontrolnych, liczbę ocenianych składników, liczbę uczestników programu i liczbę uzyskanych w 2011 r. wyników. Nazwa Programu sprawdz w roku n mat. kontr. n ocen. składn. n uczest. n wyników w roku Powszechny Chemiczny 4 2 27 1678 252353 Centralny Chemiczny 12 2 27 251 147522 Podstawowy Immunochemiczny 2 2 6 875 12249 Poszerzony Immunochemiczny 2 2 32 603 32807 Markery kardiologiczne 2 2 9 451 5461 RKZ 2 3 9 824 22756 Hematologia 2 2 15 1660 311043 Koagulologia 2 2 5 1338 19066 Suma 803257 Tabela II A - Charakterystyka laboratoriów uczestniczących w powszechnym programie chemicznym w r. 2011. W każdym polu podano: w wierszu górnym liczby laboratoriów danej grupy i przeciętną liczbę wykonywanych badań (z ocenianych 27), w wierszu dolnym przeciętną punktową ocenę regularności oraz literowy symbol grupy. B - Charakterystyka wielkości merytorycznej laboratoriów. Podano: liczbę oznaczanych składników, liczbę laboratoriów i przeciętną ocenę punktową regularności. A B rodzaj b.małe średnie duże b.duże n n ± laboratoriów 1-3 pkt./ 4-10 prac.fach. 11-24 prac.fach. 25 prac.fach. razem ozn. lab. prac.fach. ozn. akademickie 3 ±15,3 8 ±19,6 21 ±21,8 24 ±24,1 56 ±22,1 1-3 24 2,830 A 3,935 B 4,529 C 4,581 D 4,654 4,584 4-6 29 3,253 publiczne 30 ±15,2 106 ±20,0 220 ±22,8 88 ±24,1 444 ±21,9 7-9 60 3,844 leczn.zamkn. E 4,409 F 4,284 G 4,612 H 4,650 4,539 10-12 163 4,008 publiczne 108 ±13,0 79 ±16,9 26 ±19,2 6 ±13,8 219 ±15,2 13-15 166 4,101 leczn.otwarte I 3,891 J 4,402 K 4,647 L 4,675 4,229 16-18 211 4,162 niepubliczne 10 ±12,7 85 ±20,3 102 ±22,6 17 ±24,4 214 ±21,4 19-20 217 4,250 leczn.zamkn. M 3,906 N 4,385 O 4,612 P 4,708 4,516 21 177 4,363 niepubliczne 360 ±15,3 334 ±18,7 45 ±22,8 6 ±24,7 745 ±17,4 22 140 4,340 leczn.otwarte R 4,002 S 4,279 T 4,648 U 4,730 4,195 23 174 4,438 razem 511 ±14,8 612 ±18,9 414 ±22,5 141 ±23,7 1678 ±19,0 24 216 4,524 4,003 4,313 4,616 4,662 4,365 25 136 4,591 dodatkowe 79 ±17,1 26 41 4,521 aparaty X, Y 3,644 27 3 4,728 1757 ±18,9 4,336 Σ 1757 4,336 średnie oceny punktowe regularności oznaczeń (przyjęte za miarę jakości) zbiorczo dla wszystkich 27 składników oznaczonych przez laboratoria odpowiedniej podgrupy, pionu czy klasy wielkości. Jak wynika z tabeli, punktowa ocena regularności zależy przede wszystkim od wielkości ocenianych laboratoriów od średnio 4,003 pkt. dla grupy 511 laboratoriów małych, zatrudniających do 3 pracowników fachowych aż po 4,662 pkt. dla stosunkowo mało licznych (141 = 8,4% ogółu) placówek bardzo dużych ( 25 prac. fach.). Nawet pozornie oczywista wyższa regularność oznaczeń uzyskana przez 56 laboratoriów akademickich w stosunku do 745 niepublicznych laboratoriów ambulatoryjnych (odpowiednio 4,584 pkt. i 4,195 pkt.) może częściowo wynikać z faktu, że wśród placówek akademickich ponad 80% stanowią placówki duże i bardzo duże, a wśród niepublicznych laboratoriów otwartej opieki zdrowotnej aż 93% to placówki małe lub co najwyżej średnie (4-10 prac. fach.). Jeszcze wyraźniej zależność ta zaznacza się przy merytorycznej ocenie wielkości laboratoriów, tj. zależnie od liczby ocenianych oznaczeń (z możliwych 27) część B tab.ii. Współczynnik regularności waha się od średnio 2,83 pkt. dla grupy 24 laboratoriów oznaczających zaledwie 1-3 składniki aż po średnio 4,73 pkt. dla pojedynczych (zaledwie 3) laboratoriów oznaczających wszystkie 27 składniki. Różnica jest ewidentna i znacząca współczynnik korelacji między liczbą ocenianych składników, a punktową oceną regularności r = 0,9415. Oczywiście wielkość laboratoriów wpływa na poprawność wyznaczanych wartości kontrolnych pośrednio poprzez odmienną organizację pracy, stosowane metody, zróżnicowanie kwalifikacji zatrudnionego personelu, a przede wszystkim poprzez wykorzystywane wyposażenie. Przyjęcie za syntetyczną miarę jakości oznaczeń kontrolnych współczynnika regularności jest zdecydowanie kontestowane przez część uczestników programu powszechnego. Kwestionowane jest ocenianie wyłącznie informacji pozytywnych nie nadesłanie wyników, a nawet wycofanie 129

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... przez organizatorów części oznaczeń automatycznie potencjalnie obniża możliwą do uzyskania ocenę. Pewnym usprawiedliwieniem organizatorów jest fakt, że stwarza to szansę wymuszania od uczestników terminowego odsyłania wyników oznaczeń kontrolnych. Dodatkowo opracowywane na koniec każdego roku cenzurki informacje z oceną wszystkich oznaczeń objętych przez poszczególnych uczestników powszechnym programem chemicznym nie mają żadnego znaczenia prawnego (administracyjnego), a wyłącznie względy ambicjonalne (niewątpliwie bardzo istotne!). Należy żałować, że podobnych systemów ocen zbiorczych nie opracowano dla innych programów sprawdzianów realizowanych przez Centralny Ośrodek. Wynika to zarówno z braku powszechnie uzgodnionych dopuszczalnych granic błędów, jak i zbyt małej liczby sprawdzianów/oznaczeń kontrolnych w ciągu roku. Od wprowadzenia w powszechnym programie chemicznym wskaźnika regularności wyników ulega on systematycznej poprawie od 3,791 pkt. w r. 2001 do 4,365 pkt. w r. 2011. Zmiana jest niewątpliwie znacząca, choć trudno ocenić, w jakiej części spowodowana jest prowadzonymi programami sprawdzianów, a w jakiej bardzo istotnymi zmianami organizacji, a zwłaszcza wyposażenia laboratoriów. W ciągu ostatniej dekady liczba uczestników powszechnego programu chemicznego (obejmującego wszystkie MLD) początkowo rosła, osiągając w r. 2007 liczbę 1816 placówek, a obecnie ulega powolnemu spadkowi. W stosunku do roku poprzedniego w r. 2011 liczba uczestników zmniejszyła się o 18 placówek (z 1696 do 1678, tj. -1,1%), kosztem przede wszystkim placówek małych (-15 placówek) i średnich (-7 placówek). Jest to zjawisko korzystne. Aczkolwiek teoretycznie może to ograniczać dostępność badań, chyba celowa byłaby likwidacja wielu małych placówek, wyraźnie niedoinwestowanych, o ograniczonym profilu badań i wysoce dyskusyjnej jakości świadczonych usług. Po okresie bardzo burzliwej prywatyzacji (r.1995 5,6%, r. 2000 21%, r. 2010 55% uczestników programu to placówki niepubliczne) obecnie zmiany są już nieznaczne. W ciągu ostatniego roku udział laboratoriów niepublicznych wzrósł zaledwie o 1,6%, do 57% ogółu MLD. Zakres ocenianych badań Ograniczenia finansowe uniemożliwiły wysoce celowe poszerzenie wachlarza ocenianych składników. Dotyczy to nawet postulowanej także przez Polskie Towarzystwo Diabetologiczne oceny oznaczeń hemoglobiny glikowanej, tak istotnej w kontroli przebiegu cukrzycy. Jedyną możliwością rozwoju było poszerzenie profilu oznaczeń ocenianych w obecnie wykorzystywanych materiałach kontrolnych, a więc bez dodatkowych nakładów. W r. 2011 programy chemiczne poszerzono o ocenę stężenia albumin oraz aktywności lipazy, z czego wyjściowo skorzystało odpowiednio 675 i 228 laboratoriów. W programie immunochemii poszerzonej zwiększono liczbę uczestników z 500 do 600 laboratoriów, jednocześnie obejmując oceną oznaczenia parathormonu (PTH) 140 uczestników oraz insuliny 96 uczestników. Niestety wymusiło to zmniejszenie liczby równolegle ocenianych materiałów kontrolnych z 3 do 2. Zakupione w drodze przetargu materiały kontrolne do sprawdzianu hematologicznego Jesień 2011 ze szwedzkiej firmy Boule Medical AB umożliwiały ocenę różnicową krwinek białych met. 3 diff. Stwarzając istotne kłopoty organizatorom, mimo stosownej informacji część laboratoriów przesłało wyniki posługując się aparatami 5 diff, oczywiście błędne. Dodatkowo okazało się, że niektórymi aparatami 5 diff (Cell Dyn Ruby i Advia 120, 2120) w materiałach tych występują istotne trudności z oznaczaniem krwinek płytkowych i krwinek białych, co spowodowało wyeliminowanie tych oznaczeń przy ocenie ww aparatów. Jest to przykład niekorzystnych skutków wymuszonego, choć pozornie celowego i uzasadnionego podporządkowania się ustawie o zamówieniach publicznych. Aparatura pomiarowa Ocena wykorzystywanej aparatury pomiarowej jest bardzo utrudniona przez jej ogromne zróżnicowanie. W przygotowanym przez Centralny Ośrodek Przewodniku... przewidziano aż 70 grup/modeli analizatorów biochemicznych, 35 fotometrów/spektrofotometrów, 45 analizatorów ISE i rkz, 40 koagulometrów czy ponad 60 liczników i analizatorów hematologicznych. Powoduje to ogromne rozproszenie nadsyłanych wyników kontrolnych na nadmierną liczbę odrębnych podgrup, co bardzo utrudnia ocenę i porównania. Trudno też ocenić, czy podziały te są w pełni uzasadnione. Wymagałoby to dogłębnej znajomości każdego modelu, co przy co najmniej powściągliwej pomocy ze strony producentów/dostawców nie jest możliwe. Niewiele pomaga doświadczenie brak różnic między analizatorami w wyznaczanych wartościach nawet w kilku stabilizowanych materiałach kontrolnych nie gwarantuje, czy nie wystąpią one w kolejnym, o odpowiednio ukształtowanym efekcie podłoża. Wszelkie uwagi i pomoc zarówno producentów/dystrybutorów aparatury jak i użytkowników są dla organizatorów sprawdzianów wyjątkowo cenne. Kontynuowana jest intensywna wymiana wykorzystywanej aparatury. Znajduje to odzwierciedlenie w liczbie oznaczeń kontrolnych, uzyskiwanych poszczególnymi systemami analitycznymi. Tylko w stosunku do ubiegłego roku w powszechnym programie chemicznym wzrosła liczba wyników kontrolnych wyznaczonych aparatami Cobas c501 (platforma Cobas 6000) o 26,4% (z 8730 do 11033), ap. Cobas Integra o 18% (z 41109 do 48428), a przeznaczonymi do mniejszych pracowni analizatorami Mindray BS nawet o 82% (z 4029 do 7315 wyników), oczywiście kosztem innych, wycofywanych już aparatów. Na ryc. 1 zestawiono liczebność wybranych popularnych aparatów, wykorzystywanych przez uczestników powszechnego programu chemicznego w r. 2006 i 2011. W ciągu 5 lat liczba wykorzystywanych analizatorów biochemicznych wzrosłą o 28% (z 1103 szt. do 1413 szt.), natomiast bardzo radykalnie zmniejszyła się liczba prostych 130

Rycina 1 Zmiany aparatury w laboratoriach uczestniczących w powszechnym programie chemicznym dla 26 aparatów graficznie i liczbowo przedstawiono dane z r.2006 i 2011. fotometrów/spektrofotometrów wykorzystywanych przy posługiwaniu się techniką manualną, z 1124 szt. do zaledwie 266 szt. (-76%). Wyraźne zmiany dotyczą dużych analizatorów (porównano lata 2006 i 2011), np. Cobas Integra (134 299 szt.) czy nowy Cobas c501 wykorzystywany w platformie Cobas 6000 (0 62 szt.). Jeszcze wyraźniejsze są zmiany analizatorów mniejszych, o ograniczonym profilu i liczbie wykonywanych oznaczeń. Dobrym przykładem mogą być aparaty A15/A25 f-my BioSystems (22 143 szt., wzrost 6,5-krotny), Mindray (6 61 szt.), Metrolab (0 53 szt.) czy Pentra 400 (14 58 szt.). Jednocześnie efektywnie wycofywane są małe, proste analizatory sprzed 15-20 laty, pracujące w systemie otwartym, jak np. Express (83 7 szt.), Alcyon (48 3 szt.) czy Cobas Mira (107 34 szt.). Jeszcze wyraźniejsze spadki dotyczą prostych spektrofotometrów, np. aparatów Epoll (497 110 szt.) czy aparatów firmy Marcel (174 53 szt.). Dla analizatorów immunochemicznych trudniej jest wykazać zmiany, ponieważ w r. 2011 zwiększono liczbę użytkowników programu z 500 do 600 laboratoriów, jednak wyraźnie zmniejsza się liczba eksploatowanych analizatorów AxSym, Access czy Immulite. Rośnie liczba nowych analizatorów, jak Architect f-my Abbott (19 62 szt.), Centaur f-my Siemens (23 39 szt.), a przede wszystkim ap. Cobas e601 (0 63 szt.) czy Elecsys wraz z Cobasem e411 (137 219 szt.). Wśród analizatorów hematologicznych zwraca uwagę zamiana analizatorów 3 diff. na 5 diff. np. wśród najpopularniejszych chyba analizatorów f-my Sysmex w ciągu 5 lat odpowiednio 513 435 ap. i 146 374 ap. Pojawiły się nowe analizatory, jak Cell Dyn Ruby, Cell Dyn Emerald czy rozprowadzane przez kilka firm ap. Mindray, przede wszystkim 3 diff. Zmiany częściowo są kamuflowane ubytkami dotychczasowej aparatury. Przykładowo w ciągu 5 lat liczba wykorzystywanych analizatorów ISE/rkz f-my Roche zwiększyła się zaledwie o 10% (z 268 do 294 szt.), ale nowego analizatora rkz Cobas b121, b221 aż 7-krotnie (z 35 do 243 szt.!). Odczynniki Równie duże jak aparatury jest w Polsce zróżnicowanie wykorzystywanych odczynników. W podstawowym powszechnym programie chemicznym Jesienią 2011 uczestnicy wykorzystywali odczynniki dostarczone przez 58 firm producentów/dystrybutorów. Być może część zgłoszeń jest efektem częstych pomyłek odczynnikami aż 18 firm wykonano poniżej 0,05% oznaczeń kontrolnych, a dalszych 6 firm poniżej 0,1%. Najczęściej wykorzystywanych dostawców zestawiono w tab.iii część A. Należy przypomnieć, że wszystkie podawane informacje dotyczą wyłącznie oznaczeń kontrolnych, wykonywanych w bardzo zbliżonej liczbie przez wszystkich użytkowników poszczególnych programów niezależnie od wielkości laboratorium (i automatycznie liczby oznaczeń rutynowych, decydujących o pozycji firmy na rynku). Duże zróżnicowanie dostawców jest być może korzystne ze względów handlowo-ekonomiczno-przetargowych, ale zdecydowanie utrudnia ocenę wyników. Ocena wyników Nie dysponując materiałami kontrolnymi z wyznaczonymi a priori wartościami definitywnymi/referencyjnymi, z konieczności do oceny wykorzystuje się wartości umownie należne, będące pochodnymi (średnimi korygowanymi) wyników uczestników poszczególnych sprawdzianów. Wiarygodność tych wartości zależy od zbieżności warunków wyznaczania wyników kontrolnych, prowadząc do kilku stopni wiarygodności średnie ogólne (z wszystkich nadesłanych wyników, najmniej wiarygodne), średnie metodyczne, średnie metodyczno-aparaturowe i średnie metodyczno-aparaturowo-odczynnikowe (systemowe). Równie istotna jest dyspersja oraz liczebność wyników będących podstawą oceny zbioru. Nadmierną dyspersję ogranicza się eliminując tzw. outliers (wyniki najbardziej odstające) na drodze oceny wizualnej zbiorów oraz reguły 2 2s, natomiast minimalną liczebność zbiorów ustalono arbitralnie na n 6. Jest to zdecydowanie za mało, ale jest kompromisem między potrzebami, a możliwościami. Bardzo duże zróżnicowanie wykorzystywanych aparatów 131

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... Tabela III Sprawdzian powszechny Jesień 2011, sur. 6 - liczba i procent oznaczeń oraz % oznaczeń homogennych w seriach n 6 (klasyfikowanych vs Xsystemowego). A - wg producentów/dystrybutorów odczynników, B - wg wybranych aparatów. % kla- % kla- % klasyfi- A n oznaczeczewanych Aparat czeń czeń c.d. czeń czeń wanych % oznasyfiko- B n ozna- % ozna- Aparat n ozna- % oznasyfikokowanych Odczynnik n>=6 n>=6 n>=6 Ogółem 31426 100% 83,2 Vitros 996 3,2% 99,9 Accent 1384 4,4% 91,6 Roche 8797 27,99% 97,6 C.Integra 6211 19,8% 99,9 MetroLab 826 2,6% 90,0 BioSystems 3406 10,84% 83,8 C.c501 1431 4,6% 99,7 Epoll 1549 4,9% 79,0 Cormay 2588 8,24% 89,1 Olympus 1659 5,3% 98,2 Airone 200 0,6% 77,5 BioMaxima 1750 5,57% 66,0 Pentra 1113 3,5% 98,1 Mindray 1019 3,2% 74,4 Olympus 1633 5,20% 99,8 Architect 754 2,4% 96,3 Hitachi 479 1,5% 65,1 AlphaDiagnostics 1605 5,11% 76,6 WienerLab 316 1,0% 96,2 Lumen 259 0,8% 60,6 Thermo/Kone 1557 4,95% 97,9 BioSystems 2163 6,9% 95,8 Pointe 318 1,0% 59,7 Emapol 1103 3,51% 32,8 Konelab 2038 6,5% 93,1 BTS 178 0,6% 51,1 abxhoriba 1093 3,48% 99,9 Prestige 540 1,7% 93,0 Flexor 732 2,3% 48,1 OrthoClin.Diag. 1088 3,46% 91,5 Erba XL 412 1,3% 92,7 Marcel 680 2,2% 35,9 Siemens 834 2,65% 88,6 Dimension 828 2,6% 92,0 C.Mira 541 1,7% 31,8 Siemens/Dade 767 2,44% 99,3 Advia 567 1,8% 91,9 StatFax 146 0,5% 0,0 i odczynników warunkuje, że zwłaszcza wykorzystując mniej popularne analizatory możliwości stworzenia homogennych, najkorzystniejszych grup tj. metodyczno-aparaturowo-odczynnikowych są bardzo ograniczone. Obecnie z możliwości takiej oceny wyeliminowanych jest około 20% (a więc co piąty!) nadsyłany wynik kontrolny. Gdyby minimalną liczebność homogennego zbioru zwiększyć do uzasadnionego n 20, to z oceny wyeliminowany byłby co trzeci nadsyłany wynik kontrolny. Oczywiście pozostaje ocena względem średnich metodyczno-aparaturowych, a w przypadku mało popularnych aparatów średnich metodycznych, ale oceny te są coraz mniej korzystne. W tab.iii zestawiono na podstawie wyników jednej surowicy w sprawdzianie Jesień 2011 liczby oznaczeń odczynnikami 12 najczęściej wykorzystywanych firm producentów/dystrybutorów (część A) oraz wykonane 26 modelami skrajnie różnych w ocenie aparatów (część B). Podano liczbę nadesłanych wartości i ich procentowy udział wśród wszystkich ocenianych wyników (31 426) oraz odsetek wyników, które mogły zostać ocenione vs średnie systemowe przy n 6. Ryc.2 przedstawia te same dane w formie graficznej. Część firm zabezpiecza odczynniki praktycznie tylko do swoich aparatów (Roche, Beckman Coulter, abx Horiba, Siemens i oczywiście Ortho Clinical Diagnostics), natomiast kilka (α-diagnostics, Emapol, BioMaxima) dostarcza odczynniki wykorzystywane z wielu różnymi, mniej popularnymi aparatami. Automatycznie rozproszenie wyznaczanych wartości jest bardzo duże, a możliwości współtworzenia średnich metodyczno-aparaturowo-odczynnikowych bardzo ograniczone. Przykładowo wartości glukozy wyznaczano odczynnikami f-my Emapol 75 aparatami 28 modeli Rycina 2 Graficzna ilustracja tab.iii. Dla najczęściej wykorzystywanych odczynników i wybranych aparatów przedstawiono odsetek wyników, które mogą być ocenione vs średnie systemowe przy n 6. 132

(z tego tylko 37 wyników przy n 6), odczynnikami f-my α-diagnostics 92 aparatami 15 modeli (75 wyników przy n 6), a odczynnikami f-my BioMaxima 109 aparatami 24 modeli (z tego 70,6% wyników przy n 6). Łatwo wyliczyć, że pozostałe wyniki wyznaczono pojedynczymi często egzemplarzami szerokiego spektrum aparatów. O możliwościach oceny vs średnie systemowe decyduje liczba oznaczeń i zróżnicowanie odczynników. W analizowanym sprawdzianie Jesień 2011 trzema modelami aparatów uzyskano zbliżoną liczbę wyników kontrolnych 76 ap. AU Beckman Coulter d. Olympus (1659 wyników), 110 ap. Epoll (1549 wyników) i 62 ap. Cobas c501 (1431 wyników). Z aparatami Cobas c501 wykorzystywano wyłącznie odczynniki firmy Roche, a więc wszystkie wyniki (99,7% - sporadycznie nie podano pochodzenia odczynników) mogły być ocenione względem średnich systemowych zarówno przy n 6, jak i n 20. Zbliżona jest możliwość oceny oznaczeń ap.au Beckman Coulter d. Olympus, również w zasadzie wykorzystujących firmowe odczynniki (choć jedno z 76 laboratoriów konsekwentnie wykorzystuje odczynniki f-my α-diagnostics, co eliminuje te wyniki z oceny względem średnie systemowe, a w efekcie objęcie tą oceną tylko 98,2% nadesłanych także przy n 6, jak i n 20). Użytkownicy ap. Epoll zgłaszają korzystanie z odczynników aż 15 dostawców (choć produktami 4 firm wyznaczono 79,7% ocenianych wartości), co spowodowało, że homogennymi zbiorami systemowymi o liczebności 6 można było objąć 79% wyników (a przy ewent. liczebności 20 tylko 32% wyników). Jeszcze mniej korzystna jest ocena wyników wyznaczonych 34 ap. Cobas Mira znacznie mniejsza liczba wyników kontrolnych (w ocenianej surowicy tylko 541) przy wykorzystywaniu odczynników od 12 dostawców warunkuje, że zbiory systemowe o n 6 objęły tylko co trzeci nadesłany wynik (31,8%), bez możliwości stworzenia choćby pojedynczego zbioru o n 20. Dane te stanowią uzasadnienie minimalizacji wymagań. Pocieszająca jest postępująca korzystna eliminacja najmniej popularnych firm. Jeżeli w stosunku do średnich systemowych przy n 6 można było objąć oceną w r.2005 tylko 67,8% nadesłanych wyników kontrolnych, to w r.2007 71,3%, w r.2009 74%, a w r.2011 już 80%. Jak istotne znaczenie dla wyznaczonych wartości kontrolnych mogą mieć poza metodą i ewent. aparatem także odczynniki, obrazuje kilka przykładów przedstawionych na ryc. 3. Oczywiście zaobserwowane różnice dotyczą tylko części materiałów kontrolnych (nie do wcześniejszego przewidzenia) i najczęściej nie dotyczą pozbawionych efektu podłoża świeżych próbek rutynowych (choć Centralny Ośrodek nie może tego zweryfikować). Warunkiem poprawnej oceny nadsyłanych wyników jest unimodalność i symetryczność zbiorów będących podstawą oceny, stąd starania o łączenie wyników wyznaczonych w maksymalnie zbliżonych warunkach metoda, aparat, odczynniki. Na ryc. 3A przedstawiono wyniki oznaczeń żelaza met. 2 z ferenems 29 aparatami Architect. W przedstawianej surowicy nr 3 (a także nr 4) uzyskano zbiory o bardzo dużej dyspersji. Współczynnik zmienności rzędu 36% był dla dobrego, nowoczesnego analizatora absolutnie nie do przyjęcia, powodował zresztą znikomą poprawność wyników. Wykazano bimodalność zbiorów, z firmy uzyskano informację o wprowadzaniu nowego odczynnika od innego producenta (bez zmiany metody). Przedstawicielstwo firmy Abbott ustaliło, który odczynnik wykorzystywali poszczególni użytkownicy ap. Architect. W efekcie wyznaczono dwie subpopulacje wyników istotnie różniących się ocenianymi wartościami, a uwzględnienie tych różnic zdecydowanie poprawiło ocenę poprawności tego składnika. Warto podkreślić zaangażowanie firmy w wyjaśnienie przyczyn złej oceny wyników wyznaczonych ich aparatami co niestety nie jest regułą. Zbliżoną sytuację zauważono dla oznaczeń bilirubiny aparatami Dimension (ryc. 3B). Aczkolwiek w sprawdzianie Jesień 2011 wystąpiły kłopoty ogółu laboratoriów posługujących się met. Jendrassika z kofeiną, to wśród użytkowników ap. Dimension (i firmowych odczynników) trudności były szczególnie nasilone. W surowicy nr 8 część użytkowników wyznaczyła dla bilirubiny wartości zerowe bądź bardzo niskie, a część ponad 3 mg/dl. Udało się ustalić, że różnice te są związane z wykorzystywanymi odczynnikami odczynnikiem nr kat. DF67A oznaczeń praktycznie nie można było wykonać (dlaczego?), natomiast odczynnikiem nr kat. DF167 wyznaczono skupiony zbiór wartości zbliżonych do uzyskanych innymi metodami. W sprawdzianie immunochemii poszerzonej oznaczając estradiol ap. Advia Centaur uzyskano zależnie od wykorzystanych odczynników zdecydowanie różne wartości (ryc. 3C). W programie kardiologicznym przy oznaczaniu Troponiny I ap. Dimension wykorzystywane są aż trzy różne odczynniki, które dla wszystkich czterech surowic wykorzystanych w r. 2011 dały zróżnicowane wyniki jednym odczynnikiem (nr kat. RF621) wyznaczano wartości 3-4 razy wyższe, niż pozostałymi dwoma (RF421 i RF521) niestety zbyt mała liczba oznaczeń wykonanych dwoma odczynnikami (po 3) uniemożliwiła wydzielenie odrębnych podgrup, co bardzo niekorzystnie odbiło się na ocenie wszystkich wyników względem średniej systemowej. Nie zawsze udaje się ustalić przyczynę występujących trudności. Na ryc.3 E przedstawiono wyniki oznaczania żelaza (sprawdzian Wiosna 2011 mat.2) aparatami BioSystems A15/A25 i firmowymi odczynnikami. Wysoce niekorzystna ocena uzyskanych wyników wymusiła dalszą ich analizę. Okazało się, że firma BioSystems rozprowadza 3 różne zestawy do oznaczania żelaza met. z ferrozyną (met.1) nr kat. 11509 (104 użytkowników), 14509 (2 użytkowników) i 12509 (13 użytkowników). Dwa pierwsze zestawy są zbliżone, do redukcji żelaza wykorzystując (jak wielu innych producentów) hydroksylaminę, w trzecim zestawie wykorzystywany jest kwas askorbinowy. Do wartości wyznaczonych tym trzecim zestawem nie można mieć zastrzeżeń są zbieżne (wsp. zmienności <6%) i zgodne z wyznaczonymi met. 1 innymi aparatami i odczynnikami. Natomiast rozkład wartości wyznaczonych ap. BioSystems zestawem nr kat. 11509 jest wyraźnie bimodalny poniżej połowy stanowią wartości prawidłowe, 133

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... Rycina 3 Przykłady zróżnicowania wyników zależnie od wykorzystanego odczynnika. Zestawienie parametrów i wyniki testu Scheffe go * różnice istotne (p < 0,05). A Wiosna 2011 ŻELAZO mat.1 Aparaty Architect oznaczenia odcz. nr kat.7d68 i 6K95. B Jesień 2011 BILIRUBINA mat.2 Aparaty Dimension oznaczenia odcz. nr kat. DF67A i DF167. C Lato 2011 ESTRADIOL mat.3 Aparaty Advia oznaczenia odczynnikami (E2-6III) Revised nr 10490889 oraz Enhanced (ee2) nr 01488773. D 2011r. TROPONINA I ap.dimension Zima i Lato mat.1 i 2 oznaczenia trzema odczynnikami. E Wiosna 2011 ŻELAZO mat.2 Aparaty Biosystem i Erba Diagnostics używające odczynnika 15 o różnych numerach serii. zbliżone do wyznaczanych innymi odczynnikami metodą z ferrozyną i hydroksylaminą (np. α-diagnostics n=21, x =135,1; Cormay n=67, x =139,4; Pointe Scient. n=19, x =145,6; Roche n=262, x =149,9 (s=7,35); BioMaxima n=35, x =156), lecz 54% wyników była o ponad połowę niższa, ok. 65,5 μg/dl. Mimo współpracy firmy nie udało się ustalić przyczyny takiego zaniżenia wyników przez znaczną część laboratoriów (niedostateczna redukcja jonów że- 134

lazowych do żelazawych? dlaczego?) w inkryminowanych materiałach. Jedynym sensownym rozwiązaniem wydawało się wycofanie z oceny wartości żelaza, wyznaczonych w tych materiałach aparatami BioSystems (i bliźniaczymi f-my Erba). Wpłynęło to negatywnie na umowną ocenę roczną (potencjalnie ją obniżając) i wywołało zdecydowany protest części użytkowników. Część uczestników prowadzonych programów dość beztrosko traktuje warunki wyznaczania wartości kontrolnych, bezkrytycznie przepisując je w kolejnych miesiącach i powielając błędne informacje o np. stosowanej metodzie czy wykorzystywanym aparacie (pomylone numery kodowe?). Wymagania odnośnie pochodzenia, a nawet numeru katalogowego wykorzystywanych odczynników traktowane są często jak niepotrzebne, nadmierne wymagania Ośrodka. Przedstawione, może zbyt wyeksponowane przykłady mają zobrazować wagę tych informacji i przekonać wszystkich użytkowników do bezwzględnego, bardzo starannego ich podawania. Powszechny program chemiczny W r. 2011 w ramach czterech sprawdzianów powszechnych wykorzystano 8 surowic kontrolnych, uzyskując dla 27 składników ponad ćwierć miliona oznaczeń kontrolnych (tab. IV). Jest to nieznacznie więcej niż w r. 2010, ponieważ wykorzystując możliwości zakupionych materiałów kontrolnych poszerzono wachlarz ocenianych składników o akt. lipazy i stęż. albumin. Chwilowo liczba laboratoriów oceniających te oznaczenia jest ograniczona (odpowiednio 200 i 620), ale z czasem powinna się zwiększyć. W stosunku do średnich ogólnych (z wszystkich wyników niezależnie od metody), nadesłanych dla poszczególnych składników) jako poprawne zakwalifikowano 80% nadesłanych wartości najwięcej dla akt. AST (91,8%) oraz stęż. cholesterolu (91,3%) i glukozy (91,1%), najmniej dla akt. LDH (zaledwie 1,8%, co oczywiste) i ACP (52%) oraz stęż. magnezu (55,3%). W zasadzie ocena vs średnie ogólne nie jest wykorzystywana, informuje jedynie o ewent. zróżnicowaniu wartości zależnie od stosowanych metod oraz wykorzystywanych aparatów i odczynników. Przy a priori przyjętych sztywnych dopuszczalnych granicach błędów (dgb) ocena zależy od dyspersji, a właściwie skupienia wyznaczanych wartości, co w sprawozdaniach dla uczestników przedstawiane jest graficznie wynik adresata przedstawiony jest na tle zakresu x ± 2s oraz x ± dgb, z zasady węższego. Różnicę między średnimi ogólnymi, a średnimi metodycznymi można przedstawić na przykładzie oznaczeń cholesterolu i glukozy, dwóch podstawowych oznaczeń, dla których różnice te są znikome (odpowiednio 91,3% i 91,6% poprawnych, Δ = 0,3% i 91,1% i 91,9%, Δ = 0,8%) lecz z odmiennych przyczyn. Cholesterol oznaczany jest praktycznie jedną metodą z esterazą i oksydazą cholesterolową (97% oznaczeń; 3% oznaczeń met. suchej fazy). O wartości średnich ogólnych decydują wyniki wyznaczone met. 1, a więc x og = x met. Do oznaczania glukozy wykorzystuje się trzy metody z oksydazą glukozową (63,3% wyników), z heksokinazą (33% wyników) i met. suchej fazy (ok. 3% wyników). Aczkolwiek najczęściej statystycznie można wykazać różnice między wynikami wyznaczonymi tymi trzema metodami, to wynika to przede wszystkim z dużej liczebności zbiorów (1050, 550, 50 wyników) oraz dobrego ich skupienia (małej dyspersji) dla wszystkich metod współczynniki zmienności są z zasady < 4%. Bezwzględne różnice między wartościami wyznaczonymi różnymi metodami są najczęściej umiarkowane w r. 2011 dla 8 wykorzystanych surowic met. z oksydazą glukozy wyznaczono wartości średnio o 2,4% wyższe, niż met. z heksokinazą. Te małe różnice między wartościami wyznaczonymi istotnie różnymi metodami przełożyły się na ich zbliżoną ocenę, a w efekcie małą różnicę przy ocenie vs x og i x met. Dla niektórych oznaczeń różnice te mogą być zdecydowanie większe, co wynika ze zróżnicowania metodycznego, prowadzącego do wyznaczania wyraźnie różnych wartości. Oczywistym przykładem jest oznaczanie akt. LDH zależnie od kierunku reakcji wyznaczone wartości mogą się różnić nawet dwukrotnie, a nieliczne wyniki poprawne są to w rzeczywistości wyniki błędnie usytuowane między dwoma podzbiorami. Znaczne różnice w średnich metodycznych występują przy oznaczaniu akt. lipazy (met. z 1,2-dwuglicerydem prowadzi do o ± 30% wyższych wartości niż met. z estrem kwasu glutarowego), oznaczaniu HDL-Ch czy nawet oznaczaniu sodu. W części materiałów kontrolnych met.1 (ISE bezpośrednie) wyznacza się wartości sodu średnio o 4-8% wyższe niż met.2 ISE pośrednie (a także nielicznymi już ok. 2% oznaczeniami met. fotometrii płomieniowej). Aczkolwiek różnica ta jest logiczna, wynikającą z zawady przestrzennej, to trudno uzasadnić, dlaczego dotyczy tylko części surowic kontrolnych efektem jest jednak wyraźnie różna ocena vs x og i x met. (w r.2011 średnia Δ = 17,4% ± 68,7% vs x og, a 86,1% vs x met., z tego 84,4% dla met. 1, 88,3% dla met. 2 i 93,6% dla met. suchej fazy). Dla niektórych oznaczeń szczególnie duże znaczenie mają wynikające chyba z efektu podłoża (matrix effect) różnice między średnimi metodycznymi a metodyczno-aparaturowymi. Jak wspomniano, dla oznaczeń glukozy, cholesterolu czy amylazy są one niewielkie (< 2,0%), ale dla lipazy (Δ = 14,2%), akt. CK (Δ = 13,6%) czy chlorków (Δ = 13,0%) są znaczące. W przypadku chlorków różnica między ISE bezpośrednim, a ISE pośrednim (± 3%) wynika chyba też z zawady przestrzennej, a przy wąskich dla chlorków dopuszczalnych granicach błędu może mieć znaczące konsekwencje. W sumie dla wszystkich objętych sprawdzianami oznaczeń w stosunku do najkorzystniejszych średnich systemowych najlepiej oceniono wyniki oznaczeń amylazy (97,1% ), lipazy (97,0% ), AST (96,4% ), LDH (96,1% ) i GGT (95,6% ), a więc 5 enzymów najprawdopodobniej przy korzystnych zmianach aparatury pomiarowej należy wyraźnie zawęzić granice dopuszczalnego błędu. Najgorzej oceniane są oznaczenia magnezu (zaledwie 69,5% zbyt rygorystyczne granice błędu?) czy chlorków (77,3% ). Z satysfakcją należy podkreślić, że dla podstawowych oznaczeń diagnostycznych gluko- 135

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... Tabela IV Zestawienie ocen wyników oznaczeń kontrolnych w powszechnym programie sprawdzianów chemicznych w r.2011 zależnie od przyjętych wartości umownie należnych. Jednak duża liczba wyników, zwłaszcza dla liczniejszych aparatów, pozwala na sprecyzowanie orientacyjnych opinii, których domagają się uczestnicy programów tab.v. Poza oceną uzyskanych poszczególnymi aparatami wyników względem czterech układów odniesienia (wartości umownie należnych) podano dodatkową ocenę regularności oznaczeń. Podano odsetek zbiorów wszystkich użytkowników dla oznaczanych składników ocenionych jako bardzo dobre i dobre oraz niezadowalające i złe, a także średnią punktową ocenę regularności. Interpretując przedstawione dane, należy zwrócić uwagę na informację z tab. III odsetka wyników uzyskanych poszczególnymi aparatami/analizatorami, dla których można było przeprowadzić ocenę vs x syst. przy n 6. Dla niektórych aparatów, a raczej aparatów określonych pron n ocenianych wyników i %% poprawnych Ocena regularności oceniany ocen. vs Xog. vs Xmet. vs Xmet-ap. vs Xsystem. % ocen składnik aparat. n wyn. % n wyn. % n wyn. % n wyn. % bdb+db nzd+zła ± pkt. sód 1324 10067 68,7% 10039 86,1% 9255 89,2% 8657 89,5% 78,4% 9,1% 4,100 potas 1328 10100 84,2% 10100 88,4% 9244 92,1% 8644 92,5% 82,9% 6,8% 4,271 wapń 1287 9805 81,3% 9737 83,7% 8593 87,5% 7518 88,9% 84,8% 5,4% 4,367 magnez 1237 9358 55,3% 9334 60,9% 8100 67,2% 7098 69,5% 62,0% 18,8% 3,557 żelazo 1480 11287 83,0% 11267 84,1% 9985 88,5% 8615 90,1% 86,4% 5,0% 4,434 chlorki 828 6152 61,7% 6126 64,2% 5303 77,2% 5036 77,3% 58,0% 18,5% 3,425 fosforany 1002 7606 84,3% 7606 85,2% 6572 89,1% 5731 91,0% 85,9% 6,1% 4,368 osmolalność 60 424 83,7% 424 83,7% 418 83,7% 386 84,2% 70,0% 11,7% 3,933 białko 1433 10920 79,4% 10916 80,8% 9812 86,1% 8390 88,6% 83,3% 7,4% 4,301 mocznik 1662 12723 86,8% 12711 88,9% 11679 91,2% 10241 92,2% 86,5% 5,4% 4,437 kreatynina 1717 13167 76,7% 13149 79,5% 11813 86,0% 10143 88,0% 90,5% 3,9% 4,589 moczany 1626 12480 86,5% 12470 87,1% 11624 89,9% 10102 91,5% 85,1% 5,6% 4,418 glukoza 1733 13292 91,1% 13258 91,9% 12390 93,3% 10804 94,3% 86,4% 5,4% 4,406 bilirubina 1646 12030 80,3% 12012 81,7% 10463 87,7% 9113 89,3% 72,5% 10,6% 3,972 cholesterol 1691 12976 91,3% 12970 91,6% 12322 93,4% 10770 94,3% 85,7% 5,5% 4,419 HDL-Ch 1509 11517 67,6% 11515 83,7% 9632 87,6% 8587 89,9% 82,0% 8,7% 4,262 triglicerydy 1664 12775 86,8% 12765 89,3% 12071 92,3% 10581 93,5% 88,2% 4,6% 4,505 AST 1700 13047 91,8% 13047 92,5% 11953 95,4% 10435 96,4% 91,9% 3,1% 4,653 ALT 1707 13087 89,6% 13087 91,0% 11969 93,4% 10429 94,7% 90,6% 3,6% 4,593 ALP 1332 10141 71,2% 10107 75,4% 9081 87,5% 7780 90,0% 84,8% 5,9% 4,390 AMY 1444 11074 88,4% 11046 94,4% 9738 96,2% 8553 97,1% 89,8% 3,5% 4,572 AcP 53 300 52,0% 292 53,4% 51 80,4% 51 80,4% 17,0% 54,7% 1,906 CK 900 6799 74,8% 6799 76,9% 5901 90,3% 5180 93,7% 82,1% 8,4% 4,303 GGT 1350 10312 89,8% 10304 91,6% 9279 94,1% 7728 95,7% 91,2% 4,4% 4,610 LD 554 4130 1,8% 4130 92,0% 3534 95,6% 3230 96,1% 86,8% 8,1% 4,430 lipaza 228 1653 64,7% 1629 81,0% 1323 95,2% 1221 97,0% 75,4% 15,4% 3,952 albuminy 675 4918 77,9% 4906 79,1% 4416 86,2% 3928 88,4% 76,5% 11,3% 4,084 razem r. 2011 252140 80,0% 251746 85,0% 226521 89,5% 198951 91,0% 83,7% 6,9% 4,336 r. 2010 243574 79,3% 243193 84,9% 216499 89,4% 185944 91,0% 84,8% 6,6% 4,367 r. 2009 242936 81,0% 242596 84,9% 215945 88,3% 181226 90,1% 83,1% 7,6% 4,296 za (cukrzyca), cholesterol (miażdżyca z powikłaniami), AST (uszkodzenie wątroby) nie tylko osiąga się stosunkowo dobrą poprawność vs x syst. (odpowiednio 94,3%, 94,3%, 96,4%), ale niewielkie różnice vs x og świadczą, że wpływ na te oznaczenia stosowanych metod czy wykorzystywanej aparatury i odczynników jest umiarkowany, a uzyskane wyniki powinny być w pełni porównywalne niezależnie od doboru warunków (co jest warunkiem użyteczności sztywnych kryteriów diagnostycznym). Wielokrotnie podkreślano, że Centralny Ośrodek nie prowadzi rankingu metod, aparatury czy odczynników, ponieważ oceniane wyniki wyznaczane są w różnych laboratoriach, w odmiennych warunkach wykonywania oznaczeń (lokalizacja, profesjonalizm, metody, zróżnicowanie odczynników). 136

Tabela V Ocena porównawcza wyników kontrolnych programu powszechnego w r. 2011 zależnie od wykorzystywanej aparatury. Liczebność %% poprawnych Ocena regularności Aparat apar. ozn. ocenian. vs % ocen skład. wyników Xog. Xmet. Xmet-ap X syst. bdb+db nzd+zła ± pkt. Cobas Integra 299 26 48428 87,9 93,6 95,2 95,2 91,2 2,4 4,641 BioSystems A25/15 145 22 17250 81,7 83,4 86,3 86,7 83,9 6,2 4,301 Konelab 96 26 15764 81,4 85,7 90,1 91,6 88,2 5,4 4,492 Accent 200,300 85 21 10699 83,5 84,9 87,4 87,8 85,0 7,3 4,378 Olympus AU 76 25 12924 80,2 86,8 95,8 95,9 89,3 4,1 4,586 Cobas c501 62 25 11033 85,7 93,2 95,9 95,9 97,0 0,8 4,811 Mindray BS 60 20 7315 79,2 81,0 83,2 87,1 82,4 6,4 4,263 Pentra 400 58 25 8398 82,8 86,1 92,1 92,2 87,3 4,3 4,517 Metrolab 57 20 6343 80,2 80,6 82,3 81,9 72,4 12,9 3,939 Vitros 45 25 8095 55,1 93,2 93,2 93,2 91,7 2,4 4,633 Flexor 43 21 5496 75,9 80,4 84,5 91,3 85,6 6,1 4,380 Dimension 41 25 6407 74,5 81,2 92,8 93,1 90,0 3,0 4,547 Architect 34 25 5702 80,9 87,3 93,4 94,5 92,1 3,0 4,657 Cobas Mira 33 21 3986 82,1 82,3 83,6 88,6 75,0 12,9 3,972 Prestige 24,24i 32 21 4231 84,3 85,6 88,5 88,5 80,0 11,2 4,158 Advia 1650,1200 26 25 3676 81,4 84,8 92,1 92,3 84,3 8,2 4,278 Hitachi 9.. 26 25 3617 83,4 86,6 90,1 91,2 89,0 4,9 4,522 Erba XL 22 20 2788 81,3 82,8 86,4 87,2 83,5 7,4 4,278 Lumen, Livia 21 15 1820 84,6 85,3 87,5 89,6 84,6 6,2 4,396 Wiener Lab CB 19 17 1915 77,0 82,4 90,2 90,4 76,1 12,1 4,101 Airone 200 14 15 1272 78,7 79,2 83,1 83,9 66,4 14,9 3,770 Daytona 11 14 944 88,1 87,9 91,0 92,2 86,8 6,2 4,340 Max-Mat PL 10 11 798 80,6 80,9 83,2 83,3 76,0 11,4 3,981 Cobas c311 9 19 660 88,3 93,2 95,9 95,9 84,7 7,1 4,295 Modular P 8 20 960 88,5 91,7 98,4 98,2 97,2 1,4 4,738 Express 6 11 410 80,7 80,9 86,6-72,2 10,0 4,078 Epoll 108 22 12874 78,2 79,6 80,5 82,1 71,2 14,5 3,860 Marcel 52 18 4914 75,0 75,5 77,3 83,5 66,3 15,0 3,694 Pointe 180... 27 18 2139 70,6 70,6 73,6 72,6 59,9 19,5 3,527 BTS-330,370 12 18 1112 77,9 77,4 81,7 84,6 75,7 11,9 4,034 Start Dust MC 15 14 1100 86,6 86,4 90,0 91,5 83,4 6,7 4,352 Stat-fax 1904 10 14 968 71,4 72,1 72,7-64,3 12,1 3,758 AVL seria 9000,900 187 3 3282 73,9 79,6 85,6 85,8 76,3 10,3 4,005 Easy Lyte 184 3 3278 78,2 83,8 87,0 86,9 72,2 14,5 3,822 Rapidchem serii 700 61 3 1341 73,1 80,4 84,3 84,2 72,5 7,1 4,033 Cobas b121,b221 24 3 530 77,6 87,2 87,4 87,4 81,3 4,0 4,187 BM-ISE,BM-ISEnew 26 3 488 70,3 75,0 77,2 77,2 53,3 25,3 3,213 Razem 252353 80,1 85,1 89,6 91,1 83,7 6,9 4,336 137

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... ducentów wymuszających stosowanie odczynników firmowych było to praktycznie 100% wyników (f-my Ortho Clinical Diagnostics, Roche, Beckman Coulter d. Olympus, abx Horiba), ale dla niektórych, a zwłaszcza prostych spektrofotometrów wykorzystujących do metod manualnych odczynniki bardzo zróżnicowane, ocena obejmowała tylko ograniczoną część wyników. Dotyczy to także aparatu Cobas Mira, o którym firma Roche całkowicie zapomniała przy ograniczonej liczbie oznaczeń i bardzo zróżnicowanych odczynnikach oceniony względem średnich systemowych może być zaledwie co trzeci wynik. Na ogół z oceną poprawności vs x syst. skorelowana jest ocena regularności oznaczeń zarówno odsetek ocen bardzo dobrych i dobrych, jak i średni punktowy wskaźnik regularności. Nielicznymi aparatami Modular P wyznaczono zaledwie poniżej 1000 wyników, ale wykorzystując wyłącznie odczynniki fabryczne f-my Roche wszystkie mogły być ocenione, a poprawność vs x syst. wynosiła w r. 2011 98,2% przy 97,2% ocen bardzo dobrych i dobrych regularności i punktowego współczynnika regularności 4,738. Niemal równie korzystne wyniki uzyskano wykorzystywanym głównie w dużych laboratoriach ap. Cobas c501. Wyniki zbiorcze dla poszczególnych województw powszechnego programu chemicznego są co roku przesyłane w postaci dwóch arkuszy ocen właściwym specjalistom wojewódzkim ds. diagnostyki laboratoryjnej. Arkusz A zawiera ocenę poprawności wyników nadesłanych w ciągu roku przez wszystkie laboratoria danego województwa, podając dla każdego składnika i zbiorczo liczbę wyników, liczbę i % wyników ocenionych jako poprawne oraz miejsce uzyskane w rankingu wszystkich województw. Dla ułatwienia oceny obok przedstawione są oceny najlepsze oraz średnie krajowe. Arkusz B to ocena regularności oznaczeń dla każdego składnika i zbiorczo podaje liczbę ocenianych podzbiorów, liczbę i % podzbiorów dla każdej z 5 klas oceny (od bardzo dobrej do złej), podając następnie średni punktowy wskaźnik regularności oraz miejsce zajęte wśród 16 województw. Dla porównania obok w analogicznej formie przedstawione są średnie dane ogólnopolskie. Wyniki arkusza B przedstawiono na ryc. 4, obrazującej graficznie odsetek ocen regularności bardzo dobrej i dobrej oraz niezadowalających i złych. Odsetek ocen bardzo dobrych i dobrych wyraźnie rośnie, od 69,1% w r. 2001 do 84,0% w r. 2011. Jest to oczywiście zjawisko wysoce korzystne, ale jeszcze korzystniejszy jest wyraźny spadek współczynników zmienności (a więc dys- Rycina 4 Graficzne przedstawienie zmian ocen regularności dla zbiorów 16 województw; linia ciągła przedstawia średnią ocenę punktową (skala na prawej osi). persji) kolejnych zbiorów rocznych wyników 16 województw z 9,9% w r. 2001 do 2,3% w r. 2011 i to mimo rosnących wartości średnich. Świadczy to o wyrównywaniu się poziomu świadczonych usług między województwami, a więc o zanikaniu różnic między tzw. Polską A I B (klasyczny podział w danym wypadku nie ma sensu, bo najlepsze od szeregu lat jest położone na ścianie wschodniej województwo podlaskie). Oczywiście analogicznie obniża się odsetek ocen regularności niezadowalającej i złej (z 16,3% do 6,9%), jednak spadek współczynników zmienności zbiorów rocznych jest mniej przekonywujący. Po prawej stronie tabeli przedstawiono zmiany w kolejnych latach średniej oceny punktowej dla zbiorów 16 ocen wojewódzkich. Ponownie niemal ważniejsze od zmian średniej oceny punktowej (r. 2001 3,76 pkt., r. 2011 4,35 pkt.) jest znaczące zmniejszanie się współczynników zmienności dla ocenianych zbiorów 16 średnich wojewódzkich z 6,5% w r. 2001 do 1,5%(!) w r. 2011. Dane tab. VI zostały przedstawione graficznie na ryc. 4. Postępująca harmonizacja wyników laboratoryjnych w Polsce, wywołana w znacznej mierze zarówno prowadzonymi programami, jak i korzystną jakościowo i ilościowo unifikację wyposażenia jest niewątpliwym osiągnięciem. Centralny program chemiczny. W r. 2011 przeprowadzono 36 cykl roczny centralnego programu chemicznego. Spektakularna poprawa wiarygodności wyników kontrolnych, zaobserwowana w okresie początko- Tabela VI Odsetki oraz współczynniki zmienności ogółu ocen regularności uzyskanych dla zbiorów wyników 16 województw. rok Ocen bdb+db Ocen niezad+złe Średnia ocena punktowa % ogółu wsp. zmienności % ogółu wsp. zmienności Liczba punktów wsp. zmienności r.2001 69,1 9,9 16,3 28,4 3,76 6,5 r.2003 75,2 7,4 11,6 32,5 4,00 4,9 r.2005 76,7 6,4 11,1 29,1 4,05 4,5 r.2007 80,7 5,7 9,1 34,0 4,21 4,0 r.2009 83,1 4,2 7,6 30,8 4,30 3,1 r.2011 84,0 2,3 6,88 15,7 4,35 1,5 138

wym tego programu (1976-1977) spowodowała, że w 1978r. Minister Zdrowia powołał Komisję ds. Standaryzacji i Kontroli Jakości Badań Laboratoryjnych. Ministerstwo przejęło też finansowanie kosztów materiałowych prowadzonych społecznie sprawdzianów, co umożliwiło podjęcie powszechnego programu chemicznego, a potem dalszych programów. Centralny i powszechny programy chemiczne są w zasadzie identyczne różniąc się liczbą uczestników (250 wszystkie laboratoria), liczbą sprawdzianów w ciągu roku (raz w miesiącu raz w kwartale) i wykorzystywanym systemem jednostek (SI wagowo-objętościowy). Znaczna liczba wykorzystywanych w ciągu roku materiałów kontrolnych, a więc i wyników kontrolnych nadsyłanych dla oznaczanych składników przez poszczególnych uczestników programu centralnego umożliwiła inny, bardziej informatywny sposób oceny rocznej, oceniając na podstawie rozkładu nadesłanych 24 wyników wielkość błędów przypadkowych (ocena precyzji) i błędów całkowitych (ocena ogólnej wiarygodności), obciążających poszczególne oznaczane przez laboratorium składniki. Elitarność programu centralnego, a więc ograniczenie liczby uczestników do 250 na ogół dużych laboratoriów, głównie lecznictwa zamkniętego spowodowała, że teoretycznie z powodu zbyt małej liczby wyników nie można wykorzystywać najkorzystniejszych wartości umownie należnych, a więc średnich systemowych (metodyczno-aparaturowo-odczynnikowych). Jest to jednak tylko częściowo prawdziwe. Uczestnicy programu centralnego wykorzystują dość ujednoliconą aparaturę pomiarową w części dolnej tab.vii scharakteryzowano 266 analizatorów 10 firm, którymi wykonano ponad 88% nadesłanych oznaczeń kontrolnych. Aczkolwiek uczestnicy programu centralnego stanowią nieco poniżej 15% ogółu laboratoriów, to dysponują 64,5% eksploatowanych analizatorów Cobas c501, po ponad 30% dalszych 5 dużych, nowoczesnych analizatorów (AU Beckman Coulter d. Olympus 39,5%, Cobas Integra 36%, Dimension 31,7%, Architect 32,4%, Advia 34,6%) i po ponad 20% pozostałych 4 wymienionych analizatorów. Są to w zasadzie analizatory wykorzystujące niemal wyłącznie odczynniki firmowe (analizatory Accent dystrybuującej firmy Cormay), a więc średnie metodyczno-aparaturowe są de facto także średnimi metodyczno-aparaturowo-odczynnikowymi. W efekcie o ponad 10% więcej nadsyłanych wyników może zostać ocenionych wg najkorzystniejszych wartości umownie należnych. Jest to częściowe ale tylko częściowe wytłumaczenie wyraźnie korzystniejszej oceny wyników programu centralnego w stosunku do powszechnego. Różnica może się wydawać nieznaczna (96,4% vs 91,0% poprawnych), ale na tym poziomie wiarygodności jest już wysoce istotna jako błędny jest oceniany co jedenasty lub co dwudziesty siódmy nadsyłany wynik. Zbiorcze zestawienie wyników programu centralnego przedstawiono w tab.vii. W ostatnich latach zmiany są już znikome minimalny spadek odsetka wyników poprawnych vs x og, a wzrost vs x met ap. W tab. VIII zestawiono odsetkowy udział każdej z pięciu klas poprawności przy ocenie zarówno precyzji, jak i ogólnej wiarygodności zbiorów rocznych poszczególnych ocenianych w laboratoriach składników oraz ogółem. Warunkiem klasyfikacji jest nadesłanie przez laboratorium wyników oznaczeń ocenianego składnika w co najmniej 18 materiałach kontrolnych (z wykorzystywanych 24). I w tym systemie oceny poprawa jest nieznaczna, ale istotna. Wydaje się, że dla wykorzystywanego wyposażenia i organizacji został osiągnięty pewien pułap wiarygodności, a dalsza poprawa wymaga wyraźnego zakłócenia powstałego stanu równowagi. Sprawdziany immunochemiczne. Rosnąca liczba laboratoriów oznaczających hormony, markery nowotworowe i specyficzne białka zmusiła organizatorów do zwiększenia liczby użytkowników programu tzw. immunochemii poszerzonej z 500 do 600 uczestników. Równolegle zwiększono liczbę ocenianych składników o dwa dalsze parathormon (wyjściowo 140 laboratoriów) i insulinę (wyjściowo 96 laboratoriów). Niestety ze względu na ograniczenia finansowe zmniejszono liczbę równolegle oznaczanych materiałów z 3 do 2, utrzymując 2 sprawdziany w ciągu roku (a więc 4 surowice). Ponieważ częstotliwość sprawdzianów 2 razy w roku nie jest wystarczająca, zachowano wprowadzony przed laty program immunochemii podstawowej, wykorzystujący surowice kontrolne z powszechnego programu chemicznego. Oczywiście surowice te nie mają wyznaczonych wartości należnych ocenianych składników, a w niektórych materiałach bardzo niskie stężenia utrudniają, a sporadycznie wręcz uniemożliwiają ocenę, jest to jednak kompensowane brakiem konieczności zakupu kosztownych materiałów. Ograniczono oznaczenia w tych materiałach do najczęściej wykorzystywanych hormonów tarczycy i PSA, które w tych warunkach mogą być poddane ocenie przez wszystkich chętnych. Brak wyznaczonych wartości należnych wydaje się nie stanowić zasadniczego problemu wobec wykazanej w programie immunochemii poszerzonej dużej na ogół zgodności ocen wg średnich systemowych wyznaczonych przez uczestników i wg systemowych wartości należnych podanych przez producenta materiałów kontrolnych. Dla dwóch składników estradiolu i TSH zobrazowano to na ryc. 5. Zarówno równania regresji prostoliniowej jak i współczynniki korelacji są niemal idealne. Nie dla wszystkich ocenianych składników jest tak dobrze (tab. X GH, β-2-microglobulina, digoksyna), ale liczba ocenianych oznaczeń jest mała. W tych warunkach sprawdziany najbardziej podstawowych oznaczeń hormonów tarczycy i PSA odbywają się 4 razy w roku z wykorzystaniem 8 materiałów kontrolnych 4 specjalnych mianowanych surowic do sprawdzianów immunochemicznych i 4 surowic wykorzystywanych w powszechnym programie chemicznym. Przykładowo hormon TSH w sprawdzianie immunochemicznym podstawowym oznacza ok. 850 laboratoriów, FT4 780 laboratoriów, a PSA 750 laboratoriów, podczas gdy w programie specjalistycznym oznaczenia te są wykonywane odpowiednio przez 596 (z 600!), 583 i 551 uczestników. Wyniki zbiorcze dwóch sprawdzianów immu- 139

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... Tabela VII Zestawienie ocen wyników oznaczeń kontrolnych programu centralnego w r. 2011 zależnie od przyjętych wartości umownie należnych. n n ocenianych wyników i %% poprawnych ocena oceniany ocenian. vs Xog. vs Xmet. vs Xmet-ap. vs Xmet-odcz. punktowa składnik aparat. n wyn. % n wyn. % n wyn. % n wyn. % precyzji og.wiar. sód 268 6307 85,0% 6283 93,7% 5904 94,7% 5997 94,2% 4,03 3,60 potas 268 6310 92,1% 6286 95,6% 5905 96,8% 6000 96,7% 4,31 3,90 wapń 259 6096 89,6% 6019 92,1% 5397 94,7% 5591 94,2% 4,02 3,56 magnez 242 5712 76,2% 5712 84,4% 5151 88,3% 5371 87,1% 3,26 2,53 żelazo 254 5972 89,0% 5972 91,2% 5249 95,2% 5645 95,2% 4,07 3,54 chlorki 225 5291 85,0% 5281 86,7% 7906 94,2% 4917 91,4% 3,90 3,31 fosforany 242 5681 93,6% 5673 94,8% 5238 96,9% 5427 96,4% 4,34 3,80 osmolalność 35 800 88,4% 800 88,4% 778 88,4% 754 88,7% 3,26 2,69 białko 265 6230 86,9% 6230 90,1% 5399 95,0% 5764 93,6% 3,87 3,40 mocznik 272 6402 93,3% 6378 96,0% 5763 97,1% 5156 97,0% 4,32 3,99 kreatynina 270 6351 83,2% 6309 90,4% 5464 95,7% 5809 94,3% 4,01 3,63 moczany 262 6161 95,1% 6083 96,1% 5508 98,4% 5871 97,9% 4,50 4,16 glukoza 273 6419 96,6% 6371 97,3% 5634 98,0% 6060 98,1% 4,52 4,08 bilirubina 269 6321 84,6% 6321 89,0% 5418 96,1% 5775 95,7% 4,31 3,77 cholesterol 265 6236 95,8% 6236 96,3% 5661 98,2% 6038 98,2% 4,56 4,23 HDL-Ch 253 5948 77,0% 5928 91,4% 5151 94,2% 5397 94,6% 3,90 3,38 triglicerydy 264 6206 93,4% 6158 96,4% 5607 98,3% 5913 98,2% 4,65 4,23 AST 270 6339 93,9% 6337 97,4% 5684 99,0% 5977 98,8% 4,75 4,41 ALT 269 6327 95,5% 6327 97,6% 5718 98,6% 6019 98,5% 4,71 4,36 ALP 252 5936 82,7% 5936 84,0% 5353 95,1% 5480 95,4% 4,26 3,93 AMY 261 6129 90,6% 6092 98,0% 5394 99,5% 5587 99,5% 4,80 4,64 AcP 14 334 82,3% 334 82,3% 142 89,4% 192 89,6% 3,14 2,36 CK 228 5339 91,0% 5287 92,5% 4842 97,3% 4911 97,0% 4,45 3,92 GGT 253 5941 92,8% 5941 96,3% 5148 98,7% 5527 98,3% 4,65 4,46 LD 179 4180 0,6% 4180 97,4% 3795 98,6% 3801 98,9% 4,78 4,47 lipaza 53 954 83,2% 930 88,5% 740 96,5% 798 96,5% 3,68 3,13 albuminy 138 2484 79,8% 2484 86,1% 2144 94,1% 2242 91,7% 3,84 3,32 razem r. 2011 - cykl 36 142406 86,5% 141888 93,1% 126893 96,4% 133019 96,0% 4,28 3,85 r. 2010 - cykl 35 138143 86,9% 137721 92,9% 123060 95,9% 129430 95,6% 4,27 3,81 r. 2009 - cykl 34 128114 87,4% 127583 93,2% 112086 96,1% 118589 95,9% 4,29 3,92 r. 2008 - cykl 33 131007 87,2% 130329 92,9% 114872 95,6% 119863 95,5% 4,22 3,77 r. 2007 - cykl 32 128049 87,5% 127383 93,0% 113061 95,5% 116320 95,3% 4,20 3,77 01-44-04 Cobas Integra 107 50511 93,0% 50473 96,4% 50127 97,0% 50311 96,8% 4,44 4,04 01-44-08 Cobas c501 40 20971 90,8% 20963 96,0% 20342 97,5% 20845 96,2% 4,50 4,12 01-78-01 Olympus 30 14482 83,5% 14440 91,3% 14194 96,9% 14038 96,6% 4,46 4,09 01-13-02 Konelab 21 10486 86,0% 10480 89,6% 10020 95,4% 9332 95,9% 4,22 3,86 01-19-01 Dimension 13 6648 76,4% 6632 87,2% 6418 95,3% 6394 95,3% 4,32 3,85 01-50-01 ABX Pentra 12 4529 85,3% 4505 90,4% 4147 94,5% 4121 94,6% 3,96 3,49 01-18-04 Accent 12 3388 85,7% 3382 88,2% 2898 91,9% 2922 91,5% 3,81 3,26 01-35-01 Vitros 11 5725 56,9% 5709 95,1% 5683 95,4% 5703 95,1% 4,26 3,76 01-01-03 Architect 11 5489 85,4% 5469 93,1% 5161 97,2% 5143 97,4% 4,44 4,05 01-08-03 Advia 9 3506 84,2% 3418 90,1% 2932 95,6% 2902 95,0% 4,10 3,34 razem 10 ap. 266 125735 87,4% 125471 93,9% 121922 96,6% 121711 96,2% 4,37 3,96 140

Tabela VIII Ocena precyzji i ogólnej wiarygodności wyników oznaczanych składników w poszczególnych laboratoriach, uzyskanych przez uczestników programu centralnego w 2011 r. oceniany n aparatów %% ocena precyzji %% ocena ogólnej wiarygodności składnik oznacz. sklas. bdb db wątpl. niezad zła bdb db wątpl. niezad zła sód 287 268 19,0 69,0 10,1 1,5 0,4 9,3 61,6 20,9 4,1 4,1 potas 287 268 40,7 54,5 2,6 2,2 0,0 22,4 61,9 9,0 3,4 3,4 wapń 277 259 29,0 52,9 14,7 1,9 1,5 19,7 47,1 20,8 6,2 6,2 magnez 264 242 7,8 50,8 25,2 8,3 7,8 2,9 31,8 32,2 14,5 18,6 żelazo 278 254 38,6 47,2 7,9 1,2 5,1 21,6 50,4 12,6 6,3 9,1 chlorki 253 225 20,9 62,2 10,7 4,4 1,8 9,3 47,6 29,3 6,2 7,6 fosforany 262 242 48,8 43,0 5,8 1,2 1,2 31,4 47,5 9,9 3,3 7,8 osmolalność 42 35 2,9 71,4 5,7 8,6 11,4 2,9 42,9 25,7 5,7 22,9 białko 284 265 21,1 59,2 14,0 2,3 3,4 8,7 55,1 23,8 5,3 7,2 mocznik 292 272 42,6 50,7 4,8 1,5 0,4 26,1 59,2 9,9 2,2 2,6 kreatynina 290 270 24,8 60,4 10,4 4,1 0,4 11,5 51,1 18,9 4,4 4,1 moczany 286 262 58,8 35,9 3,8 1,2 0,4 39,3 49,6 5,7 3,4 1,9 glukoza 294 273 36,8 40,3 2,2 0,7 0,0 37,4 50,2 5,5 4,0 2,9 bilirubina 291 269 44,6 46,1 7,4 1,5 0,4 25,6 46,8 18,6 5,6 3,4 cholesterol 287 265 60,4 35,5 4,2 0,0 0,0 44,2 45,7 5,7 2,6 1,9 HDL-Ch 277 253 23,7 56,9 13,4 3,6 2,4 11,5 54,9 18,2 6,3 9,1 triglicerydy 286 264 68,2 28,4 3,4 0,0 0,0 50,0 37,1 7,2 3,0 2,6 AST 291 270 81,8 14,8 1,5 1,8 0,0 61,8 27,4 7,0 1,5 2,2 ALT 291 269 74,7 22,7 2,2 0,4 0,0 53,2 36,8 7,1 1,9 1,1 ALP 276 252 49,2 35,3 11,9 3,2 0,4 34,1 40,9 18,2 4,0 2,8 AMY 278 261 85,8 11,1 1,5 1,5 0,0 76,2 17,6 3,4 1,9 0,8 AcP 19 14 7,1 50,0 21,4 14,3 7,1 0,0 35,7 28,6 7,1 28,6 CK 246 228 56,6 36,4 5,3 0,9 0,9 29,8 50,4 12,7 3,1 4,0 GGT 276 253 72,3 24,1 2,0 1,2 0,4 62,8 29,6 3,6 2,4 1,6 LD 197 179 80,4 17,3 2,2 0,0 0,0 64,2 27,4 5,0 1,7 1,7 lipaza 96 53 45,3 28,3 7,6 5,7 13,2 28,3 37,7 5,7 3,8 24,5 albuminy 211 138 10,1 71,7 14,5 2,9 0,7 3,6 59,4 23,2 6,5 7,2 razem r. 2011- cykl 36 46,7 42,5 7,4 2,0 1,3 31,6 45,6 13,5 4,3 5,0 r. 2010 - cykl 35 45,5 42,8 8,8 2,0 0,9 30,1 46,0 14,1 4,7 5,1 r. 2009 - cykl 34 45,6 44,0 7,6 1,8 1,0 30,6 48,3 14,0 3,7 3,4 r. 2008 - cykl 33 42,4 45,1 9,1 2,2 1,2 26,8 48,1 15,1 5,1 4,8 r. 2007 - cykl 32 41,2 46,2 9,0 2,2 1,3 25,8 49,5 14,8 5,1 4,8 nochemii poszerzonej, przeprowadzonych w 2011r. przedstawiono w tab. IX (składniki) i tab. X (oceniane systemy immunochemiczne). W ciągu roku dla 32 ocenianych składników nadesłano 32765 wyników (najwięcej oczywiście dla TSH), posługując się 11 różnymi systemami analitycznymi. W tab. IX zwraca uwagę różna liczba wyników ocenianych vs średnie ogólne w kolumnie A i B. W kolumnie A oceniono wszystkie nadesłane wyniki, a w kolumnie B tylko wyniki sklasyfikowane względem wartości systemowych (minimum 6 homogennych wartości). W następnej kolumnie podano ocenę tych wyników względem korygowanych średnich systemowych (uzyskanych takim samym aparatem), a w ostatniej względem wyznaczonych przez producenta systemowych wartości należnych. Ponieważ producent niektórych wartości nie oznaczył, można było ocenić wg wartości należnych około 90% nadesłanych wyników. Duża różnica przy ocenie poprawności względem średnich ogólnych a korygowanych średnich systemowych świadczy o znacznym zróżnicowaniu wartości oznaczanego składnika, wyznaczanych poszczególnymi systemami immunochemicznymi i vice versa. Znaczne różnice w ocenie względem średnich systemowych i systemowych wartości 141

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... Rycina 5 ZIMA 2011 (4 sprawdziany) Wartości należne vs wartości uzyskane. należnych sugeruje wadliwą kalibrację. Wg danych opracowanych dla 11 wykorzystywanych systemów, zbiorcza różnica oceny względem systemowych wartości średnich i systemowych wartości należnych jest znikoma (92,78% i 92,04% poprawnych, różnica 0,74%), choć dla poszczególnych systemów różnice są większe (tab. X). Dla dwóch systemów nadesłano mało wyników, a dodatkowo producent często pominął wyznaczenie wartości należnych ap. Roche Modular E170 tylko 60% wartości nominalnych, a ap. Tosoh rozprowadzanymi przez abx Horiba zaledwie 30%. Pomijając te dwa mało popularne systemy, najwięcej różnic obserwuje się dla wartości wyznaczonych ap. Immulite, co może świadczyć o wadliwej kalibracji (kalibratorach?) bądź o pomyłkach w wyznaczonych przez producenta wartościach należnych. Sporadycznie zdarzają się sytuacje nieco paradoksalne, np. dla 210 analizatorów Elecsys f-my Roche poprawność względem wartościom nominalnym jest nieco wyższa niż względem średnich systemowych. Różnice są jednak niewielkie (0,5% nadesłanych wartości) i mogą wynikać z dyspersji wyników. Podane informacje można poprzeć konkretnymi przykładami. Oznaczenia TSH charakteryzują się zbliżoną, wysoką poprawnością przy ocenie względem średnich ogólnych (92,1%), średnich systemowych (96,1%) i systemowych wartości należnych (93,2% poprawnych). Stosunkowo małe różnice przy ocenie vs średnie ogólne i średnie systemowe sugerują dużą zbieżność wartości wyznaczonych różnymi systemami. Rzeczywiście, np. w surowicy 2 sprawdzianu Lato 11 średnie systemowe wahają się od 18,87 miu/l (14 ap. Access) do 22,94 miu/l (9 ap. Tosoh), przy średniej dla 11 systemów 20,97 miu/l i współczynniku zmienności zaledwie 5,7% (średni współczynnik zmienności dla 4 surowic 6,2%). Średnia wartości nominalnych podanych przez producenta dla tych samych 11 systemów wynosi 21,51 miu/l przy współczynniku zmienności 9,3%. Przy zbieżności wartości należnych także i ocena nadesłanych wyników musi być zbieżna. Odmienną sytuację można zaobserwować oznaczając estradiol tymi samymi 11 systemami immunochemicznymi. Dla poszczególnych surowic obserwuje się bardzo duże zróżnicowanie poszczególnych średnich systemowych średni współczynnik zmienności dla 4 surowic wynosi 37%. W wybranej przykładowo surowicy 2 sprawdzianu Zima 11 średnie wartości systemowe wahały się od 207,7 pg/ml (22 ap. AxSym) do 884,4 pg/ml (8 ap. Toshiba), przy średniej dla 11 systemów 520,5 pg/ml i współczynniku zmienności 44,5%. Nie dziwi więc różnica poprawności przy ocenie vs średnie ogólne i średnie systemowe (53,4% vs 94,6% poprawnych, Δ = 41,2%!). Producent nie podał wartości należnych dla ap. Toshiba, ale dla pozostałych 10 systemów rozproszenie wartości należnych jest także bardzo znaczne (współczynnik zmienności = 39%), ale zgodne z systemowymi wartościami średnimi, więc poprawność względem wartości średnich systemowych i systemowych wartości należnych jest zbliżona (94,6 i 92,1% poprawnych). Podane przykłady nie wyczerpują wszystkich możliwości interpretacji wyników. Program markerów kardiologicznych. Efektowny i efektywny rozwój polskiej kardiologii sprowokował rozpoczęcie w r. 2008 programu oceny markerów kardiologicznych. Do udziału w programie zaproszono 450 laboratoriów, oznaczających którąś z troponin troponinę T (40%) lub troponinę I (60% uczestników). Poza troponinami ocena obejmuje oznaczanie akt. CK (363 lab.), akt. CK-MB (250 lab.), stęż. CK-MB mass. (125 lab.), stęż. mioglobiny (29 lab.) i homocysteiny (27 lab.) oraz przedsionkowego peptydu natriuretycznego typu B (38 lab.) oraz jego NT-końcowego propeptydu pro-bnp (obecnie 109 lab.). Tylko te dwa ostatnie oznaczenia, a zwłaszcza pro-bnp wykazują wyraźną tendencję wzrostową (ryc.6) jeżeli w r. 2008 wartości tego ważnego markera niewydolności krążenia nadesłały 32 lab., to w r. 2009 60 lab., w r. 2010 97 lab., a w r. 2011 109 laboratoriów. Wzrost liczby laboratoriów oznaczających BNP jest znacznie mniejszy (23 38 lab.). Ponieważ liczba oznaczeń pro-bnp wykonywana ap. Immulite spadła poniżej 142

Tabela IX Wyniki sprawdzianu immunochemii poszerzonej w r. 2011-2 sprawdziany, 2 materiały kontrolne. Zestawiono ocenę wszystkich nadesłanych w obydwu sprawdzianach wyników (A) oraz wyników sklasyfikowanych (B); a - liczba ocenianych wyników, b - % wyników ocenionych jako poprawne. n A B oceniany wykorzystanych wszystkie wyniki ocena wyników sklasyfikowanych składnik syst. apar. ocena vs Xog. vs Xog. vs Xsyst. vs nominał a b a b a b a b estradiol 11 415 1647 52,52% 1589 53,43% 1589 94,59% 1559 92,50% FSH 11 407 1623 76,70% 1569 77,18% 1569 94,52% 1543 93,52% TSH 11 596 2363 91,37% 2291 92,06% 2291 96,07% 2255 93,22% FT3 11 551 2187 74,16% 2135 75,27% 2135 92,46% 2096 91,41% T3 4 54 214 79,91% 142 86,62% 142 94,37% 142 90,14% FT4 11 583 2311 64,47% 2253 65,07% 2253 93,70% 2221 92,21% T4 4 54 214 79,44% 138 89,13% 138 93,48% 138 90,58% LH 10 356 1404 89,10% 1342 90,46% 1342 97,76% 1330 97,37% GH 2 35 139 66,91% 98 75,51% 98 84,69% 98 29,59% HCG 10 425 1682 68,37% 1628 69,23% 1628 96,31% 1616 96,22% kortyzol 8 159 631 83,84% 538 84,57% 538 94,24% 504 92,46% progesteron 11 365 1450 77,59% 1396 77,86% 1396 94,98% 1363 92,81% prolaktyna 11 467 1864 80,69% 1800 81,39% 1800 94,61% 1766 93,77% testosteron 10 349 1372 72,81% 1316 74,09% 1316 95,74% 1304 90,95% insulina 4 96 369 81,84% 268 94,78% 268 95,90% 244 95,49% PTH 6 140 555 28,47% 490 27,96% 490 78,78% 378 82,01% AFP 8 241 959 88,74% 879 89,99% 879 93,52% 879 91,92% CEA 10 408 1602 75,40% 1520 77,24% 1520 87,63% 791 89,12% CA-125 10 423 1661 69,03% 1605 70,47% 1605 90,47% 813 95,45% CA 15.3 8 188 750 78,13% 696 81,03% 696 91,24% 341 93,84% CA 19.9 9 261 1028 61,86% 956 61,72% 956 86,09% 484 89,46% t PSA 11 551 2182 79,01% 2112 80,07% 2112 95,55% 2094 92,65% f PSA 7 134 525 81,90% 450 83,56% 450 94,44% 402 92,29% digoksyna 5 66 256 60,55% 178 61,80% 178 86,52% 157 73,25% fenytoina 2 10 38 100,00% karbamazep. 2 52 202 83,17% 110 87,27% 110 92,73% 110 90,00% kw.foliowy 5 96 367 73,30% 311 77,49% 311 90,35% 311 83,92% kw.walproin. 3 57 226 88,50% 144 93,75% 144 94,44% 132 95,45% wit. B12 7 194 746 82,84% 698 83,81% 698 89,11% 692 87,57% ferrytyna 9 250 972 75,20% 860 76,28% 860 87,91% 780 87,95% IgE 9 277 1100 80,73% 1014 81,46% 1014 92,31% 941 91,28% β-2-microglob. 3 34 126 76,19% 78 79,49% 78 75,64% 16 43,75% razem r. 2011 32765 75,01% 30604 76,15% 30604 93,09% 27500 92,04% r. 2010 35013 73,83% 32567 74,96% 32567 92,66% 32036 91,23% r. 2008 39147 68,08% 36484 68,86% 36484 89,44% 31357 86,65% 6, obecnie oceniane są wyniki wyznaczone aparatami tylko 2 firm Roche (Elecsys 41% laboratoriów oznaczających, Cobas e601 16,5%) oraz biomerieux (Vidas 32% oznaczających laboratoriów). W stosunku do wartości systemowych tych trzech aparatów jako poprawne oceniono 96,6% nadesłanych wartości. Bardzo duże różnice między zbliżonymi do siebie wartościami wyznaczonymi aparatami Elecsys i Cobas e601 a wyznaczonymi aparatami Vidas najczę- 143

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... Tabela X Ocena wyników uzyskanych poszczególnymi systemami analitycznymi w sprawdzianach immunochemii poszerzonej w r. 2011. Podano liczbę składników oznaczanych poszczególnymi systemami, liczbę wykorzystanych aparatów w sprawdzianach Zima 2011 i Lato 2011 oraz liczby ocenianych wyników oraz liczbę i procent wyników uznanych za poprawne w różnych układach odniesienia. system n ozn. n aparatów n ocen. n i % poprawnych ocena vs wart.nominalne analityczny skł. Zima11 Lato11 wyników vs Xog. vs Xsyst. n wyn. n % Abbott-AxSym 25 33 32 1697 1022 60,22% 1484 87,45% 1575 1369 86,92% Abbott-Architect 27 61 62 3532 2448 69,31% 3234 91,56% 3115 2790 89,56% Bayer-Advia Centaur 26 31 39 2075 1291 62,22% 1840 88,67% 1896 1678 88,50% Beckman-Access 20 17 15 827 510 61,07% 766 92,62% 695 615 88,49% biomerieux-vidas 22 100 95 4648 2713 58,37% 4333 93,22% 4230 3901 92,22% Siemens- BN 1 6 6 24 19 79,17% 22 91,67% - - - Roche-Elecsys 27 210 219 11239 10026 89,23% 10458 93,91% 10224 9655 94,43% Roche-ModularE170 14 8 9 326 311 95,40% 319 97,05% 194 193 99,48% Roche- Cobas e601 27 61 63 3914 3610 92,23% 3783 96,65% 3541 3372 95,23% Siemens-Immulite1000 17 25 23 976 542 55,53% 900 92,21% 919 766 83,35% Siemens-Immulite2000 23 16 19 992 518 52,22% 931 93,85% 924 808 87,44% Horiba ABX-AIA 9 10 9 219 90 41,10% 197 89,95% 64 50 78,13% razem r. 2011 578 591 30466 23100 75,82% 28267 92,78% 27377 25197 92,04% r. 2010 491 474 32577 24423 75,00% 30176 92,60% 32036 29227 91,23% r. 2009 451 478 36998 26348 71,21% 33569 90,73% 28405 24606 86,62% ściej 3-5 krotne (tab.xi) powoduje, że zupełnie nie uzyskano wyników ocenionych jako poprawne vs x og z wszystkich nadesłanych wartości. Nieco mniej zróżnicowane są wartości troponiny I, oznaczanej wszystkimi pozostałymi systemami poza systemami firmy Roche (ryc. 7), jednak z powodu tego zróżnicowania poprawność vs x og wynosi 22,9% (dla surowicy 2 w sprawdzianie Lato 2011 8,1%). Poprawność vs x syst wynosi 88% poprawnych pomimo, że z powodu wykorzystywania trzech różnych odczynników (ryc.3d), aparatami Dimension uzyskano zaledwie 51,7% wyników poprawnych. Ponieważ wartości troponiny T wyznaczone dwoma aparatami f-,y Roche Elecsys i Cobas e601 nie różnią się istotnie, to ocena vs x og jest wysoka, ok. 73% wyników uznano jako poprawne. Niestety niewiele korzystniejsza jest ocena Rycina 6 Wzrost liczby laboratoriów oznaczających PBNP. vs x syst (73,8% poprawnych) z powodu zróżnicowania wykorzystywanych odczynników, co szczegółowo omówiono w roku ubiegłym. Sytuacja będzie ulegała poprawie, ponieważ firma Roche wycofuje odczynniki do met. 1 (nr kat. 044918151 i 046603071 Stat) na korzyść odczynników do metody wysokiej czułości (2hs) nr kat. 05092744 i 05092728 Stat. Oznaczenia akt. CK są wykonywane ok. 30 modelami różnych aparatów, z których wartości wyznaczone zaledwie 13 analizatorami mogły zostać sklasyfikowane i ocenione stanowiły jednak aż 90% nadesłanych wyników akt. CK, z których 86,9% uznano za poprawne vs x og, a 92,4% - vs x syst. Jest to wynik nieznacznie gorszy od uzyskanego tymi samymi aparatami w programie chemicznym. Tę niewielką, ale niekorzystną różnicę można wytłumaczyć w programie kardiologicznym wykorzystywano surowice o znacznie niższej aktywności CK niż w programie powszechnym, nawet 19,4 i 25,7 IU/L. Zbliżona była wiarygodność oznaczeń akt. CK-MB (73,4% vs x og, 90,4% vs x syst ) oraz CK-MB mass (tylko 26,9% poprawnych vs x og, ale aż 96,1% vs x syst ). Oznaczenia mioglobiny i homocysteiny są bardzo trudne do oceny z powodu zbyt małej liczby oznaczających laboratoriów w r.2011 oznaczenia mioglobiny sklasyfikowano tylko dla 8 laboratoriów posługujących się analizatorami Vidas (niewiele ponad 80% wyników poprawnych vs x syst ). Niewiele lepsza jest sytuacja z oznaczeniami homocysteiny z 27 144

Rycina 7 Zima 2011Troponina I materiał 1 Analiza wariancji * oznacza różnice istotne testem post hoc Scheffe go oznaczających laboratoriów sklasyfikowano wyniki tylko 20, posługujących się aparatami f-my Abbott 6 ap. AxSym i 14 ap. Architect, uzyskując średnio 69,7% poprawnych vs x og i 81,6% vs x syst. Ogółem w r. 2011 dla 9 składników ocenianych w programie markerów kardiologicznych nadesłano 5461 wyników (poprawne vs x og 36,5%), z których sklasyfikowano 4890 (89,5%), oceniając jako poprawne vs x og 55,5%, a vs x syst 88,5% (najwięcej dla oznaczeń PBNP 96,6% i CK-MB mass 96,1%). Sprawdziany parametrów rkz. Parametry równowagi kwasowo-zasadowej oceniono w 2011r. w dwóch sprawdzianach, w każdym wykorzystując trzy wodne roztwory kontrolne acidosis, normal i alkalosis. Poza typowymi oznaczeniami rkz (ph, PCO 2, PO 2 ) dla analizatorów, którymi można oznaczać podstawowe elektrolity (sód, potas, chlorki, wapń) ocenie poddano również i te oznaczenia. W sumie dla 6 wykorzystanych w ciągu roku materiałów kontrolnych nadesłano do oceny 21744 wyniki, z których aż 94,4% wyznaczono aparatami trzech firm Roche (43,7% wyników), Siemens (38,0% wyników) i Radiometer (12,7% wyników). Jako poprawne vs x apar oceniono 19059 wyników tj. 87,5% nadesłanych, najwięcej dla oznaczeń PCO 2 (96,9%), najmniej dla oznaczeń chlorków (69,6%) - tab. XII. Z trzech materiałów kontrolnych najlepiej oznaczany był materiał acidosis (92,7% wyników poprawnych), a najgorzej materiał alkalosis (80,8% wyników poprawnych). Z trzech głównych producentów procentowo najwięcej wyników poprawnych uzyskano aparatami f-my Radiometer (91,8%), a kolejno aparatami f-my Siemens (87,9%) i f-my Roche (85,5%). Wyniki f-my Roche zaskakują, są jednak efektem wprowadzonego przez firmę usprawnienia. Wykorzystywane materiały kontrolne, będąc buforowanymi roztworami wodnymi, są zasadniczo różne od naturalnych materiałów biologicznych, zawierających białka, a szczególnie hemoglobinę. Producenci aparatów godzili się z faktem pomiaru wodnego materiału kontrolnego analogicznie jak próbek rutynowych, przyjmując dla niego eksperymentalnie wyznaczone wartości należne. Firma Roche postanowiła uwzględnić różnice w mierzonych próbkach i w swoich nowych analizatorach rkz Cobas b121, b221 wprowadziła dwa tory pomiarowe tor biologiczny (próbki rutynowe) i tor wodny (wodne roztwory m.in. płyny dializacyjne czy próbki kontrolne sprawdziany zewnętrzne). Wybór właściwego toru pomiarowego należy dokonać manualnie w laboratorium. Mimo, że producent analizatorów opisał zalecone postępowanie w instrukcji obsługi, a także zwracali na to uwagę organizatorzy sprawdzianów, znaczna część (w r. 2007 ok. Tabela XI Wartości pro-bnp wyznaczane aparatami Elecsys, Cobas e601 i Vidas w 14 kolejnych sprawdzianach kontrolnych. Wartości wyznaczane aparatami Elecsys i Cobas e601 statystycznie nie różnią się, wartości wyznaczane aparatami Vidas są istotnie wyższe. Sprawdzian Elecsys Cobas e601 Vidas N X S N X S N X S Z08 mat 1 17 62,6 12,0 6 55,9 7,5 0 Z08 mat 2 17 965,3 234,8 6 972,0 215,8 0 L08 mat 1 17 102,1 34,2 8 96,1 30,0 9 249,6 64,1 L08 mat 2 17 204,6 61,9 8 214,5 76,6 9 401,8 92,1 Z09 mat 1 20 16,0 8,3 12 10,9 4,6 17 20,0 0,6 Z09 mat 2 20 509,2 129,7 12 479,8 58,3 17 1524,4 320,3 Z10 mat 1 30 12,2 4,8 15 11,4 3,5 26 20,3 1,6 Z10 mat 2 30 231,5 29,7 15 193,9 37,5 25 826,3 86,9 L10 mat 1 42 180,0 13,2 16 173,7 11,8 25 787,3 80,5 L10 mat 2 42 739,7 60,7 16 722,5 47,1 25 3223,3 309,6 Z11 mat 1 45 297,2 30,6 16 290,8 21,3 31 1416,7 89,6 Z11 mat 2 45 911,0 93,9 16 888,3 63,6 31 4384,3 277,6 L11 mat 1 45 254,8 33,8 18 244,6 14,1 35 1164,6 78,5 L11 mat 2 45 730,9 80,9 18 679,7 104,1 35 3274,1 304,1 145

Sprawdziany międzylaboratoryjne prowadzone w roku 2011 przez Centralny Ośrodek Badań Jakości w Diagnostyce... 90%) użytkowników tych analizatorów takiego wyboru nie dokonywała. Dopóki liczba eksploatowanych analizatorów Cobas b121, b221 była nieznaczna, problem pozostawał nierozpoznawalny. Jednak liczba tych analizatorów szybko rosła (r. 2007 35 szt., r. 2008 95 szt., r. 2009 133 szt., r. 2010 200 szt., r. 2011 243 szt.) ryc. 8, a wraz z tym narastały problemy wykorzystując wodne materiały kontrolne, szereg oznaczanych wartości zależy od wybranego toru pomiarowego. Oczywiście dla wodnych próbek kontrolnych właściwy jest tor wodny, jednak bardzo znaczna część użytkowników na skutek nieuwagi, niechęci do czytania instrukcji, a czasem może i niekompetencji stosownego przestawienia toru pomiarowego nie dokonywała Latem 2007r. z 49 użytkowników analizatorów rkz Cobas zrobiono to w 5 laboratoriach (10,2%!), zaś Zimą 2010, mimo ponawianych informacji organizatorów sprawdzianów zaledwie 38 ze 185 użytkowników (20%) ryc.8. Zwracano się o pomoc do firmy, która także przesłała wszystkim użytkownikom stosowne instrukcje oraz wprowadziła ten temat podczas spotkań z użytkownikami. Mimo to jeszcze Zimą 2011 poprawne postępowanie przeprowadziło 79 z 225 użytkowników (35%) i dopiero Latem 2011 sytuacja uległa wyraźnej poprawie właściwy tor pomiarowy wykorzystało 70% z 243 użytkowników analizatorów Cobas (ale aż 75 laboratoriów konsekwentnie nie dostosowało się do zaleceń producenta oraz organizatorów sprawdzianów). Różnice wynikające Tabela XII Zbiorcze wyniki oznaczeń w r. 2011 (2 sprawdziany) parametrów równowagi kwasowo-zasadowej oraz elektrolitów wyznaczone analizatorami rkz najczęściej wykorzystywanych firm (zsumowane oceny poszczególnych modeli) dla materiałów acidosis, normal i alkalosis oraz razem. Podano liczbę ocenianych wyników oraz odsetek wyników ocenionych jako poprawne vs Xap. ph PCO2 PO2 sód potas chlorki wapń razem grupa materiał N og./ N og./ N og./ N og./ N og./ N og./ N og./ N og./ aparatów Siemens N % N % N % N % acidosis 509 509 509 247 247 119 113 93,52 98,23 96,07 90,69 88,66 76,47 81,42 2253 92,81 476 500 489 224 219 91 92 2091 normal 509 509 509 248 248 120 113 83,89 97,64 93,91 86,29 89,92 69,17 69,91 2256 88,70 427 497 478 214 223 83 79 2001 alkalosis 509 509 509 247 247 119 113 90,77 90,37 74,26 82,19 75,30 80,67 56,64 2253 82,07 462 460 378 203 186 96 64 1849 N % N % N % N % Radiometer razem 1527 89,39 1527 95,42 1527 88,08 742 86,39 742 84,64 358 75,42 339 69,32 6762 87,86 1365 1457 1345 641 628 270 235 5941 acidosis 170 170 170 107 107 97 99,41 99,41 97,06 96,26 97,20 63,92 100 89,00 921 93,48 169 169 165 103 104 62 89 861 normal 169 169 169 107 107 97 97,63 100,00 89,35 98,13 97,20 67,01 100 90,00 918 92,48 165 169 151 105 104 65 90 849 alkalosis 170 170 170 106 106 96 99 98,24 97,06 81,76 98,11 95,28 77,08 69,70 917 89,31 167 165 139 104 101 74 69 819 razem 509 98,43 509 98,82 509 89,39 320 97,50 320 96,56 290 69,31 299 82,94 2756 91,76 501 503 455 312 309 201 248 2529 acidosis 587 97,27 585 98,12 585 95,56 501 92,02 509 95,87 268 65,30 292 84,93 3327 92,46 571 574 559 461 488 175 248 3076 Roche normal 585 96,24 583 98,80 583 61,06 499 96,19 507 96,25 267 55,42 291 88,32 3315 86,52 563 576 356 480 488 148 257 2868 alkalosis 585 97,78 583 96,50 582 22,34 501 96,01 509 76,03 268 76,12 292 82,19 3320 77,65 572 564 130 481 387 204 240 2578 razem 1757 97,10 1751 97,89 1750 59,71 1501 94,74 1525 89,38 803 65,63 875 85,14 9962 85,54 1706 1714 1045 1422 1363 527 745 8522 acidosis 1341 96,05 1334 98,42 1334 96,03 1086 91,34 1094 94,61 529 69,57 548 85,22 7266 92,82 1288 1313 1281 992 1035 368 467 6744 wszystkie aparaty normal 1339 91,11 1332 98,20 1332 78,90 1085 91,98 1093 94,51 529 60,87 547 84,46 7257 88,11 1220 1308 1051 998 1033 322 462 6394 alkalosis 1338 94,92 1333 94,15 1330 52,93 1083 91,32 1092 80,49 528 78,22 547 75,14 7251 81,66 1270 1255 704 989 879 413 411 5921 razem 4018 94,03 3999 96,92 3996 75,98 3254 91,55 3279 89,87 1586 69,55 1642 21774 81,61 87,53 3778 3876 3036 2979 2947 1103 1340 19059 146

z pomiaru torem biologicznym i torem wodnym opisano szczegółowo w ubiegłym roku. Skrótowo można stwierdzić, że w r.2011 wśród 42 oznaczeń 7 parametrów w 6 materiałach kontrolnych statystycznie istotne różnice między wartościami wyznaczonymi odmiennymi torami pomiarowymi wykazano 28 razy (66,7%), najrzadziej dla pomiarów ph i PCO 2 (po 1 razie), najczęściej dla sodu i potasu (po 6 razy) czy chlorków i PO 2 (po 5 razy). Często różnice mimo, że istotne były w rzeczywistości niewielkie (np. potas 4,46 i 4,31 lub 6,84 i 6,70 mmol/l, chlorki 119,1 i 118 mmol/l czy wapń 1,15 i 1,12 mmol/l), ale przy wąskich na ogół dopuszczalnych granicach błędu wyraźnie wpłynęły na ocenę (np. oznaczenie wapnia Latem 2011 w mat. alkalosis poprawne vs x apar 95,3% nadesłanych wartości, ale 97,3% dla pomiarów w torze wodnym i 90,3% w torze pomiarowym biologicznym. Największe różnice w wyznaczanych wartościach zaobserwowano dla pomiarów PO 2, zwłaszcza w materiałach alkalosis (Zimą 2011 34,7 i 73,8 mmhg, Latem 2011 21,7 i 67 mmhg). Podział na wyniki uzyskane przy wykorzystaniu toru pomiarowego wodnego lub biologicznego dokonano na podstawie oceny wyników PO 2 w mat. alkalosis i nie zostały one potwierdzone przez wykonawców. W tab. XIII przedstawiono Rycina 8 Wzrost liczby analizatorów rkz Cobas b121 i b221 firmy Roche w latach 2007-2011. Podział na użytkowników toru wodnego i toru biologicznego oparto o wartości wyznaczone dla PO 2 alkalosis. Na prawej osi przedstawiono wzrost procentowy z zaznaczeniem minimum i maximum użytkowników toru wodnego. zbiorczo (z rozbiciem na parametry rkz i elektrolity) dane za r.2010 i 2011. Podano liczbę nadesłanych w każdym sprawdzianie wyników oraz dokonany przez organizatora podział na grupy A (tor wodny) i B (tor biologiczny) oraz ocenę tych wyników vs korygowane średnie ogólne oraz korygowane średnie grupowe. Różnice w ocenie mogą być znaczne w r. 2011 różnica w odsetku wyników poprawnych dla 3 parametrów rkz w 6 materiałach kontrolnych wynosiła 11,6% (Zima) i 10,7% (Lato). Przedstawione dane są klasycznym przykładem, jak błędne wyniki części uczestników sprawdzianów mogą wysoce niekorzystnie wpłynąć na ocenę uczestników, którzy oznaczenia wykonali prawidłowo i uzyskali wyniki poprawne (błędnie zdyskwalifikowane!). Pozostaje problem podstawowy jak w takiej sytuacji powinien postąpić organizator sprawdzianów. Standardowym postępowaniem jest ocena względem korygowanej średniej aparaturowej z całego zbioru wyników, mając świadomość, że jest to wartość pośrednia pomiędzy dwoma odrębnymi podzbiorami, a jej wykorzystanie powoduje zarówno ewent. pozytywną ocenę części wyników błędnych, jak i dyskwalifikację części wyników poprawnych. Oczywiście organizatorzy mogą arbitralnie dokonać podziału na dwie grupy wynikowe (przy małych różnicach może to być nierealne) i ocenić każdą z tych grup osobno (jak w tab. XIII). Jest to jednak niedopuszczalna manipulacja wynikami, a jednocześnie usankcjonowanie nieprawidłowego postępowania (przyjęcie wartości wyznaczonych dla próbek wodnych torem biologicznym postępowanie przyjęte obecnie przez wszystkich producentów poza f-mą Roche). Można oczywiście równie arbitralnie przyjąć, że poprawne są tylko wyniki uzyskane z wykorzystaniem prawidłowego toru pomiarowego i wszystkie pozostałe zdyskwalifikować, co przy dużej przewadze pomiarów przeprowadzonych niepoprawnie spowodowałoby fatalne skutki. Każde wyjście jest niewłaściwe, a jedynym poprawnym jest promowanie poprawnego postępowania (wyegzekwowanie tego nie jest łatwe!). Problem dotyczy oczywiście nie tylko oznaczeń parametrów rkz analizatorami Cobas lecz wszystkich oznaczeń, dla których rozkład wyznaczonych wartości jest bimodalny (polimodalny?). Organizatorzy sprawdzianów Tabela XIII Wyniki uzyskane analizatorami Cobas b121 i b221 w latach 2010-2011. Podano - dla parametrów rkz (ph, PCO2 i PO2) oraz elektrolitów (sód, potas, chlorki, wapń) liczbę ocenionych wyników i odsetek wyników uznanych za poprawne vs Xog. (z wszystkich nadesłanych wyników) oraz z rozbiciem na użytkowników toru wodnego (A), toru biologicznego (B) i razem dla obu tych grup (A + B). parametry rkz elektrolity sprawdzian n wyników % wyników poprawnych vs n wyników % wyników poprawnych vs ogółem A B Xog. A vs XA B vs XB A+B ogółem A B Xog. A vs XA B vs XB A+B Zima 2010 1680 342 1338 89,9 97,1 93,8 94,5 1111 285 826 85,7 95,1 91,3 92,3 Lato 2010 1818 386 1432 88,7 95,3 92,7 93,2 1095 258 837 84,9 94,6 90,6 91,5 Zima 2011 2034 711 1323 83,7 97,5 94,2 95,3 1320 498 822 82,4 95,0 92,0 93,1 Lato 2011 2184 1509 675 84,6 95,5 95,0 95,3 1385 974 411 87,2 92,1 82,7 89,3 147