Maria Urbańska *, Henryk Gierszal # * Akademia Rolnicza im. A. Cieszkowskiego w Poznaniu # Instytut Technik Telekomunikacyjnych i Informatycznych ITTI w Poznaniu SYSTEM BAZODANOWY DO BADAŃ MALAKOFAUNY Streszczenie W pracy tej przedstawiono możliwości wykorzystania systemu bazodowego w analizie ilościowej oraz jakościowej malakofauny. Opisano cały proces badawczy, na który składa się: pobranie próbek, oznaczenie okazów, wprowadzenie informacji do bazy danych, przygotowanie wyników w oparciu o zapytania bazodanowe oraz graficzna prezentacja rezultatów. Zaprezentowano wiele wskaźników analitycznych oraz syntetycznych pomocnych przy ocenie bogactwa i różnorodności malakofauny, które mogą być także pomocne przy waloryzacji przyrodniczej badanego obszaru. Słowa kluczowe: malakofauna, relacyjna baza danych, statystyka, wskaźniki analityczne, wskaźniki syntetyczne, analiza ilościowa, analiza jakościowa Wprowadzenie W celu porównania pod względem bogactwa malakofauny różnych terenów stosuje się liczne wskaźniki statystyczne. Pozwalają one ocenić zarówno cechy jakościowe, jak i ilościowe badanych obszarów. Ponadto wykorzystując procedury wnioskowania statystycznego możliwa jest także waloryzacja przyrodnicza analizowanych powierzchni. Aby opracować statystyki syntetycznie opisujące środowisko czy biocenozę, można posłużyć się gotowym oprogramowaniem (np. Statistica lub SPSS) lub też wykorzystać uniwersalne narzędzie programistyczne. Ponieważ w momencie rozpoczęcia badań prowadzonych na obszarze poligonu wojskowego Biedrusko koło Poznania nie były znane ani wszystkie analizowane cechy populacji ani wszystkie możliwe do zastosowania wskaźniki, zdecydowano się napisać własne oprogramowanie dedykowane do studiów nad malakofauną. Dzięki temu istnieje możliwość łatwego uzupełniania badań o kolejne statystyki z uwzględnieniem nowych zaobserwowanych lub pomierzonych cech. Za wykorzystaniem uniwersalnego narzędzia przemawiał również fakt, że jest ono łatwo dostępne, dobrze udokumentowane i łatwe do przenoszenia między stanowiskami pracy. Powstałe oprogramowanie jest bazą danych stworzoną w programie Microsoft Access. Program ten pozwala ewidencjonować zbierane okazy pod względem ilościowym (gatunek oraz jego liczebność), jak i jakościowym (m.in. wiek ślimaka, rozmiar muszli itd.). Każdemu okazowi przypisano także inne cechy, które go dokładniej identyfikują (np. teren znalezienia, datę pobrania itp.). Wszystkie obliczane w bazie danych statystyki przyrodnicze wykorzystują zapytania SQL (ang. Structured Query Language). Z kolei wielkości, wymagające większej liczby przekształceń oraz bardziej skomplikowanych operacji matematycznych czy agregujących rekordy, są wyznaczane w procedurach napisanych w języku Visual Basic. Dzięki funkcji eksportu danych do innych aplikacji (np. Excel), przygotowanie ostatecznych wyników w postaci tabelarycznej lub graficznej nie nastręcza większych problemów. Na Rys. 1 przedstawiono schemat procesu badawczego. Metodyka badań terenowych W badaniach ilościowych fauny lądowej wyróżnia się dwie kategorie metod: relatywne i absolutne. Na podstawie wyników uzyskanych metodami relatywnymi trudno w jednoznaczny Akademia Rolnicza, ul. Wojska Polskiego 71c, 0-25 Poznań, e-mail: urbanska@au.poznan.pl
sposób wnioskować o liczebnościach poszczególnych taksonów. Metody te służą zatem przede wszystkim do określenia składu gatunkowego badanego terenu. Aby móc określić dokładne stosunki ilościowe zwierząt zamieszkujących dany obszar należy posłużyć się metodami absolutnymi, które wyrażają wielkości w stosunku do jednostki powierzchni (zazwyczaj jest nią 1 m 2 ). dokumentacja fotograficzna zbieranie oznaczanie wprowadzanie danych i ich przetwarzanie Rys. 1. Przebieg procesu badawczego Fig. 1. Workflow of the research process Szczególnie w badaniach ekologicznych zwraca się uwagę na niewielki (jak dotąd) zasób informacji na temat ilościowego składu wielu bezkręgowców, a także zachodzących w tej grupie zmian. Badania tego rodzaju mogą mieć znaczenie w ochronie przyrody poprzez monitorowanie środowiska, gdyż pozwalają określać zmiany zachodzące w badanych populacjach i co za tym idzie także w otaczającym je środowisku [Alexandrowicz 1, Bajdasznikow 12, Falkner i in. 2001, Pokarżjewskij 185, Ridel 181, Wiktor 2002]. Klasycznym sposobem absolutnych badań ilościowych fauny lądowej jest metoda kwadratów. Polega ona na pobieraniu prób za pomocą metalowej ramki (biocenometru), który w przypadku ślimaków lądowych wbija się na głębokość 3- cm. W literaturze spotyka się różne wymiary biocenometrów od ramek o wymiarach 20 x 20 cm, poprzez ramki o wymiarach 25 x 25 cm aż po ramki typu 50 x 50 cm. 5 mm φ 2 mm (a) (b) Fot. 1. Zdjęcia przykładowych dwóch badanych gatunków: (a) Cecilioides acicula i (b) Acanthinula aculeata Photo 1. Two examples of found species: (a) Cecilioides acicula and (b) Acanthinula aculeata Następnie próbki przebiera się, aby odnaleźć znajdujące się w nich ślimaki. Praca ta wymaga wiele uwagi, gdyż ze względu na niewielkie rozmiary zarówno osobników młodych, jak i dorosłych (osobniki dorosłe często nie przekraczają długości 2-5 mm) istnieje duże prawdopodobieństwo ich przeoczenia (Fot. 1). Wydobyte z próbek okazy w większości oznacza się przy użyciu mikroskopu stereoskopowego. W przypadku niektórych rodzin istnieje jednak potrzeba oznaczania okazów na podstawie cech anatomicznych.
Terenów: 1 Próbek: 25 (Próbek): 25 Osobników 883 Acanthinula aculeata 8,00% 7,81% 883,00 23,05% 0,05% 728,1 Aegopinella nitidula,00% 0,11% 883,00 0,7% 0,00% 17,0 Aegopinella pura 8,00% 3,7% 883,00 13,3% 0,02% 11,7 Clausilia bidentata 0,00% 1,81% 883,00 8,51% 0,01% 558, Cochlicopa lubricella,00% 7,25% 883,00 17,8% 0,03% 585,72 Cochlicopa nitens,00% 0,23% 883,00 0,5% 0,00% 17,0 Columella edentula,00% 3,17% 883,00 11,81% 0,01% 585,72 Ena obscura 1,00% 0,57% 883,00 3,01% 0,00% 353,20 Helix pomatia 12,00% 0,3% 883,00 2,02% 0,00% 305,88 Nesovitrea hammonis 3,00% 2,15% 883,00 8,80% 0,01% 52,80 Nesovitrea petronella 8,00%,30% 883,00 1,37% 0,02% 11,7 Perforatella incarnata,00% 0,11% 883,00 0,7% 0,00% 17,0 Perforatella rubigin. 3,00% 1,7% 883,00 7,28% 0,01% 52,80 Punctum pygmaeum,00% 8,15% 883,00 22,8% 0,05% 70,0 Sucinea oblonga,00% 2,15% 883,00,73% 0,01% 585,72 Komputerowa obróbka danych Przebieg procesu obróbki danych przedstawiono na Rys. 2. Baza danych posiada kilka formularzy, które znacznie przyspieszają proces wprowadzania danych o próbce. Następnie dane podlegają weryfikacji, która ma na celu sprawdzenie ich wiarygodności oraz ewentualne wychwycenie błędów liczbowych powstałych na etapie wprowadzania danych. Dysponując kompletem danych możliwe jest stworzenie zapytania w bazie danych, które pozwala zagregować i zsyntetyzować informacje o okazach. W oparciu o taką kwerendę tworzony jest raport z wynikami, który oprócz informacji skonsolidowanych zawiera także wartości wyznaczanych wskaźników statystycznych. wprowadzanie danych weryfikacja danych Funkcjonalności aplikacji bazodanowej tworzenie kwerendy Przetwarzanie uzupełniające (post processing) Wskaźniki (łac.) Nazwa Łacińska Nazwa Polska C D A Q w P Wierność A C E Zestawienia Wykresy H N P Statystyki S T graficzna reprezentacja wyników października 2001 Strona 1 z 2 tworzenie raportu Rys. 2. Proces obróbki danych Fig. 2. Process of data mining Ponieważ graficzne reprezentowanie wyników w bazie danych wiązałoby się z dość dużym nakładem dodatkowej pracy programistycznej, zdecydowano się przygotowywać wykresy i diagramy wynikowe stosując przetwarzanie uzupełniające (ang. post processing) z wykorzystaniem dedykowanego oprogramowania typu arkusz kalkulacyjny czy pakiet analizy statystycznej. Arkusz kalkulacyjny Excel pozwalał na kreślenie wykresów. Natomiast program Statistica posłużył do wykreślania dendrogramów podobieństwa oraz trójkąta składu mechanicznego gleb (trójkąt Fereta) z liniami granic klas granulometrycznych według Polskiej Normy, Polskiego Towarzystwa Gleboznawczego lub klasyfikacji amerykańskiej. Projekt bazy danych Opracowana na potrzeby tej pracy relacyjna baza danych zawiera następujące tabele: 1. Teren tabela opisująca badany teren. Zawiera następujące pola: - identyfikator, - współrzędne geograficzne (długość i szerokość geograficzna) punktu, względem którego mierzone są rozmiary terenu (lub jego promień), - określenie położenia punktu o podanych współrzędnych geograficznych, w stosunku do którego mierzy się szerokość równoleżnikową (X) i południkową (Y) obszaru podlegającego badaniom; w przypadku terenu o kształcie koła powinien to być punkt środkowy, - opis terenu, - przybliżona powierzchnia, - rozmiar terenu (szerokość i długość w przypadku prostokąta lub promień w przypadku koła),
- skład gleby, - uwagi, 2. Próbka charakteryzująca pobierane próbki: - identyfikator, - numer próbki, - data pobrania, - ewentualne uwagi, 3. Położenie zawiera zestaw możliwych położeń punktu o podanych współrzędnych geograficznych,. Ślimak zawierająca informacje o pobranym elemencie malakologicznym: - identyfikator ślimaka, - identyfikator próbki, - identyfikator gatunku, - wiek: ad. lub juv., - wysokość, szerokość i średnica muszli, - wysokość i szerokość otworu muszli, - wysokość ostatniej spirali, - uwagi, - datę wpisania okazu, - informację czy jest to element jakościowy czy ilościowy, 5. Gatunek zawierająca opis gatunków: - identyfikator gatunku, - nazwa zwyczajowa (polska), - nazwa łacińska, - nazwa łacińska według CLECOM, - fotografia, - uwagi,. Wiek tabela, w której zapisano identyfikatory oznaczające wiek (ad. i juv.), 7. Grupy Ekologiczne tabela ta określa przynależność gatunku do poszczególnych grup ekologicznych. Relacje pomiędzy polami poszczególnych tabel przedstawiono na Rys. 3. Opis menu Menu programu zawiera następujące zestawy komend: WPROWADZANIE I PRZEGLĄDANIE INFORMACJI pozwala wprowadzać informacje o terenach, próbkach, gatunkach i ślimakach, PODGLĄD dzięki której możliwe jest przeglądanie wprowadzonych już danych i ewentualną ich korektę, WSKAŹNIKI ANALITYCZNE zawiera grupę poleceń do wyznaczania wskaźników analitycznych, WSKAŹNIKI SYNTETYCZNE służy do tworzenia raportów ze wskaźnikami syntetycznymi, GRUPY TAKSONOMICZNE podaje zbiorcze wyniki dla wybranej grupy taksonomicznej. Wprowadzanie danych Dane można wprowadzać wykorzystując jeden z dwóch formularzy. Formularz szczegółowy ŚLIMAK pozwala wprowadzić oprócz danych podstawowych (TEREN, OZNACZENIE PRÓBKI, GA- TUNEK ŚLIMAKA i WIEK) także wymiary muszli. Natomiast formularz ŚLIMAKI powstał w celu wprowadzania jedynie danych ilościowych z uwzględnieniem wieku ślimaków. Przyspiesza to czas wprowadzania danych.
Sprawdzanie poprawności danych Po wprowadzeniu danych należy zweryfikować ich poprawność poprzez sprawdzenie zagregowanej liczebności w rozbiciu na teren, próbki, gatunki i wiek. Służy do tego menu PODGLĄD. Formularze PRZEGLĄD ŚLIMAKÓW i PRZEGLĄD PRÓBKI składają się z dwóch części. Dolna część okna zawiera podformularz do poprawiania danych. Wybierając dowolny wiersz zagregowanych danych w górnym podformularzu, w dolnym formularzu są wyświetlane informacje rozbite na pojedyncze okazy. Można je usuwać lub dopisywać. Rys. 3. Schemat relacji w bazie danych Fig. 3. Scheme of database relations Tworzenie raportów wynikowych Wygenerowanie raportu zawierającego daną statystykę jest dwu etapowe: 1. tworzone jest zapytanie (kwerenda) określające jakie elementy bazy danych brane są pod uwagę przy wyznaczaniu statystyki, 2. wybierany jest jeden ze wskaźników, który ma być wyznaczony. Tworzenie zapytania Tworzenie zapytania przebiega w czterech krokach. Wybiera się: 1. gatunki precyzuje się gatunki oraz ich wiek, które mają być uwzględniane przy generowaniu statystyki, 2. tereny określa się teren poddawany analizie statystycznej, 3. próbki definiuje się próbki, dla których zostaną wyznaczone wskaźniki,. rozmiary muszli ślimaka podaje się zakres rozmiarów muszli, które mają być wzięte pod uwagę podczas analizy. W opracowanej bazie danych zastosowano następujące mechanizmy agregacji rekordów: standardowe kwerendy SQL, które pozwalają w łatwy sposób zestawiać i podsumowywać rekordy zgodnie z wprowadzonym zapytaniem, obiekty Recorset języka Visual Basic, które są wykorzystywane w specjalnie napisanych procedurach do porządkowania rekordów, kolekcje, które są stosowane w procedurach języka Visual Basic jako zmienne tymczasowe pozwalające na szybki dostęp do pewnych danych, co skraca czas przetwarzania danych.
Wybór wskaźnika Wyznaczane statystyki są podzielone na dwie grupy: wskaźniki analityczne, wskaźniki syntetyczne. Do wskaźników analitycznych należą: liczebność, abudancja określa liczbę osobników przypadających na jednostkę powierzchni, gęstość określa liczbę gatunków występujących w danym środowisku na określonej jednostce powierzchni, formułę jednorodności, która określa charakter rozmieszczenia oraz obecność gatunków w zoocenozie, różnorodność gatunkowa, która pozwala ocenić miarę stabilności biocenozy; miarę tą wyznaczano m.in. z wykorzystaniem wzoru Shannona-Weavera, stałość określa obecność danego gatunku w obrębie badanej biocenozy, struktura dominacyjna, która została przedstawiona np. w matematycznym modelu MacArthura [MacArthur 157, 10]. W myśl założeń tego autora pozycję dowolnego r-tego gatunku w strukturze dominacji zespołu p r można obliczyć ze wzoru, zagęszczenie przeciętne, dominacja wyraża stosunek liczby wszystkich osobników danego gatunku do liczby wszystkich osobników badanej grupy systematycznej, wysokość, szerokość i średnica muszli, wysokość i szerokość otworu oraz wysokość ostatniej spirali, stosunki wymiarów muszli, histogram gatunek-abudancja, wskaźnik różnorodności ADI, znormalizowany wskaźnik różnorodności TDI, dyspersja. Możliwe do wyznaczenia w stworzonym oprogramowaniu wskaźniki syntetyczne obejmują następujące statystyki: wskaźnik Q, wartość systematyczna grupy gatunków określa udział procentowy jaki ma dana grupa gatunków (lub gatunek) w określonej zoocenozie, wierność, czyli stopień związania danego gatunku z badanym środowiskiem czy zgrupowaniem, współwystępowanie gatunków określa podobieństwo między komponentami zoocenozy, podobieństwo terenów, które może być stosowane do zwymiarowania różnic powstałych w populacji i strukturze ekosystemu; wykorzystywano m.in. wzór zaproponowany przez Marczewskiego i Steinhausa [Marczewski i Steinhaus 15], wartości formuły dyskryminacyjnej [Alexandrowicz 15]. Program pozwala także przeprowadzić analizę taksonomiczną uwzględniającą jeden z dwunastu podziałów podanych zbiorczo przez Alexandrowicza [Alexandrowicz 187]. Raporty Generowany raport można wydrukować lub zapisać w postaci pliku typu rtf. Eksport do formatu rtf pozwala następnie wczytać dane do arkusza kalkulacyjne (Excel) lub do oprogramowania analizy statystycznej (Statistica) w celu ich dalszej obróbki (ang. post processing). Programy te są wykorzystywane przede wszystkim do graficznej prezentacji wyników (Rys. ).
C, D, Q 80,00% 70,00% 0,00% 50,00% 0,00% 30,00% 20,00% 10,00% 0,00% Cochlicopa lubricella Clausilia bidentata Vallonia costata Nesovitrea hammonis 7 8 7 8 Vitrea crystallina Carychium minimum Vitrina pellucida Cecilioides acicula Ena obscura Nesovitrea petronella Acanthinula aculeata Perforatella rubigin. Vallonia pulchella Aegopinella pura Euomphalia strigella Succinea oblonga Zonitoides nitidus 250 200 150 100 50 0 P C D P Q (a) 5 2 5 1 1 2 1 2 5 7 8 (c) Acanthinula aculeata późna jesień Aegopinella nitidula Aegopinella pura Carychium minimum Carychium tridentatum wczesna jesień Cecilioides acicula Cepaea hortensis Clausilia bidentata Cochlicopa lubricella lato Columella edentula Ena obscura Helix poma tia Nesovitrea hammonis późna wiosna Nesovitrea petronella Perforatella rubigin. Succinea oblonga Vallonia costata wczesna wiosna Vallonia pulchella Vitrea crystallina Vitrina pellucida 0% 0% 0% 80% 100% Zonitoides nitidus 100% 1 2 25 28 2 0% 25 28 50 1 3 51 80% 51 3 1 31 70% 0% 15 52 12 8 11 7 7 50% 5 2 0% 2 28 3 1 Odsetek poszczególnych grup ekologicznych 30% 18 81 23 3 23 2 10% 13 51 83 3 2 0% wczesna wiosna późna wiosna lato wczesna jesień późna jesień (b) (d) RAD_WW RAD_L RAD_PW Obiekt RAD_WJ RAD_PJ RAD_7 GO PR S JG 100% PIASEK gp 10% pg 3 ps 1 5 2 12 15 13 1 8 p 11 10 1 7 0% 80% 17 70% IŁ IL 100% 0% 10% 80% 70% 30% 0% 0% Pyl. CZW_WW Il 50% 50% CZW_PW 0% 0% CZW_L 30% 70% CZW_PJ 80% CZW_WJ 10% 0% 0,2 0,3 0, 0,5 0, 0,7 0,8 0, 1,0 100% 0% 80% 70% 0% 50% 0% PIASEK PIASEK. PYL PYŁ Odleg³oœæ Odległość wiązań wi¹z. (e) (f) Rys.. Przykłady graficznej prezentacji wyników działania bazy danych przygotowanych w arkuszu kalkulacyjnym Excel (a-d) oraz w programie Statistica (e-f): (a) dominacja, stałość i wskaźnik Q, (b) spektrum malakologiczne, (c) walencja ekologiczna, (d) sezonowe wahania liczebności w grupach taksonomicznych, (e) analiza taksonomiczna czy (f) skład granulometryczny gleby Fig.. Examples of graphical presentation of results. Figures are prepared with Excel datasheet (a-d) or Statistica software (e-f): (a) dominance, constancy and Q index, (b) species spectrum, (c) ecological amplitude, (d) seasonal changes of quantity within taxonomical groups, (e) taxonomical analysis or (f) granulometric composition of soil Piasek 30% 10% 100% Podsumowanie Napisany program jest bardzo wygodnym i elastycznym narzędziem do opracowywania wyników badań malakofauny pod względem ilościowym, jak i jakościowym. Dzięki kilkuetapowej procedurze tworzenia zapytania, wynikowy raport może być ograniczany do niewielkiej populacji o ściśle wybranych parametrach. Ze względu na liczbę rekordów (obecnie ponad 3000) oraz zastosowanie nieraz mało efektywnych procedur (np. kopiowania części tabel w celu zabezpieczenia danych przed uszkodzeniem a jednocześnie w celu zwiększenia wygody pracy), omawiana baza danych wymaga komputera o dość dużej mocy obliczeniowej (co najmniej klasy Pentium I 150 MHz).
Bibliografia Alexandrowicz S.W. 187, Analiza malakologiczna w badaniach osadów czwartorzędowych, Zeszyty Naukowe, Geologia, 12, 1-2, AGH, Kraków Alexandrowicz S.W. 1, Perspektywy ochrony współczesnej i subfosylnej malakofauny województwa krakowskiego. Chrońmy Przyr. Ojcz. 50, 5: 3-53 Alexandrowicz S.W. 15, Ruins of Carpathian Castles as Refuges of Land Snails, Ochrona Przyrody, 52: 3-18 Bajdasznikow A.A. 12, Naziemnaja malakofauna Ukrainskogo Polesja. Soobszczenie 1. Widiwoj sostaw i swiaz moljuskow s rastitelnym pokrowom. Wjesti zool. Nr : 13-1 Falkner G., Bank R.A., T. von Proschwitz 2001, Check-list of non-marine Molluscan Species-group taźa of the States of Northern, Atlantic and Central Europe (CLECOM I). Helidia, Vol., Part 1/2: 1-7, München MacArhur R.H. 157, On the relative abudance of bird species, Proc. Nat. Acad. Sci. US, 3: 27-25 MacArhur R.H. 10, On the relative abudance of species, Amer. Natur., : 25-3 Marczewski E., Steinhaus H. 15, Odległość systematyczna biotypów, Zastosowania matematyki,, Warszawa-Wrocław: 15-203 Pokarżjewskij A.D. 185. Geochimiczeskaja ekologia naziemnych żywotnych. M. Nauka: 300 Ridel A. 181. Mięczaki (Mollusca). [w:] Stan zbadania fauny Polski. Przegląd Zoologiczny 25: 251-257 Wiktor A., Ridel A. 2002. Gastropoda terrestria Ślimaki lądowe. [w:] Głowaciński Z. (Red.). Czerwona Lista Zwierząt Ginących i Zagrożonych w Polsce. PAN Instytut Ochrony Przyrody, Kraków: 27-33 DATABASE SYSTEM IN RESEARCH OF TERRESTRIAL SNAILS Summary In this work possibilities of the database system in the quantitative and qualitative analysis of terrestrial snails are presented. Whole research process has been described. It comprises acquisition of samples, identification of species, input of gathered data into the database, preparing of table results using database queries and finally graphical presentation of obtained results. Many analytical and synthetical indicators are given that can be helpful in the nature valorisation of an analysed area. Key word: terrestrial snail, relation database, statistics, analytical indicator, synthetical indicator, quantitative analysis, qualitative analysis