WYŻSZA SZKOŁA INFORMATYKI WYDZIAŁ ZAMIEJSCOWY WE WŁOCŁAWKU KIERUNEK INFORMATYKA PRACA DYPLOMOWA INŻYNIERSKA

WYŻSZA SZKOŁA INFORMATYKI WYDZIAŁ ZAMIEJSCOWY WE WŁOCŁAWKU KIERUNEK INFORMATYKA PRACA DYPLOMOWA INŻYNIERSKA Tytuł pracy: Organizacja i użytkowanie internetowych banków danych dla nauki i technologii. Imię i Nazwisko: Marcin Patyk Studia: Dzienne Specjalność: Grafika komputerowa Nr albumu: 10907 Promotor: prof. Zbigniew Kierzkowski Rok akademicki 2007/2008

SPIS TREŚCI STRESZCZENIE....................................3 Wprowadzenie...................................... 4 1. 1.1. Problemy 1.2. Cel tematu................................7 i zakres pracy.............................. 12 Sieciowa organizacja przechowywania zasobów cyfrowych i 2.. komputerowej wymiany informacji..................... 14 3. Dostęp do informacji przedmiotowej na przykładzie STN....23 4. Problemy realizacji dostępu do informacji naukowej........36 5. Podsumowanie..................................... 55 LITERATURA.................................... 57 ZAŁĄCZNIKI.....................................58 Wydruk z PLAGIAT.PL............................. 59 POSTERY........................................ 92 3

STRESZCZENIE Organizacja i użytkowanie internetowych banków danych to nie tylko same bazy danych, ale również społeczeństwo informacyjne. Społeczeństwo informacyjne to społeczeństwo, w którym informacja jest bardzo intensywnie wykorzystywana w życiu kulturalnym, ekonomicznym, społecznym i politycznym. Społeczeństwo informacyjne to również bogate środki komunikacji i przetwarzania informacji, będące podstawą tworzenia większości dochodu narodowego oraz zapewniające źródło utrzymania większości ludu, to w tym społeczeństwie model edukacyjny oparty jest na kształceniu przez całe życie a informacja odgrywa jedna z najważniejszych ról w codziennym życiu każdego z nas. Dostęp do informacji naukowej to jeden z punktów mojej pracy o którym wspomniałem w dalszej części opracowania. Poruszyłem tutaj aspekt budowy oraz funkcjonowania ogromnego banku danych, przedstawiłem cały proces pozyskiwania informacji od momentu logowania do momentu pobrania informacji na ściśle określony temat z danej dziedziny nauki. W pracy przedstawiony został również problem przekształcenia rozproszonych struktur informacyjnych, traktowanych jako współczesne komputerowe bazy danych, w których to struktury informacyjno semantyczne traktowane są jako wirtualne bazy danych. Bazy danych są to złożone systemy, które posiadają wzajemnie wiążące się modele. Modele te przedstawiają opisy logiczne czyli strukturę formalnych plików i rekordów tworzących bazy, semantyczne tzw. treściowe opisy baz danych. Opisy fizyczne zawierają informacje dotyczące rozmieszczenia plików i rekordów na nośniku z danymi oraz techniczne czyli opisy dotyczące konfiguracji urządzeń oraz oprogramowania realizacji baz. W wirtualnych bazach danych tworzone są struktury informacyjno semantyczne na podstawie sieciowego zasilania ich z baz danych, zachowując przy tym spełnione warunki odwracalności danej struktury informacyjnej w inne. W opracowaniu również zwróciłem uwagę na podstawowe cechy w systemie baz danych opartych na strukturze klient serwer, starając się uwzględnić aspekt efektywności pozyskiwania informacji z baz danych. 4

1. Wprowadzenie Koncepcja wirtualnej bazy danych jest wynikiem dążenia do uniezależnienia logicznej struktury bazy danych użytkownika od struktur logicznych lokalnych, z których użytkownik ten korzysta w trybie zdalnego dostępu, oraz od struktury fizycznej układu baz danych rozproszonych w sieci komputerowej. Inaczej mówiąc, wirtualna baza danych jest to baza danych utworzona na życzenie użytkownika i dostosowana do jego indywidualnych potrzeb, działająca na zasadzie zdalnego dostępu w czasie rzeczywistym lub quasi-rzeczywistym, poprzez sieć komputerową, do rozproszonych zasobów informacyjnych mieszczących się w ogólno dostępnych lokalnych bazach danych. Rozwiązując swoje zadanie aplikacyjne za pomocą wirtualnej bazy danych, użytkownik posługuje się jedynie jej strukturą informacyjną i logiczną, nie musi natomiast znać pełniej struktury informacyjnej dotyczącej jego usprzętowienia i bazowego oprogramowania. Z wirtualna bazą danych współpracuje on zatem jak z lokalną bazą danych utworzoną na jego indywidualny użytek. Można posłużyć się następującą analogią. Naukowiec zamierzający prowadzić badania w określonej dziedzinie i korzystać w tym celu z zasobów dużego archiwum, nie musi orientować się w zawartości i tematycznym podziale zasobów całego archiwum, rozmieszczeniu poszczególnych teczek na półkach archiwalnych itp. Jeśli organizacja obsługi użytkowników jest wystarczająco sprawna, użytkownikowi wystarczy utworzony według jego własnych zasad podkatalog aktualnie interesujących go teczek dokumentów(wraz z ich sygnaturami archiwalnymi) i ogólna znajomość ich zawartości, aby w toku pracy, w miarę potrzeby, mógł on żądać dostarczenia na biurko określonych teczek w celu ich doraźnego wykorzystania, a następnie zwrotu, po wykorzystaniu, na półki archiwalne. Ideę takiego wirtualnego archiwum użytkownika można łatwiej zrealizować, kiedy zasoby archiwalne umieszczone są na nośnikach maszynowych, a pracę archiwistów zastępuje sprawny system zdalnego dostępu do zasobów sieciowych użytkownika. Zrozumiałe jest jednak, że nie każdą koncepcje wirtualnej bazy danych wymyśloną przez użytkownika można zrealizować na bazie realnie istniejącego układu rozproszonych baz danych. Pomijając ograniczenie organizacyjne lub techniczne, istotnymi ograniczeniami są w tym przypadku: zawartość treściowa lokalnych baz danych tworzących układ rozproszony oraz ich spójność semantyczna i logiczna. Mówiąc dokładniej, struktura informacyjna i logiczna rozproszonej bazy danych jest ograniczeniem dla struktur informacyjnych i logicznych baz wirtualnych, jakie mogą być tworzone za pomocą jej informacyjnych zasobów. 5

Bank danych jest to zbiór baz danych zapisanych w ściśle określonej kolejności odpowiadających złożonemu modelowi danych. W potocznym języku są to dane oraz wyspecjalizowany program komputerowy do ich gromadzenia i przetwarzania. Taki program, bardzo często zbiór kilku programów nosi nazwę Systememu zarządzania bazą danych. Banki danych oparte są głównie na danych tekstowych oraz liczbowych, lecz ostatnio coraz częściej są to dane binarne czyli grafika, muzyka itp. Wśród baz danych wyróżnia się dwa typy baz: bazy proste bazy złożone Bazy proste: bazy kartotekowe sieciowe bazy danych hierarchiczne bazy danych Bazy złożone: bazy relacyjne bazy obiektowe bazy relacyjno obiektowe strumieniowe bazy danych temporalne bazy danych o Bazy kartotekowe 6

W bazach kartotekowych, każda tablica danych jest traktowana jako osobny dokument, który nie może współdziałać z innymi tablicami. Z tego typu baz korzysta wiele programów typu: książka telefoniczna, książka kucharska, spisy książek i inne. Cechą która łączy te bazy jest zastosowanie ich w tym samym celu. o Sieciowe bazy danych Model historyczny, pozwalał tylko na związki binarne: wiele do jeden. o Hierarchiczne bazy danych Przykładem tej bazy jest baza opracowana przez IBM, która nazywała się IMS (ang. Information Management System). o Bazy relacyjne W relacyjnych bazach danych wiele tablic danych może ze sobą współpracować. Bazy te posiadają wewnętrzne języki programowania, wykorzystujące zwykle SQL do przemieszczania się po ich informacjach. o Bazy obiektowe Dane w tych bazach przechowywane są w strukturach obiektowych(zdefiniowanych jako klasy). o Bazy relacyjno obiektowe Bazy te pozwalają na manipulowanie danymi jako zestawem obiektów, posiadają jednak bazę relacyjną jako wewnętrzny mechanizm przechowywania danych. o Strumieniowe bazy danych Są to bazy danych w których dane są przedstawione w postaci zbioru strumieni danych. Strumieniowe bazy danych z reguły implementują języki ciągłych zapytań opartych na SQL u. 7

o Temporalna baza danych Jest to odmiana bazy relacyjnej, w której każdy rekord posiada stempel czasowy, określający czas w jakim wartość jest prawdziwa. 1.1 Problemy tematu Głównym i najważniejszym pojęciem dotyczącym sieci naukowo technicznych jest środowisko, w którym zostały stworzone. Środowiskiem tym jest społeczeństwo informacyjne. Po raz pierwszy pojęcia społeczeństwo informacyjne zostało zastosowane w 1963r. przez Tadao Umesao w artykule o teorii ewolucji społeczeństwa opartego na technologiach informatycznych. W 1968 roku termin ten spopularyzował K.Koyama w rozprawie INTRODUCTION TO INFORMATION THEORY przedstawiając wizję społeczeństwa nowej ery. Pierwsze pięć lat po zakończeniu drugiej wojny światowej czyli lata 1945 1950 to czas pierwszej komputeryzacji wielu dziedzin nauki związanych między innymi z wojskiem, obroną i badaniem wszechświata. W latach 1950 1970 komputeryzacja rozpowszechniła się również na obszarach przedsiębiorstw. Ważne zaczęły być instytucje i organizacje a na czele nauk pojawiło się zarządzanie. W latach 1970 1980 celem aktywności bogatych państw stał się dobrobyt i opieka społeczna a przedmiotem zainteresowań firm komputerowych i badaczy stała się ludność. Ostatnie dwadzieścia lat XX wieku i początek XXI wieku to czas wielkiej komputeryzacji działań jednostkowych. Głównym przedmiotem zainteresowań stałą się jednostka zaś wzorcem informacyjnym twórczość intelektualna. Opisana powyżej przemiana życia społecznego oraz zmienność wzorca informacyjnego doprowadziły do wykreowania społeczeństwa nowego typu. Ten typ społeczeństwa nazwano SPOŁECZEŃSTWEM INFORMACYJNYM, SPOŁECZEŃSTWEM INFORMATYCZNYM a nawet SPOŁECZEŃSTWEM SIECI. SPOŁECZENSTWO INFORMACYJNE TO SPOŁECZEŃSTWO, W KTÓRYM: 8

kompetencje społeczeństwa pozwalają na skuteczne i krytyczne przekształcanie informacji w wiedzę i wykorzystaniu jej posługiwanie się wiedzą i różnymi bogactwami staje się źródłem ludzkiego bogactwa przepustka pozwalającą na dobrobyt i prestiż społeczny są kompetencje wyłania się klasa twórcza skupiająca między innymi naukowców, inżynierów, architektów, artystów i innych specjalistów, którzy bazują na swoich kompetencjach w biznesie, edukacji, służbie zdrowia, prawie i wielu innych zawodach wiedza staje się najdroższym towarem i wyznacznikiem wszelkich przemian społecznych informacja staje się przedmiotem pożądania ale i ochrony Informacja jest szczególnym tworem, któremu to przypisuje się wiele właściwości np.: wysoki stopień integracji informacji z komunikacją potencjalne zyski z tytułu jej posiadania szybkość jej pojawienie się i rzetelność w dłuższym odcinku czasu powtarzalność i niepowtarzalność dostępność trafność wiarygodność i niezawodność bezpieczeństwo i żywotność W społeczeństwie funkcjonuje również swoisty paradoks informacji jako towaru, gdyż różni się on tym od jakichkolwiek innych dóbr oraz usług, tym iż między sprzedającym a kupującym informacje, występuje całkowita asymetria informacyjna. Nabywca nigdy nie wie co kupuje, więc poszukuje informacji o informacji czyli tak zwanej meta informacji. 9

W wymiarze społecznym pojawiło się zjawisko prawa do informacji. Ten ostatni aspekt ma długie tradycje, gdyż sięga aż XVIII wieku, kiedy to w Szwecji w 1766 roku przyjęto ustawę o wolności prasy, druku i swobodnego głoszenia opinii. Od tego czasu, każde państwo chcące uchodzić za demokratyczne wprowadzało na swym terytorium podobne zasady. Ekspresowy przyrost informacji jest najbardziej charakterystycznym i zarazem dramatycznym znakiem naszych czasów. W obecnych latach człowiek wytwarza tyle informacji przez dwa lata, co kiedyś ludziom zajmowało trzysta lat. PRZYKŁADOWO: człowiek średniowiecza recytował zaledwie tyle informacji ile dziś zawiera zaledwie jeden egzemplarz gazety Rzeczpospolita STN ma pomóc w wartościowaniu, gromadzeniu, zarządzaniu i przetwarzaniu informacji naukowo technicznej. Wszystko w celu aby do jednostki docierały dobrze wybrane i wyselekcjonowane, zgodne z wymaganiami, zainteresowaniami i motywacjami informacje. Znaczenie informacji naukowej i działalność naukowo informacyjna dla technicznego, gospodarczego i kulturalnego społeczeństwa informacyjnego jest ogromna. Informacja jest zasilającym naukę zasobem, który musi być gromadzony, chroniony, zagospodarowany a zadaniem działalności naukowo informacyjnej jest udostępnienie wyników nauki lub osiągnąć praktyki w celu wykorzystywania do dalszego rozwoju nauki, kultury i gospodarki. Systemy wymiany informacji Na przełomie lat 1970 1980 rozpoczęto prowadzenie badań, które umożliwiły realizacje pierwszych systemów komputerowej wymiany informacji. Synteza systemów wymiany informacji wynika obecnie w coraz większym stopniu, z możliwości wykorzystywania usługi koordynacji informacji, wywodzących się z tradycyjnego modelu Klient Server. Dostęp do informacji jest możliwy na różnych poziomach: 10

zarządzania projektowania redakcji autorstwa informacji użytkownika informacji Wśród rekomendacji praktycznej wymiany informacji można było wyodrębnić między innymi: poczta elektroniczna przesyłanie zbioru ftp wyszukiwanie za pomocą programu lynx usługa gopher Konfigurowanie struktur komputerowych przeznaczonych do wymiany informacji polega na : doborze medium i sterowników transmisji danych doborze urządzeń do realizacji powiązań komunikacyjnych zapewnieniu koordynacji oprogramowania usług sieciowych zapewnieniu sprawnego przepływu informacji Połączone siecią komputery stają się obecnie ważna bazą wspomagania informacjami podczas badań. Systemy KIWI są wariantami nowych systemów informatycznych opartych na metodach komputerowo integrowanej organizacji działań (KIOD). Nowe systemy informacyjne oparte są na strukturalizacji dostępu do światowych zasobów informacyjnych, rozpowszechnianiu i tworzeniu lokalnych zasobów informacyjnych oraz organizacji koordynacji wspomagania informacyjnego działań grupowych. Spośród światowych zasobów informatycznych wyróżnić można kilka typów: 11

bibliografię informacje tekstowe archiwa komputerowe pliki komputerowe informację naukową i techniczną Jeśli chodzi o klasyfikację światowych zasobów informacyjnych rozpatrujemy ja głownie na podstawie udostępniania informacji oraz korzystania ze światowych komputerowych powiązań sieciowych. Pośród tych zasobów szczególne miejsce zajmują katalogi biblioteczne, archiwa oraz banki danych w systemie STN. Rodzaj zasobu Bibliografia Informacje.. dd naukowe Informacje tekstowe Pliki komputerowe Archiwa Strukturalizacja danych Katalogi Teksty Hiperteksty Banki danych: a)faktów b)krytycznie ocenianych danych c)wzorców rozpoznań d)wzorców interpretacji I wnioskowań Listy Dokumenty Oprogramowanie Informacje tekstowe Informacje graficzne Informacje dźwiękowe Archiwery obejmujące pliki Sposoby dostępu z wykorzystaniem usług sieciowych Terminalowy, ze wspomaganym wyszukiwaniem Terminalowy Poczta elektroniczna Terminalowy, ze wspomaganiem wyszukiwania Terminalowy ze wspomaganiem wyszukiwania Terminalowy ze wspomaganiem wyszukiwania Udział użytkownika Korzystanie Korzystanie Korzystanie i przekazywanie Korzystanie i przekazywanie Korzystanie i przekazywanie Kryterium Zasoby informacyjne w rozległych sieciach komputerowych dla wspomagania prac badawczo rozwojowych ICSO. Do zasobów informacyjnych wykorzystywanych w praktyce ICSO należą: STN, Dialog, ORBIT, SWEC, a także własne lokalne bazy danych (publikacje, patenty, sprawozdania badawcze) i zakupione (POLPAT, UUP, NATURA). Modelowania działań badawczo rozwojowych. Proces działań badań badawczo rozwojowych obejmuje: formułowanie potrzeb, Opracowanie nowej technologii i wytwarzania określonego produktu, wynikającej z badan rynku lub na bezpośrednie zlecenie producenta, sprecyzowanie tematu badawczego wynikającego z potrzeb, rozpoznanie literaturowe dotyczące tematu badawczego, wybór koncepcji procesu chemicznego na podstawie danych literaturowych, opracowanie koncepcji technologicznej, 12

planowanie badań, badania laboratoryjne, określenie wpływu zmiany skali produkcji na przebieg procesu opracowanie projektu procesowego, opracowanie założeń techniczno ekonomicznych produkcji, projektowanie techniczne, realizacja. Usługi Internetu we wspomaganiu działań badawczo rozwojowych. Z analizy doświadczeń korzystania z Internetu w ramach sieci komputerowej LANICSO w pracach badawczo rozwojowych wynika, że korzysta się z usług takich jak: poczta, telnet, ftp. Usługę telnet wykorzystuje się w ramach serwisów komercyjnych: STN, DIALOG, SWETS. W pracy biblioteki najczęściej korzysta się z tzw. Systemu CARLS (zbiór katalogów kilku bibliotek amerykańskich oraz katalogów biblioteki Kalifornijskiej w Melvyl). Korzysta się także z banków danych SWETS. Dla praktyki wyszukiwania informacji wygodne są usługi wspierania wyszukiwania informacji. 1.2 Cel i zakres pracy. Celem pracy jest bliższe przedstawienie społeczeństwa informacyjnego jaki i budowy banków danych na świecie oraz ich organizacja. Społeczeństwo informacyjne to bardzo interesujący i obszerny temat o którym można by pisać bardzo wiele. Ja w swej pracy postaram się opisać funkcję i rolę społeczeństwa informacyjnego w dzisiejszych czasach jak i cofając się w głąb naszej historii. W pracy zaprezentuję również strukturę budowy olbrzymiego banku danych STN International oraz proces pozyskiwania informacji z jego olbrzymich baz danych. Opiszę również ogólnie strukturę informacyjną rozproszonych i wirtualnych baz danych a także proces pozyskiwania informacji z baz danych oraz standaryzację obsługi transakcji wyszukiwania. 13

Opracowanie procedur tworzenia i przekazywania informacji jest częścią prac badawczych laboratorium WOD Łódź Olsztyn Polkowice Poznań Włocławek w ramach projektu pt. organizacja i użytkowanie internetowych banków danych dla nauki i technologii, zorientowanego na tworzenie wspólnej struktury komunikacji na współ (semi) bezpośredniej otwartej, opartej na współdziałaniu rozproszonych Multimedialnych Centrów Informatycznych KsBO MCI Poszczególnym osobom zostały przydzielone inne kompetencje z dziedziny informatyki przy pracy nad wspólnym projektem: 1. Paweł Rygiewicz archiwizacja zasobów cyfrowych. 2. Marcin Politowski elektroniczny dostęp do bibliografii. 3. Jarosław Trzmielewski usługi bibliotek wirtualnych. 4. Marcin Patyk dostęp do informacji naukowej. 14

Rys 1. Przydział kompetencji Każda z osób zajmująca się odrębną częścią projektu ma określone inne działanie z czego wynika tworzenie się nowych profili zawodowych. Wśród nich można wyróżnić: Organizer - kompetencja obejmująca tworzenie struktur przechowywania wiedzy, tworzenie centrów i powiązań między nimi, organizacja danych w centrach informacyjnych Digitariusz - kompetencja obejmująca tworzenie cyfrowych zasobów wiedzy, kreowanie środowiska medialnego tworzenia zasobów oraz ucyfrawianie istniejących zasobów Kognitariusz - kompetencja służąca kategoryzacji wiedzy, jej strukturalizacji, oraz strukturalizacji danych Koordynator - kompetencja służąca do koordynowania pracy w grupie Developer kompetencja służąca do tworzenia lub projektowania struktur dostępu do danych 2. Sieciowa organizacja przechowywania zasobów cyfrowych i komputerowej wymiany informacji. Systemy rozproszone a STN. STN jest oparte na grupie rozproszonych, współpracujących ze sobą usług, w celu zapewnienia pełnej funkcjonalności. Usługi te wymagają dostępu do baz danych dlatego 15

możliwe jest współdzielenie jednej bazy danych lub korzystanie z kilku baz jednocześnie. W przypadku przeciążenia sieci komputerowej co w znaczącym stopniu usprawni wyszukiwanie informacji. System dla STN powinien: być wysoce funkcjonalny być wysoce konfigurowalny umożliwiać dostęp użytkownikowi przez interfejs WWW zapewniać zaawansowane narzędzia dla administratora przechowywać i udostępniać obiekty cyfrowe dowolnego typu np. HTML, PDF, pliki audio użytkownik ma możliwość przeglądania poszczególnych obiektów i ich treści Architektura usług rozproszonych Rys. 2 Architektura usług rozproszonych Metadata zapewnia możliwości definiowania, modyfikowania i usuwania atrybutów Server wykorzystywanych do opisu treści cyfrowej 16

Contect daje dostęp do treści gromadzonych w bazach danych Server Search pozwala użytkownikowi na przeszukiwanie zebranej treści i meta danych, jest Server odpowiedzialny za indeksowanie treści Use Server Zawiera informacje związane z użytkownikami systemu Klasyfikacja zasobów informacyjnych światowych. I. Bibliografia katalogi teksty hiperteksty II. Informacje naukowe banki danych o faktów o wzorców interpretacji i wnioskowań o wzorców rozpoznań o krytycznie ocenianych danych III. Informacje tekstowe listy dokumenty IV. Pliki komputerowe oprogramowanie 17

informacje graficzne informacje tekstowe informacje dźwiękowe V. Archiwa archiwery obejmujące pliki Rys. 3 18

Struktura informacyjna baz danych. Użytkownicy rozproszonych baz danych najczęściej posiadają uprawnienia do przeszukiwania i przeglądania informacji w lokalnych bazach danych. Taki użytkownik ma również prawo do przetwarzania tej informacji we własnym zakresie według własnych potrzeb. Aby użytkownik mógł zrealizować swe zadanie musi posiadać informację o zasobach informacyjnych z dostępnych dla niego lokalnych baz danych. Taka informacja jest określana jako meta informacja o zasobach informacji przedmiotowej. Metainformacja to: informacja formalna o dokumentach lub zapisach dane dotyczące źródła pochodzenia dokumentu lub zapisu charakterystyka zawartości treści ocena trafności i rzetelności informacji odwołanie do innych dokumentów o podobnej tematyce zasady udostępniania dokumentów lub zapisów Dzięki meta informacji użytkownik ma możliwość dotarcia do interesującej go informacji przedmiotowej. Metainformacja jest więc podstawą podczas planowania i sterowania procesem realizacji zadań informacyjnych. Przez strukturę informacyjną baz danych rozumiemy sformalizowany opis jej zawartości informacji oraz meta informacji, uwzględniając przy tym ich strukturę semantyczna odwzorowaną w strukturze logicznej baz danych. Budowa logicznej bazy danych określa ich szczegółowy podział na jednostki oznaczone indywidualnym adresem logicznym tak zwanym identyfikatorem oraz układ relacji pomiędzy tymi jednostkami. We współczesnych systemach takimi jednostkami są pola, pliki i rekordy. Jeżeli natomiast zaistnieje taka potrzeba mogą zostać tworzone jednostki wyższego rzędu. Związek pomiędzy logicznymi jednostkami nazywamy formalnym, jeżeli odzwierciedla on zakładana kolejność rekordów w pliku lub pól w rekordzie o ściśle określonej strukturze, ale również może on być narzucony przez odsyłacze rekordów jednego pliku do rekordów w innym pliku. 19

Przez semantyczną strukturę zasobów informacyjnych rozumiemy ich podział na jednostki semantyczno informacyjne oraz układ wiążących je relacji semantycznych. Jednostką informacyjno semantyczna nazywamy taką wyodrębnioną część zasobu informacyjnego, której można przypisać określoną wartość znaczeniową (treść), będącą denotatem obiektu, stanu lub procesu związanego z określonym modelem abstrakcyjnym. 1 Taką jednostką może być pojedynczy atrybut w rekordzie rozmiar, cały rekord nazwa produktu czy plik zawierający listę rekordów na przykład nazwa wszystkich produktów tego samego producenta. W tej sytuacji jednostki informacyjno semantyczne są takie same jak jednostki struktury logicznej bazy danych. To jednak nie jest regułą ani warunkiem w zwłaszcza słabo sformatowanej bazie danych. W pliku tekstowym jednostkami semantyczno informacyjnymi mogą być wyodrębnione formuły matematyczne wraz z dotyczącymi ich komentarzami. Jednostką informacyjno semantyczną rzędu wyższego może być cały dokument zapisany w postaci pliku tekstowego, a także zbiór dokumentów dotyczących tego samego problemu. Semantyczna budowa zasobu informacyjnego wskazuje na powiązania treściowe między jednostkami: Na poziomie dokumentów na ich obszary tematyczne i stopień podobieństwa treści pomiędzy równorzędnymi dokumentami Na relacje typu: część nadrzędna część składowa, tak zwane zależności mereologiczne pomiędzy jednostkami różnych rzędów Na relacje hierarchiczne Na relacje kwalifikujące typu porządkującego Na relacje podobieństwa dokumentów wynikające ze sposobu w jaki został przedstawiony problem Na relacje klasyfikacji, które są implikowane przez podobne relacje występujące pomiędzy przedstawionymi obiektami Lista takich relacji mogła by być o wielę większa. Znajomość struktury semantycznej zasobów informacyjnych jest dla użytkownika bardzo ważną rzeczą, dzięki której może sobie ułatwić efektywne wyszukiwanie informacji. MAINFRAME system informacyjny. 1 Inteligentne metody komputerowe dla nauki, technologii i gospodarki praca zbiorowa pod red. Zbigniewa Kierzkowskiego 20

W systemie typu mainframe duża maszyna obliczeniowa w ramach pozyskiwania baz danych, najważniejszą rolę odgrywa główny komputer który jest podłączony do szeregu terminali. Komputer główny wykonuje wszystkie procesy zaś terminal służy jedynie do wyświetlania informacji. Rolę terminali na początku odgrywały urządzenia nieinteligentne wyposażone w urządzenia wejścia klawiaturę, urządzenie wyjścia monitor oraz układ sterujący danymi pomiędzy komputerem głównym a końcówką. W MAINFRAMowym systemie wyświetlanie danych zestawu danych personalnych pracownika w zakładzie pracy odbywało się według następującego schematu: 1. Wyświetlanie na ekranie terminalu formularza służącego do wprowadzania identyfikatora pracownika. 2. Akceptacja wprowadzonego identyfikatora. 3. Sprawdzenie poprawności formatu danych. 4. Sprawdzenie, czy dostępna jest informacja o wybranym pracowniku. 5. Pobieranie informacji z bazy danych. 6. Sformatowanie danych przed ich wysyłaniem na ekran terminalu. 7. Wyświetlanie informacji o pracowniku. Czynności te można pogrupować w następujące zadania: prezentacja danych (kroki 1, 6, 7), sprawdzenie poprawności danych (kroki 2, 3), dostęp do danych (kroki 4, 5) 2 Rys.4 Sekwencja zadań pobrania danych w systemie mainframe Wszystkie te czynności musiał wykonać komputer główny co powodowało, iż najczęściej był on przeciążony. Przygotowanie sprawozdań które zawierają żądane przez danego użytkownika zestawy danych wymagało znajomości języka RPG i COBOL, ponieważ 2 Wymiana informacji i interaktywne komunikowanie medialne praca zbiorowa pod red. Zbigniewa Kierzkowskiego, Stanisławy Kluska Nawareckiej i Adama Sielickiego. 21

to w nim trzeba było pisać odpowiedni program. Wydrukowanie raportu nierzadko zajmowało wiele godzin pracy, a trzeba zauważyć iż użytkownicy nie posiadali zbyt wielkiego zasobu zestawień. Wielkim ułatwieniem i krokiem na przód stal się okres pojawienia mikrokomputerów. Powstał wówczas okres który posiadał warunki do eksploatacji oraz tworzenia lokalnych baz danych. Jest to system który w całości znajdował się na maszynie użytkownika, w ten sposób każdy użytkownik posiada własna prywatna bazę danych, którą stworzył według swoich potrzeb. Przykładem takiej bazy może być prosta baza danych adresowych wykorzystywana przez program obsługi biura. Baza ma postać płaską zawiera pojedynczą tabelę i jest wykorzystywana przez jedną aplikację. Wszelkie zmiany zawartości bazy są zapisywana bezpośrednio do pliku zawierającego jej tabelę. Przykładem baz lokalnych są zasoby w systemach Paradox, Access i dbase.3 Architektura klient serwer. Opcją rozwiązania dla lokalnych baz danych jest architektura klient serwer. To w takiej architekturze właściwa baza danych jest przechowywana w zasobach serwera czyli w jego pamięci zewnętrznej. W takiej budowie najczęściej serwerem jest oddzielony komputer. Dostęp do danych zawartych w bazach odbywa się za pośrednictwem innych komputerów maszyn klientów, które to są połączone z serwerem siecią. W modeli klient serwer aplikacje klienta mogą wykonywać część zadań. Jednym z takich zadań może być prezentacja danych a jednocześnie ich częściowa weryfikacja poprawności. Dzięki temu, że część zadań została przeniesiona na stronę klienta poprawiła się w znaczącym stopniu szybkość działania 3 Wymiana informacji i interaktywne komunikowanie medialne praca zbiorowa pod red. Zbigniewa Kierzkowskiego, Stanisławy Kluska Nawareckiej i Adama Sielickiego. 22

systemu.. Rys.5 Przykładowa topologia klient serwer. W budowie klient serwer zadania które są realizowane po stronie klienta jak i zarówno serwera stanowią nieodłączną całość system użytkowy. Architektura klient serwer stanowi połączenie bardzo wydajnego sprzętu komputerowego z niezawodnymi mechanizmami komunikacji. W przykładowej topologii, która została zaprezentowana na powyższym rysunku system klient serwer w zakładzie z wieloma oddziałami, każdy oddział zakładu musi posiadać swój własny serwer oraz kilka stacji roboczych. Główny serwer jest przeznaczony tylko i wyłącznie do obsługi Centralnej bazy danych. Serwer główny jest połączony z 23

serwerami lokalnymi za pomocą siec WAN zaś połączenie serwerów lokalnych ze stacjami roboczymi zostało połączone siecią LAN. System klienta żąda od serwera wykonywania odpowiednich usług. Serwer odbiera żądania i odpowiada na nie danymi lub innymi informacjami a nawet podejmuje inne działanie zmierzające do zaspokojenia wymagań klienta. Wymagania te to między innymi: dostęp każdego z użytkowników do ograniczonego zakresu informacji w bazie dostęp do poszukiwanych danych w jak najkrótszym czasie jednolite kierowanie danymi, które zostało sformułowane podczas projektowania systemu Architektura klient serwer to wiele korzyści takich jak: lepszy podział pracy na wysokości klient serwer redukcja poruszających się w sieci gwarancja wysokiej kontroli i integralności danych Współpraca klienta z serwerem odbywa się według ściśle określonego schematu: Rys.6 Współdziałanie klienta z serwerem: (1)klient wysyła żądanie do serwera, (2) serwer odbiera żądanie, (3) serwer wykonuje żądane czynności, (4) serwer wysyła wyniki, (5) klient odbiera rezultat. Największa zaleta budowy klient serwer jest jej elastyczność. Wymagania przedsiębiorstw z dnia na dzień stają się coraz to większe więc i system będzie musiał być coraz to lepszy i wydajniejszy. Aby zwiększyć jego wydajność można w krótkim czasie zwiększyć zasoby serwera a w ostateczności kupić nowszy i zarazem wydajniejszy sprzęt. Przeniesienie danych ze starego serwera na nowy, może się odbyć w dowolnym momencie 24

nie powodując przy tym dużych strat w funkcjonowaniu systemu co jest niewątpliwie dużą zaletą. Architektura klient serwer pozwala również na stosowanie przeróżnych systemów operacyjnych zainstalowanych na różnych modelach maszyn. Jak wiadomo, każdy system mam swoje wady i zalety. I w tym przypadku jest podobnie. Źle sformułowany system może w znaczny sposób uprzykrzyć życie użytkownikom spowalniając swą prace. Lecz i w takim przypadku możemy skorzystać z pomocy specjalistycznych a zarazem drogich narzędzi administracyjnych lub też zdecydować się na zaprojektowanie nowego systemu. Często trudnymi do zlokalizowania są problemy związane z przesyłaniem danych na linii klient siec serwer. Jakiekolwiek zmiany kodu procedur lub funkcji zapamiętanych mogą być przyczyną nieprawidłowego funkcjonowania systemu klienta, dlatego tez wszystkie wprowadzone zmiany muszą być uzgadniane ze wszystkimi użytkownikami systemu. 3. Dostęp do informacji przedmiotowej na przykładzie STN. Podstawowe założenia sieci naukowo technicznej to: strukturalizacja dostępu do światowych zasobów informacyjnych 25

tworzenie i rozpowszechnianie lokalnych zasobów informacyjnych wspomaganie informacyjne badań Charakterystyka THE SCIENTIFIC AND TECHNICAL INORMATION NETWORK STN INTERNATIONAL The Scientific and Technical Information Network STN International jest to międzynarodowy system, udostępniający za opłatą informacje za pośrednictwem trzech ośrodków: Japan Japan Information Center of Science and Technology Tokyo USA Chemical Abstracts Service Columbus Niemcy Fachinformationszentrum Karlshrue STN International zapewnia wejście do ponad 200 baz danych zarówno interdyscyplinarnych jak i przedstawiających takie dziedziny jak: chemia elektronika fizyka energetyka architektura matematyka i informatyka budownictwo i konstrukcje materiałoznawstwo nauki o ziemi medycyna i nauki biologiczne i inne Wyszukiwanie informacji odbywa się w trybie konwersacyjnym według reguł odpowiedniego języka zapytań. Istnieje możliwość korzystania z kilku baz jednocześnie, dla tego samego zapytania, co eliminuje powtarzające się opisy dokumentów. Odpowiedzi uzyskane czasie sesji komputerowej można otrzymać w formie drukowanej, w postaci zapisu na dyskietce, a także bezpośrednio przy pomocy sieci komputerowej. 26

Rozmieszczenie ośrodków dla Scientific and Technical Information Network STN International. Rys.7 Rozmieszczenie ośrodków dla Scientific and Technical Information Network 1. Japan Information Center of Science and Technology Japonia Tokyo 2. Chemical Abstracts Service USA Columbus 3. Fachinformationszentrum Niemcy Karlshrue STN International i STN Easy Są to serwisy internetowe udostępniające bazy produkowane przez CAS - Chemical Abstracts Service i inne bazy. STN International oferuje poprzez Telnet około 200 produktów, STNEasy z poziomu WWW - 50 baz. Zasoby informacyjne i banki danych. klasyfikacje zasobów informacyjnych rozpatrujemy z punktu widzenia: udostępnienia informacji 27

korzystania ze światowych komputerowych powiązań sieciowych wśród zasobów szczególne miejsce odgrywają obecnie: katalogi bibliograficzne archiwa banki danych w systemie STN informacje naukowe (banki danych) powinny opierać się na: krytycznie ocenianych danych wzorcach interpretacji i wnioskowań faktach wzorcach rozpoznań Budowa STN International. STN Express Jest to w pełni zintegrowane oprogramowanie, które zostało zaprojektowane specanlnie do prostego, szybkiego i skutecznego przeszukiwania baz danych STN w trybie on-line STN AnaVist Jest to w pełni interaktywne oprogramowanie, które oferuje szereg możliwości jeżeli chodzi o analizowanie wyników poszukiwań w zakresie literatury naukowej i kwestii patentowej. Jak również dostarcza aktualnie poszukiwanych wzorów, modeli które mogą być użyte w celu wybrania rzeczywiście przydatnych informacji STN Easy zapewnia łatwy i wygodny dostęp do publikacji i patentów z głównych dziedzin nauki i techniki. Wszystkie bazy są uporządkowane i poukładane w różne kategorie takie jak chemia, inżynieria czy fizyka w celu ułatwienia i zoptymalizowania czasu przeszukań. Poszukiwanie publikacji odbywa się na drodze podania autora, tytułu. Następnie wybiera się interesujące nas publikacje z listy 28

Ponadto występują interfejsy: STN on the Web STN Easy for Intranets Full Text Solution System STN umożliwia dostęp do szeregu bibliograficznych baz danych. Są to dla przykładu bazy: CA, INSPECT, BIOSIS, JICST E, NTIS, PHYS. STN CA BIOSIS INSPECT. Dla pracy w ramach STN potrzebne jest konto (hasło). W każdej z dostępnych baz znajdują się rekordy (dokumenty). Struktura rekordów w każdej z baz jest podobna ułatwia to korzystanie z STN. Ogólna Struktura dokumentu jest następująca POLE TREŚĆ POLE TREŚĆ Każde pole posiada unikalną nazwę. W każdym dokumencie występuje pole AB, zawierające streszczenie dokumentu. Niektóre z pól mogą być wykorzystywane w pytaniach. Są pola, których nie można wykorzystywać w pytaniach, a jedynie można ich Zawartość wyświetlać. Przykładowe struktury dokumentów wybranych baz prezentują się w oddzielnej części opracowania (STRUKTURY WYBRANYCH BAZ). Dla pełnego wykorzystywania możliwości systemu STN użytkownik winien znać: - nazwy baz dostępnych w systemie (komenda: Help File Names) - strukturę bazy Pomocne są działania następujące: Po połączeniu się z bazą przy pomocy komendy 29

FILE nazwa bazy Skorzystać z komendy HELP DIRECTORY I HEPL S FIELD zestaw pól wg których można wyszukiwać I HELP D FIELD zestaw pól wg których nie można wyszukiwać W czasie pierwszych sesji z systemem zaleca się uzyskanie jak najczęściej ilości informacji o samych bazach (komenda HELP) INDEKSY BAZ DANYCH Każda baza danych posiada tzw. Indeks podstawowy BI. Ogólnie zawiera ten indeks informacje z trzech pól: TYTUŁ TERMINY KONTROLNE ABSTRACT Poszczególne bazy danych zawierają ponadto szczegółowe indeksy dla wybranych pól dokumentów. Będą to dla przykładu indeksy: - tytułów ITI - autorów IAU - źródeł ISO Idea plików indeksowych jest następująca: Wszystkie wyrazy z dokumentów (bez względu na pole) są umieszczone w indeksie podstawowym BI. Dodatkowo tworzy się indeksy pomocnicze dla wyrazów występujących w konkretnych polach. Prezentowana ideo organizacji podnosi znacznie jego efektywność. Użytkownik może sprawdzić Zawartość indeksu (jego fragment) przy pomocy komendy EXP MESSENGER JĘZYK WYSZUKIWANIA W trakcie sesji terminalowej (on Line) z dowolną bazą dostępną w systemie STN, użytkownik korzysta z jednego języka wyszukiwania o nazwie MESSENGER. Język ten jest niezwykle prosty, a przy tym bardzo efektywny. Nawet początkujący użytkownik, po kilku sesjach w systemie, jest w stanie nabyć wprawnej biegłości w posługiwaniu się językiem. 30

W Mierę pełny opis komend języka, wraz z przykładami ich użycia przedstawia się oddzielnie: WYKAZ KOMEND WRAZ Z PRZYKŁADAMI UZYCIA, OPERATORY LOGICZNE. Oddzielnie przedstawia się również przykład korzystania z języka w rozdziale: PRZYKŁADOWA SESJA W RAMACH STN. UWAGI OGÓLNE O KORZYSTANIU Z SYSTEMU STN A. Po połączeniu się z systemem STN należy wybrać bazę, stanowiącą przedmiot naszego zainteresowania. Korzystamy z komendy FILE nazwa bazy Wykaz dostępnych baz uzyskujemy po napisaniu komendy HELP file names Po połączeniu się z bazą danych, przy pomocy komendy HELP możemy uzyskać informacje o jej zawartości, strukturze itp. B. Koniec pracy z systemem realizuje komenda LOG OFF C. Zasady pisania komendy zależą od zaawansowania użytkownika w sprawności korzystania z systemu. System bowiem rozpoznaje czy osoba pracująca z STN winna być bardziej wspomagana przez system, czy może działać bardziej samodzielnie. Realizuje się w zależności od sposobu napisania komendy. UŻYTKOWNIK POCZĄTKUJĄCY: Rozpoznawany jest, gdy napisze co najmniej cztery znaki komendy, UŻYTKOWNIK ZAAWANSOWANY: Rozpoznawany jest, gdy napisze tylko trzy pierwsze znaki komendy. Zauważymy, że trzymamy podstawowe komendy systemu: SEARCH - szukaj EXPAND - pokaż indeks DISPLAY - wyświetl Mogą być pisane jako pojedyncze litery (S, E, D). D. Przebieg całej sesji z systemem STN jest monitorowany. W dowolnym momencie pracy przy pomocy komendy 31

DISPLAY HISTORY Dowiedzieć się p całym dotychczasowym przebiegu sesji. E. Ponadto, każde pytanie zadane w ramach pracy z systemem STN jest numerowane (L1 : Lx). Rezultat wyszukiwania (wszystkie dotychczasowe zadane pytania) jest zawsze dostępny. UWAGI OGÓLNE O STRATEGII UZYTKOWANIA SYSTEMU STN. Użytkowanie systemu STN wymaga podjęcia następujących działań: 1. Zdefiniowanie celu wyszukiwania (ogólnie), określenia kluczy poszukiwania (autor, Rok, Rodzaj materiału itp.) 2. Określenia konkretnych wartości parametrów (słowa kluczowe, daty) 3. Określenia strategii wyszukiwania (powiązanie pytań) 4. Wybranie odpowiedniej bazy systemu STN (jest wiele różnych baz, obejmujących wszystkie aspekty nauki i technologii) 5. Przystąpienie do pracy terminalowej (on Line) z wybrana bazą 6. Sprawdzania (przez wybiorcze sprawdzenie wyszukiwanych rekordów) czy obrana przez nas strategia jest dobra 7. Zarejestrowana, gdy jest tego potrzebna, doboru terminów i strategii 8. Wydrukowanie rezultatów wyszukiwań 9. Opcjonalne, zamówienie oryginalnych KORZYSTANIE Z SIECI STN Logowanie Aby skorzystać z STN International należy się zalogować. 32

Rys.8 Logowanie Przegląd dostępnych baz Użytkownik może przejrzeć dostępne w STN International bazy danych przeglądając listę alfabetyczną baz, zbiór należący do określonej, interesującej nas dziedziny A) Alfabetyczny przegląd wszystkich baz danych 33

Rys.9 Przegląd wszystkich baz na literę B B) Tematyczne zbiory baz danych W kroku pierwszym wybieramy dziedzinę wiedzy, która nas interesuje, załóżmy będzie to informatyka. Wybieramy więc zbiór baz znajdujących się np. pod hasłem COMPUTER. 34

Rys.10 Przykłady dziedzin nauki i techniki w STN International C) Następnie wybieramy interesującą nas bazę, w naszym przypadku będzie to baza ELCOM 35

Rys.11 Przegląda baz danych związanych z dziedziną informatyki 36

D) Zapoznanie się z charakterystyką interesującej nas bazy danych Rys.12 Charakterystyka bazy danych SQL jako standardowy język komunikacji. Komunikacja w systemie zarządzania bazą danych jest podstawowym pojęciem zaś koordynowanie komunikacją. Głównym jej mechanizmem, który to zapewnia ład i porządek w bazie danych. Transakcja jest ciągiem operacji na informacjach danych zapisanych w bazie. Każdy ciąg transakcji charakteryzuje się tym, iż musi być wykonany w stu procentach od początku do końca, w przeciwnym wypadku żadna operacja nie zostanie pomyślnie rozstrzygnięta. 37

Dwuwarstwowa budowa systemów baz danych spowodowała, iż koniecznym okazało się być zaprojektowanie wspólnego języka do komunikowania się klienta z serwerem. Każdy użytkownik serwera może posiadać odrębny system operacyjny, lecz musi ich łączyć wspólny standardowy język komunikacji. Na początku 1970 roku IBM opracował taki prototypowy, standardowy język SQL Structured Query Language, który został zaprezentowany po raz pierwszy w 1974 roku na konferencji ACM początkowo pod nazwą SEQUEL. Pierwszą implementację opracowała firma Oracle, zaś jej standaryzacji w 1986 roku dokonał instytut ANSI. Unowocześniona wersja została wydana w 1992 roku pod nazwą SQL 92. SQL jest praktycznie językiem obsługi na wszystkich systemach operacyjnych, które zarządzają bazami danych. Cechą, która charakteryzuje SQL jest jego dosłowność. W odróżnieniu od innych języków np. proceduralnych, gdzie to programista zmuszony jest opisywać sposób rozwiązania zadania, w językach deklaratywnych dosłownych autor aplikacji pisze tylko to co system ma wykonać pozostawiając mu wolną rękę jeżeli chodzi o wybór strategii i sposobu działania w celu zrealizowania zadania. SQL można wykorzystać na trzy sposoby: interaktywny wprowadzenie i szukanie danych w bazie danych statyczny stały kod SQL napisany przed wykonaniem programu dynamiczny kod pytań jest wytwarzany przez aplikację w czasie jej wykonywania W zależności do rodzaju wykonywanej operacji standard SQL wyróżnia podzbiory: DDL język definiowania danych DNL język manipulowania danymi DCL język sterowania danymi Jednym z podstawowych założeń jakie towarzyszyły Twórcą SQL-a było maksymalne dopasowanie syntaktyki zapytań do składni języka naturalnego. 38

4. Problemy realizacji dostępu do informacji naukowej Rozpowszechnianie lokalnych zasobów informacyjnych w sieciach rozległych uwagi ogólne. Załóżmy, że mamy pewien zasób informacyjny (LZI), którego strukturę przedstawiono na rys.13. Korzystanie z LZI polega na tym, że użytkownik wywołuje program zarządzający i uzyskuje dostęp do danych. Dostęp ten, lub ściślej, język operowania danymi jest w przypadku prawie każdego systemu indywidualny (zazwyczaj bardzo prosty). dbase, ISIS, C, PROGRES, DOS/UNIX Programy INFORMIX Formaty danych Rys.13 Struktura ogólna lokalnych zasobów informacyjnych LZI Oprogramowanie zarządzające Zasoby informacyjne Komputerowe środowisko sieciowe stwarza możliwość rozpowszechniania LZI. Warianty rozwiązań zaprezentowałem na rys.14. 39

Rys.14 Środowisko implementacji sieciowego rozpowszechniania lokalnych zasobów.. informacyjnych (LZI) baz (banków) danych. W rozpowszechnianiu korzystać będziemy z usług: telnet (zdalny terminal), e-mail (poczta elektroniczna), Pierwsza usługa umożliwia połączenie się z wybranym miejscem gromadzenia zasobów w sieci rozległej (np. serwerem baz danych). Druga umożliwia wymianę informacji (np. pliki wyników wyszukiwań) w sensie przesyłania plików tekstowych (pliki wyników przesyłane do skrzynki pocztowej użytkownika). Zakładamy, że określony jest adres sieciowy LZI. Dostęp do tego miejsca i dalej do określonej aplikacji (oprogramowania zarządzającego wybranego zasobu informacyjnego) możliwy jest przy wykorzystaniu z usługi TELNET. Ogólny schemat rozwiązania przedstawiono na rys.15. 40

Rys.15 Schemat ogólny organizacji dostępu do LZI w sieci rozległej. Z rys.14 wynika, że najlepsza sytuacja to przypadek realizacji zasobu w środowisku UNIX. W innym przypadku konieczne jest tworzenie dodatkowych mechanizmów programowych organizacji rozpowszechniania (dostępu do LZI). Zamierzam zapewnić dostęp do LZI w sieci rozległej, bez jakichkolwiek zmian oprogramowania i formatów danych (przedstawionych schematycznie na rys.1). Można rozważyć różne warianty organizacji dostępu do LZI z poziomu sieci rozległej. Warianty rozwiązań zestawiono na rys.16. 41

Rys.16 Warianty rozpowszechniania LZI W eksperymentalnych realizacjach skorzystam z prostych rozwiązań, przyjmując, że: LZI został zaimplementowany w środowisku systemu DOS i utworzony w języku CLIPPER lub systemie ISIS, Zapewniam dostęp do LZI w sieci rozległej bez zmian oprogramowania, LZI, jak i struktur danych. Rozwiązanie praktyczne rozpowszechniania Lokalnych Zasobów Informacyjnych. Rozważam dwa LZI: a) Pierwszy - książkę adresowa pracowników dydaktycznych Politechniki Poznańskiej, zasób informacyjny implementowany w środowisku DOS/NOVELL i tworzony w języku CLIPPER, b) Drugi bazę danych IE5 (Instytut Metalurgii Żelaza w Gliwicach), utrzymywany także tradycyjne w środowisku DOS/NOVELL, jednak tworzony w systemie ISIS. Zakładam również możliwość korzystania z sieci rozległych korzystać można z powyższych zasobów, z dowolnego stanowiska komputerowego (WSSK) sieci INTERNET, terminalowo, gdy miejscem gromadzenia jest serwer szkieletowej sieci komputerowej LII (SKS LII), za pomocą zlecenia: TELNET 150.254.3.11 lub TELNET ruby.poz.edu.pl 42

Korzysta się z kont użytkownika o odpowiednich nazwach: napp(książka adresowa), bam(lzi Inst. Met. Żelaza), przeszukując następne te bazy wg funkcji dostępnych w powyższych LZI. W przypadku zasobu IE5 wskazana jest znajomość systemu ISIS. Oba zasoby LZI funkcjonują w środowisku DOS/NOVELL idea rozpowszechniania polega na realizacji w ramach sieci lokalnej, terminalowej sesji użytkowników sieci rozległych (rys.17) Rys.17 Schemat ideowy rozpowszechniania LZI. Zwraca się uwagę że przetwarzanie wyszukiwanie danych realizowane jest na serwerze sieci lokalnej. Do użytkowników zdalnych przesyłane są jedynie ekrany zawartości. Korzystamy z emulacji systemu DOS w środowisku UNIX, a także uwzględniamy pewnie ograniczenia programowe. W realizacjach eksperymentalnych rozpowszechniania przyjęto następujące założenia: 1. Emulacja systemu DOS w środowisku UNIX Zakładamy, że w systemie UNIX mamy emulację DOS-a, dla każdej sesji DOS system UNIX rezerwuje około 1Mb pamięci operacyjnej zapewnione są mechanizmy wymiany (swapingu) przy przekroczeniu fizycznej pamięci komputera. 2. Warunki dotyczące realizacji programowej dostępu do LZI. Korzystanie z emulatora systemu DOS narzuca na oprogramowanie systemu bazy danych kilku warunków. Po pierwsze, winien być zapewniony dostęp do bazy przez wielu użytkowników. Zalecane jest, aby w ramach obsługi ekranu (oprogramowanie systemu) używać UNIX-owego zestawu. Korzystanie z emulacji ogranicza stosowanie klawiszy funkcyjnych. Najlepiej więc korzystać z klawiszy liter i cyfr. Kolejne 43

ograniczenia dotyczą stosowania w systemie znaków specjalnych (kody ASCII powyżej 128) przy wyświetlaniu ich na ekranie (raczej nie należy ich stosować). Dalsza sprawa to użycie specjalnych trybów (inwersja, wzmocnienie, migotanie) pisania na ekranie (raczej ich nie stosować). REALIZACJA RPOZPOWSZECHNIANIA KSIĄŻKI ADRESOWEJ Dla moich rozważań załóżmy, że dostępny jest pewien serwer (rys.18) systemu GOPHER (np. ruby w strukturze komputerowej szkieletowej SKS LII), z odpowiednim oprogramowaniem pozwalającym włączyć ten serwer w środowisko GOPHER owe. Korzystamy z mechanizmów GOPHER operowania na plikach, konfigurując wybrany węzeł systemu GOPHER dla dołączenia LZI do listy wykazu aplikacji. Rys. 18 Korzystanie z lokalnych zasobów informacyjnych w ramach systemu GOPHER. Umieszczamy pliki z danymi oraz opracowane procedury wyszukiwania na wybranym komputerze Unixowym (rys.19). następnie w ramach UNIX, powołujemy użytkownika o nazwie, NAPP oraz powłokę DOS owską (system operacyjny użytkownika zasobu w środowisku UNIX realizuje się to np. za pomocą pakietu administratora systemu UNIX SYSADMSH ). 44

Rys.19. Operacja umieszczania plików danych w ramach realizacji sieciowego... rozpowszechniania zasobów informacyjnych. Zauważymy, że budujemy również odpowiednie procedury wyszukiwania informacji, dostosowane do technik wspierania wyszukiwania ( z użyciem np. systemu GOPHER) w sieciach rozległych. Co do szczegółów technicznych ograniczamy się do informacji tekstowej. Tekst jest zapisywany ekranowo rezygnujemy z pierwszej i ostatniej linii (25 2 = 23). Modyfikujemy również plik AUTOEXEC.BAT, umieszczając w nim zalecenie wywołania naszej aplikacji (napp.exe). Przygotowaliśmy więc zasób LZI rozpowszechniania w sieci rozległej. Korzystamy z usługi GOPHER można także organizować dostęp korzystając z systemu WWW. Obraz działania na zbiorach konfiguracyjnych GOPHER SERVER jest następujący: #pg.links Name = ICR for GOPHER Type = 8 Path = g l irc Host = ruby.poz.edu.pl Port = 23 Name = DOS shell for GOPHER Type = 8 Path = g l dos Host = ruby.poz.edu.pl 45

Port = 23 Każda pozycja menu systemu GOPHER opisana jest pięcioma parametrami charakterystycznymi, jak następuje: Name tytuł pozycji menu, Type od 0 do 8 (typ informacji realizujący dostęp do zasobu, np. ftp, telnet ), Path ścieżka realizacji dostępu do zasobu, Host adres komputera gromadzącego zasób, Port numer wskazujący połączenie w trakcie dostępu do aplikacji (23 dla telnet itd.). W naszym przypadku parametry zbioru konfiguracyjnego GOPHER SERVER dla zasobu lokalnego, są następujące: Name = książka Pracowników Dydaktycznych Politechniki Poznańskiej Type = 8 Path = nam Host = rubu.poz.edu.pl Port = 23 Korzystamy z systemu GOPHER realizując zlecenie: GOPHER ruby.poz.edu.pl i mamy dostęp do informacji zawartej w książce adresowej. Użytkowanie sieci LZI obejmuje uruchomienie stanowiska komputerowego w sieci rozleglej, a następnie realizację sesji w ramach LZI. W tym rozwiązaniu nie trzeba było opracowywać systemu administrowania dostępem do LZI nie trzeba było ograniczać dostępu do zasobu. BAZA DANYCH INSTYTUTU METALURGII ŻELAZA W przypadku tego rozwiązania założenia co do rozpowszechniania są inne i obejmują: zapewnienie dostępu do bazy danych wielu użytkownikom, kontrola użytkowników poprzez: o prowadzenie rejestru użytkowników uprawnionych do użytkowania bazy, o kontrole sesji użytkownika: liczba sesji, czas trwania, data ostatniej sesji, o rozliczenie użytkownika, o odsyłanie wyników wyszukiwań w bazie. 46