SI w procesach przepływu i porządkowania informacji Paweł Buchwald Wyższa Szkoła Biznesu
Początki SI John MC Carthy prekursor SI Alan Thuring pomysłodawca testu na określenie inteligencji maszyn Powolny rozwój SI Znaczenie SI w dobie obecnej Rozwiązywanie problemów NP zupełnych Rozpoznawanie obrazów, klasyfikacja, detekcja cech Sterowanie automatyka przemysłową Konstruowanie systemów ekspertowych Wykorzystywanie w procesie dostarczania informacji końcowemu odbiorcy Nieprawidłowe pojmowanie SI prowadzi do zbyt daleko idących oczekiwań od systemów opartych na rozwiązaniach z tego zakresu
Różnica pomiędzy algorytmami klasycznymi oraz rozwiązaniami SI Algorytm klasyczny Sieci neuronowe Uczenie neuronu
Różnica pomiędzy SI a inteligencją w odniesieniu do człowieka SI Rozwiązania spoza zakresu konwencjonalnej algorytmiki, które cechuje Adaptacja Samoorganizacja Programowanie poprzez uczenie Równoległe przetwarzanie Większa odporność na uszkodzenia Inteligencja Sprawność umysłowa którą cechuje Twórcze przetwarzanie informacji Zauważanie i wpływanie na emocje innych Zdolność wpływania na środowisko społeczne Umiejętność wykorzystania wiedzy Umiejętność dostrzegania analogii Informacja wiedza dane inteligencja
Dane a Informacja Dane jako nośnik informacji Teoria informacji Shanona - zdarzenia mniej prawdopodobne niosą ze sobą więcej informacji Wielkość danych a ilość informacji Co jest przyczyną wzrostu liczby danych? - wymagania co do jakości prezentowanych treści - ograniczona percepcja końcowego odbiorcy informacji Duże znaczenie treści multimedialnych.
Ilość danych a sposób prezentacji 250000 223334,4 200000 150000 100000 78950,4 50000 0 20,5 3686,4 Plik tekstowy RFC 1 Plik dźwiękowy mp3 rozmiar danych w kb 20,5 3686,4 78950,4 223334,4 Typ dokumentu Plik graficzny JPEG rozmiar danych w kb Klip video AVI
Inne przyczyny generowania dużej ilości danych i obciążenia sieci Powszechna dostępność Internetu i możliwość publikowania treści w formie elektronicznej Rozproszony charakter publikacji elektronicznych - zestaw szeregu dokumentów połączonych ze sobą odnośnikami Duża ilość niechcianych treści generowanych przez kampanie marketingowe Poprawna wizualizacja treści jest uzależniona od działania połączeń sieciowych i mechanizmów transmisji danych
Zapewnienie jakości usług kształtowanie i ograniczanie przepustowości zapewnienie dostępu do zasobów rozproszonych w satysfakcjonującym czasie priorytetyzacja ruchu sieciowego w celu dostarczenia wymaganych pakietów na czas zarządzanie opóźnieniami przy realizacji przesyłu danych, ich buforowanie i dostosowanie szybkości parametrów transmisyjnych unikanie przeciążeń sieci przeciwdziałanie gubieniu pakietów Duże wymagania adaptacyjne stawiane algorytmom sieciowym
Zastosowanie SI w mechanizmach utrzymania jakości usług Wyznaczanie tras pakietów w sieci - priorytetyzacja pakietów - dynamiczne wyznaczanie metryk tras przy protokołach routingu Klasyfikacja wzorców na podstawie słów kluczowych dla detekcji niechcianych wiadomości Modelowanie ruchu sieciowego i przewidywanie zagrożeń Systemy IDS (wykrywania ataków w sieci) Programy antywirusowe - Symantec AntiVirus Enterprise Edition dostarczany wraz z modułem detekcji wirusów opartym na wykrywaniu sekwencji zdarzeń systemowych jakie maja miejsce na komputerze
Ocena jakości treści publikowanych w formie elektronicznej Algorytm Page Rank używany przez popularna przeglądarkę Google Jakość treści jest proporcjonalna do liczby tekstów które się na niego powołują Strony lepiej klasyfikowane maja większy wpływ na podniesienie PageRank innych stron Konieczność poszukiwania nowych wyrafinowanych heurystyk do wyznaczania PageRank
Klasyfikacja treści pod względem tematycznym Indeksowanie treści tekstowych, wyszukiwanie pełno tekstowe Indeksowanie po słowach kluczowych Meta dane opisujące publikacje multimedialne - problem spójności publikacji oraz meta danych - duże znaczenie algorytmów OCR Badania Google nad własnym systemem OCR - zgłoszenie patentu WO/2008/003095 - możliwość indeksowania treści multimedialnych Niebezpieczeństwo konstrukcja automatów łamiących captche i wpływ na indeksowanie stron
Ocena przydatności prezentowanej treści Formularz oceny wyszukanej treści używany w serwisie MSDN
Konieczność personalizacji kontekstu wyszukania Dotychczasowe mechanizmy oceny treści mogą prowadzić do zbytnich uogólnień Konieczność grupowania użytkowników korzystających z wyszukiwarek ze względu na - położenie geograficzne - zainteresowania i grupę zawodową - historia działania użytkownika w sieci Niebezpieczeństwo detekcji tożsamości użytkownika na podstawie wyszukiwanych danych Konieczność poprawy bezpieczeństwa profilu użytkownika wyszukiwarek
Identyfikacja i uwierzytelnianie użytkowników wyszukiwarek słaby wskaźnik bezpieczeństwa klasycznych algorytmów uwierzytelniania duża uciążliwość klasycznych metod uwierzytelniania Mechanizmy bezpieczeństwa są omijane przez użytkowników gdy są niewygodne lub wymagają zbyt wiele czasu Zastosowania biometrycznych metod uwierzytelniania - skaner linii papilarnych - skaner tęczówki oka rozpoznawanie obrazów - rozpoznawanie twarzy Cechy: - brak konieczności przechowywania haseł - zajmują mniej czasu - wciąż mniejsza efektywność klasyfikacji
Podsumowanie Algorytmy oparte na mechanizmach sztucznej inteligencji są wykorzystywane na wielu poziomach procesu przetwarzania danych i dystrybucji treści do odbiorcy końcowego Mechanizmy sztucznej inteligencji nabierają znaczenia wraz ze wzrostem konieczności adaptacji metod wyszukiwania treści do innych celów Zastosowanie metod sztucznej inteligencji nie ma na celu zastąpienia człowieka ale pomoc w procesie uzyskania informacji oraz podjęcia przez niego odpowiedniej decyzji