Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014
Podstawowy proces gromadzenia Trudności: Weryfikacja dokumentu Ochrona przed kopiowaniem treści Współdzielenie Dostęp do podobnych
Podstawowy proces gromadzenia Repozytorium Trudności: Weryfikacja dokumentu Ochrona przed kopiowaniem treści Dostęp do podobnych
Proces gromadzenia rozszerzony o analizę antyplagiatową System antyplagiatowy Trudności: Weryfikacja dokumentu (problem pozostaje dopóki ktoś nie zaakceptuje) Ochrona przed kopiowaniem treści Dostęp do podobnych
Gromadzenie zatwierdzonych przez operatora Ocena Raport? System antyplagiatowy Trudności: Ochrona przed kopiowaniem treści Wydajność procesu gromadzenia danych Jakość analizy
Współpraca wielu organizacji w procesie gromadzenia? Oceny Raporty System antyplagiatowy? Organizacja 1 Organizacja 2 Internet Książki, artykuły, materiały od wydawnictw Trudności: Wydajność procesu Jakość analizy
SOWI Studium przypadku Praca inżynierska Praca magisterska Rozprawa doktorska Artykuł Książka RDC? Oceny Raporty Promotorzy/opiekunowie? RDC Praca inżynierska Praca magisterska Rozprawa doktorska Artykuł Książka Uczelnia 1 Uczelnia 2 Internet Książki, artykuły, materiały od wydawnictw Trudności: Wydajność procesu Jakość analizy
Jakość i wydajność procesu analizy antyplagiatowej Kolejność czasowa zdarzeń Dobór metod analizy Przyjmowanie zleceń Konwersja Dostarczenie dokumentu Unifikacja Klasyfikacja Dobór parametró w usług Kompozycja scenariuszy Zrównoleglanie Uruchamianie usług Analiza statystyczna Kolejkowanie w wewnętrznym systemie Zebranie wyników i ich odesłanie Opis operacji: Wyodrębnienie i klasyfikacja tekstu Przygotowanie scenariuszy w zależności od def. kontekstu analizy Zarządzanie przebiegiem analizy prac z wykorzystaniem usług Podsumowanie wyników analizy i utworzenie raportów Archiwizacja dokumentu w repozytorium cyfrowym
Jakość i wydajność procesu analizy antyplagiatowej metody analizy Wyszukiwanie podobnych Generowanie metryk Wyszukiwanie metryk podobnych w repozytoriach Tworzenie słów kluczowych na podstawie treści Wyszukiwanie w Internecie materiałów podobnych Analiza podobieństwa Analiza statystyczna - zgodności dokumentu z profilem użytkownika, wykrywanie prób oszustwa systemu antyplagiatowego Wyszukiwanie fragmentów identycznych Wyszukiwanie fragmentów podobnych odmiana wyrazu, zamiana wyrazów, wstawienie dodatkowych fragmentów
Jakość i wydajność procesu analizy antyplagiatowej architektura Platforma KASKADA Repozytoria Obsługa żądań użytkowników Analiza statystyczna Wykorzystanie mocy obliczeniowej klastra superkomputerowego Internet Konwersja Kompozycja scenariuszy analiz Obsługa kolejkowania scenariuszy analiz Podsumowanie wyników analizy Raportowanie Zbieranie ocen archiwizacja dokumentu Scenariusze analizy Realizacja przygotowanych kompozycji usług: Wyszukiwanie podobnych Analiza podobieństwa Raportowanie SowiSync SowiSync SowiSync Materiały wydawnictw
Architektura rozproszona RDC RDC RDC RDC Repozytoria metryk Centrum obliczeniowe Repozytoria metryk Centrum obliczeniowe Trudności: Spójność danych Aktualność danych
Architektura rozproszona RDC RDC RDC RDC SNSA System nadzorczy systemów antyplagiatowych Repozytoria metryk Centrum obliczeniowe Repozytoria metryk Centrum obliczeniowe
Architektura rozproszona RDC RDC Ministerstwo Nauki i Szkolnictwa Wyższego SNSA System nadzorczy systemów antyplagiatowych Centralny dostęp do wszystkich repozytoriów i analiz podobieństwa RDC RDC Repozytoria metryk Centrum obliczeniowe Repozytoria metryk Centrum obliczeniowe
Zakończenie Zalety wykorzystania systemu SOWI Automatyczna obsługa analiz podobieństwa i archiwizacji Realizacja obliczeń na superkomputerze Wykorzystanie dokładniejszych algorytmów (wyszukiwanie fragmentów podobnych) Pozostawienie zasobów po stronie uczelni, możliwość utworzenia własnego repozytorium prac dyplomowych Możliwość stworzenia węzła antyplagiatowego po udostępnieniu serwerów obniżenie kosztów analizy antyplagiatowej / możliwy zysk dla uczelni