Funkcjonowanie systemu antyplagiatowego (OSA) na Uniwersytecie Jagiellońskim dr Agnieszka Kowalska Pełnomocnik Rektora ds. wprowadzenia systemu antyplagiatowego w Uniwersytecie Jagiellońskim
Otwarty System Antyplagiatowy http://osaweb.pl/ Oprogramowanie Otwartego Systemu Antyplagiatowego mieści się z formule open-source. Jeśli uczelnia należąca do Międzyuniwersyteckiego Centrum Informatyzacjilub będąca jego członkiem stowarzyszonym chce modyfikować kod źródłowy, zgłasza opis i cel tej modyfikacji do dyrekcji MUCI apo uzyskaniu akceptacji stosuje się do obowiązujących w tym zakresie procedur zapewniających systemowi nieustającą skuteczność. Główne atuty Baza stron internetowych licząca ponad 750 milionów rekordów (zaindeksowanych stron). Bezpieczne porównania z zasobami internetowymi (bez pośrednictwa podmiotów trzecich takich jak Microsoft, Google, etc...). Efektywne sprawdzanie z całą bazą stron internetowych, a nie tylko z pierwszymi wynikami zwróconymi przez wyszukiwarki takie jak Google czy Bing. Możliwość indeksacji wielkich baz prac referencyjnych (np. ORPPD) poprzez skróty nieodwracalne (np. wektory częstości). Skróty wystarczają do prowadzenia porównań, a są bezużyteczne dla potencjalnego złodzieja. Nowatorskie, efektywne algorytmy detekcji podobieństw w bazie prac studenckich i w zasobach internetowych opracowane przez zespół polskich naukowców. Efektywny algorytm szczegółowego porównywania tekstów. Detekcja kamuflażu nieuprawnionych zapożyczeń, także niewerbalnych. Interaktywny podgląd porównywanych dokumentów. Obsługa wzajemnego porównywania prac między sobą (np. prac domowych grupy studentów) z opcją dodatkowego porównania ich z bazą prac studenckich i zasobami internetowymi. Obsługa masowego ładowania plików do bazy. Współpraca z PCSS (Poznańskie Centrum Superkomputerowo-Sieciowe) http://wiki.osaweb.pl
Otwarty System Antyplagiatowy Zalety: Czas sprawdzania Integracja z APD Zgodność prawna Sprawdzanie kolekcji Wady: Polskojęzyczny zasób.
Obsługa OSY poprzez APD Analiza raportu skróconego Obsługa OSY w wersji webowej www.osa.uj.edu.pl Analiza raportu rozszerzonego
Integracja APD i OSA www.apd.uj.edu.pl/ http://usosownia.uj.edu.pl/apd
www.osa.uj.edu.pl
Raport skrócony
Tabela statystyk wyrazów Statystyki wyrazów mogą dać wgląd w próby oszustwa ze strony osoby piszącej pracę. Dla sprawdzającego pracę podejrzanie powinny budzić następujące sytuacje: Bardzo mała liczba słów w całym dokumencie - podejrzenie, że autor pracy stosował białe znaki zamiast spacji, by oszukać system (w skrajnym przypadku praca może składać się z jednego bardzo długiego słowa) Bardzo mała liczbasłów rozpoznanychjako słownikowe - podejrzenie o stosowanie liter wyglądających jak polskie (np. z alfabetu greckiego), białych znaków, np. minispacji. Minispacjeto zwykłespacje odpowiadające bardzo małym rozmiarom czcionki(np. 1). Jeśli zostaną wstawione między litery jakiegoś wyrazu na wydruku będą niezauważalne, ale w wersji elektronicznej w miejscu tego wyrazu ujrzymy oddzielne ciągi liter, które zwykle nie występują w słowniku. Bardzo mała liczbaunikatowych rozpoznanych słów -ubogie słownictwo, podejrzenie o wybiórcze stosowanie minispacjilub podmiany czcionek. Niezerowa liczba słów z podstawionymi czcionkami. Duży stosunek liczby nierozpoznanych słów do słów rozpoznanych bądź liczby unikatowych nierozpoznanych słów do rozpoznanych słów unikatowych (wykresy kołowe). Często jest tak, że próby oszustwa na czcionkach bądź podstawieniabiałych znakówprzystankowych powoduje, że pozostałe moduły antyplagiatowenie są w stanie znaleźć zapożyczeń. No bo jak znaleźć w bazie referencyjnej podobieństwo pracy, w której jest jeden bardzo długi ciąg znaków? Stąd statystyka wyrazów jest bardzo ważną informacją, która może byćjedynym ślademprowadzącym do ujawnienia nieuprawnionych działań. Jeśli dokument jest w taki sposób spreparowany -polecamy skorzystać z narzędzia "Treść pracy", gdzie uwidocznione są słowa nierozpoznane. http://wiki.osaweb.pl/interpretacja_wynik%c3%b3w
Analiza raportu Wysoki PRWC (procentowy rozmiar wspólnej części) Małaliczba rozpoznanych słów Dużaliczba nierozpoznanych słów Duża liczba słów w najdłuższej frazie Liczba słów z podstawionymi czcionkami Zawsze należy zapoznać się z rozszerzoną wersją raportu.
Obsługa Osy w wersji webowej www.osa.uj.edu.pl
Raport rozszerzony 1. Metryka pracy 2. Statystyki dokumentu 3. Wynik sprawdzania antyplagiatowego 4. Treść pracy
Podobieństwo semantyczne
Tworzenie kolekcji prac
Materiały www.osa.uj.edu.pl http://wiki.osaweb.pl www.apd.uj.edu.pl -> http://usosownia.uj.edu.pl/apd
Kontakt dr Agnieszka Kowalska Pełnomocnik Rektora ds. wprowadzania systemu antyplagiatowego w Uniwersytecie Jagiellońskim a.kowalska@uj.edu.pl tel. 798423543 ul. Gołębia 24, p. 16 tel. 12 633 1076 dziękuję