Identyfikacja znamion ukrytego plagiatu. Z wykorzystaniem IDEA Caseware

Podobne dokumenty
Analiza współzależności. Z wykorzystaniem IDEA Caseware

Identyfikacja nadużyć w rozliczaniu podatku VAT. Z wykorzystaniem IDEA CaseWare

Arkusz strona zawierająca informacje. Dokumenty Excela są jakby skoroszytami podzielonymi na pojedyncze arkusze.

Rozpoczynamy import Kreator uruchamiamy przyciskiem Z tekstu, znajdującym się na karcie Dane, w grupie Dane zewnętrzne.

Moduł Handlowo-Magazynowy Przeprowadzanie inwentaryzacji z użyciem kolektorów danych

Skanowanie OCR w aplikacji Kancelaria Komornika. Instrukcja dla użytkownika

Rozwiązanie. Uruchom program Access 2007.

I. Program II. Opis głównych funkcji programu... 19

Instrukcja obsługi DHL KONWERTER 1.6

Operacje. instrukcja obsługi wersja 2.9.2

Jak zaimportować bazę do system SARE

Edytor materiału nauczania

Zapewnienie przychodów (Revenue Assurence)

edycja szablonu za pomocą serwisu allegro.pl

Zmiana sposobu logowania do systemu Bazy Wiedzy PW edycja danych

Adobe InDesign lab. 2 Jacek Wiślicki, Paweł Kośla. Spis treści: 1 Dokument wielostronicowy Książka Eksport do PDF... 7.

Księgowość Optivum. Import planu finansowego wygenerowanego w Sigmie do programu Księgowość

Instrukcja obsługi Multiconverter 2.0

Na komputerach z systemem Windows XP zdarzenia są rejestrowane w trzech następujących dziennikach: Dziennik aplikacji

Prace przyjęte. prace bez wniesionych opłat za materiał, prace z przekroczonym terminem zakończenia, prace z przesłanym wnioskiem o zaniechanie,

POMOC. 1. Wybór Katalogu

MS Excel cz.1 funkcje zaawansowane

Instrukcja Użytkownika (Studenta) Akademickiego Systemu Archiwizacji Prac

Formatowanie tekstu za pomocą zdefiniowanych stylów. Włączanie okna stylów. 1. zaznaczyć tekst, który chcemy formatować

System imed24 Instrukcja Moduł Analizy i raporty

MODUŁ OFERTOWANIE INSTRUKCJA OBSŁUGI

Część 3 - Konfiguracja

Instrukcja Użytkownika Portalu Ogłoszeń ARiMR

Instrukcja wprowadzania i aktualizacji danych dotyczących realizacji wypłat w Oprogramowaniu do obsługi Świadczeń SR/SW/FA

w kalendarzu pracownika po wybraniu z menu podręcznego polecenia Dziennik zdarzeń pracownika

Polski Zasób Normalizacyjny (PZN) Instrukcja Przewodniczącego KT (wersja 1.1)

Zmiana logo. Dziękujemy za wybór naszych rozwiązań. apjoo od Apláuz. Wspólnie przebrniemy przez proces konfiguracji strony www i wstawiania treści.

Zawartość. Wstęp. Moduł Rozbiórki. Wstęp Instalacja Konfiguracja Uruchomienie i praca z raportem... 6

Najważniejsze informacje dla klienta na temat Portalu Serwisowego D-Link Spis treści

Obsługa systemu OGNIVO w aplikacji Kancelaria Komornika

Tworzenie pliku źródłowego w aplikacji POLTAX2B.

Student 1. Loguje się do wirtualnego dziekanatu 2. Najlepiej z przeglądarki Mozilla Firefox i musi mieć wyłączone blokowanie wyskakujących okienek.

Instrukcja instalacji oraz konfiguracji sterowników. MaxiEcu 2.0

UONET+ - moduł Sekretariat. Jak wykorzystać wydruki list w formacie XLS do analizy danych uczniów?

UMOWY INSTRUKCJA STANOWISKOWA

Integracja z Subiekt GT

INSTRUKCJA POBIERANIA ZAŚWIADCZEŃ ELEKTRONICZNYCH

Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej

Punktowanie i numerowanie

Piotr Dynia. PowerPivot. narzędzie do wielowymiarowej analizy danych

1. Proszę wejść na stronę: poczta.home.pl i zalogować się do nowej skrzynki za pomocą otrzymanych danych.

Przewodnik Szybki start

3.7. Wykresy czyli popatrzmy na statystyki

System Zarządzania Obiegiem Informacji (SZOI)

Instrukcja wyszukiwania identyfikatora Apteki/Hurtowni w rejestrze Aptek i Hurtowni

1 Użytkownicy. 1.1 Użytkownicy

Instrukcja obsługi. Helpdesk. Styczeń 2018

Instrukcja użytkownika NAUCZYCIELA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Instrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

SYSTEM ZARZĄDZANIA RELACJAMI Z KLIENTEM CRM7

Instrukcja Użytkownika (Nauczyciel Akademicki) Akademickiego Systemu Archiwizacji Prac

Dodawanie przedmiotów do cykli dydaktycznych, tworzenie grup zajęciowych

Centrum Informatyki "ZETO" S.A. w Białymstoku. Wysyłanie danych o licencjach i zezwoleniach do CEIDG w systemie ProcEnt Licencje

Instrukcja wczytywania i przekazywania zbiorów centralnych w Centralnej Aplikacji Statystycznej (CAS) przez użytkowników podobszaru PS

Wstęp. Opis ten dotyczy wydziałów orzeczniczych.

Rejestr VAT Optivum. Jak przygotować deklarację VAT-7 oraz jednolity plik kontrolny?

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.

Instrukcja użytkownika STUDENTA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC

Instalacja programu:

Zamawianie Taxi Aktywator Instrukcja użytkownika

2014 Electronics For Imaging. Informacje zawarte w niniejszej publikacji podlegają postanowieniom opisanym w dokumencie Uwagi prawne dotyczącym tego

PWI Instrukcja użytkownika

KS-NaviCon. Podręcznik użytkownika. Zamawianie z oferty w systemie KS-AOW. Katowice, Data aktualizacji: / 9

Instrukcja automatycznego tworzenia pozycji towarowych SAD na podstawie danych wczytywanych z plików zewnętrznych (XLS).

Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej

Integracja programów LeftHand z systemem Skanuj.to

BIBLIOTEKA BLOKÓW JABLOTRON 100 SYSTEM

LOGOWANIE DO SUBKONTA

plansoft.org Zmiany w Plansoft.org Panel wyszukiwania PLANOWANIE ZAJĘĆ, REZERWOWANIE SAL I ZASOBÓW

Zestawienia osobowe - kreator

Krok 1: Wzorzec księgowania faktury sprzedaży

KS-ZSA. Mechanizm aktualizacji kartotek lokalnych w aptece na podstawie zmian w kartotece CKT. Data aktualizacji:

Aplikacja do podpisu cyfrowego npodpis

Instrukcja użytkownika aplikacji npodpis r.

Informatyka w Zarządzaniu

INSTRUKCJA OBSŁUGI PROGRAMU ROZKŁAD JAZDY

Polski Zasób Normalizacyjny (PZN) Instrukcja Reprezentanta KT (wersja 1.3)

INSTRUKCJA MASOWEGO WYSTAWIANIA OFERT ZA POMOCĄ PLIKU CSV

Instrukcja dotyczy programu Próbny Egzamin Gimnazjalny z WSiP oraz diagnoz przedmiotowych na rozpoczęcie i zakończenie klas.

Wyszukiwanie plików w systemie Windows

Dokładny opis instalacji programów RFD można znaleźć w pliku PDF udostępnionym na stronie w zakładce Downland > AutoCAD > Instalacja

Łącznik niełamliwy Ctrl+Shift+minus

PROGRAM W WERSJI KOMERCYJNEJ. Jak przygotować sprawozdanie finansowe zakładu budżetowego w formacie PDF w Programie DRUKI Gofin

System zdalnego dostępu (VPN) do sieci Wydziału Elektrycznego PW

Instrukcja obsługi dla studenta

Forex PitCalculator INSTRUKCJA UŻYTKOWNIKA

opracował: Patryk Besler

Al. Akacjowa 16A Wrocław. Instrukcja administratora programu Internet-Lab

Sposób tworzenia tabeli przestawnej pokażę na przykładzie listy krajów z podstawowymi informacjami o nich.

WPROWADZANIE ZLECEŃ POPRZEZ STRONĘ INSTRUKCJA UŻYTKOWNIKA

Wprowadzenie (17) Część I. Makra w Excelu - podstawy (23)

Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki. Podstawy Informatyki i algorytmizacji

Przewodnik dla użytkownika. Instrukcja korzystania z aplikacji mobilnej mtoken Asseco MAA

Transkrypt:

Identyfikacja znamion ukrytego plagiatu Z wykorzystaniem IDEA Caseware

Dzięki zastosowaniu w IDEI zaawansowanego modułu importu danych istnieje możliwość wykorzystania oprogramowania do identyfikacji tzw. ukrytego plagiatu tekstu między dokumentami. Na poniższym przykładzie przedstawimy jak wykorzystać to narzędzie do wyszukania takich podobieństw i to w sytuacji gdy wzorcowy tekst został częściowo zmodyfikowany. Aby dokonać stosownych analiz wczytamy badane fragmenty tekstu do IDEI. W tym celu klikamy na moduł Desktop. Jako rodzaj formatu danych wskazujemy typ: Advanced Record Definition Editor, w dolnej części okna określamy źródłowy plik tekstowy (w naszym przypadku plik tekst_1.txt). Po zatwierdzeniu danych zostaniemy poproszeni o wskazanie sposobu rozdzielania badanej treści. W tym celu wybieramy opcję Delimited, pozwoli ona rozdzielić tekst według występującego w tekście wskazanego znaku. Tym znakiem w tekście jest spacja. Aby zdefiniować konkretny rodzaj znaku klikamy na przycisk Set Delimiters a następnie podajemy kod ASCII dla znaku spacji (#032). Dodatkowo w dolnej części okna opisujemy nazwę kolumny w której zostaną wyodrębnione z tekstu poszczególne słowa. Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 2 z 9

W ten sposób uzyskaliśmy prostą jednokolumnową tabelę, która zawiera kolejne słowa, występujące w naszym tekście. Teraz dodamy kolumnę roboczą, która będzie informować o źródle tekstu. W tym celu klikamy na moduł Append, a następnie w oknie dialogowym wskazujemy w polu Field name nazwę kolumny, a w polu Parameter podajemy nazwę pliku wpisując treść: "tekst_1". Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 3 z 9

Dodatkowo potrzebujemy dodać kilka kolejnych kolumn, których przeznaczeniem będzie odpowiednie manipulowanie poszczególnymi słowami: 1. Tworzymy kolumnę o nazwie słowo_0, która będzie zawierać nasze słowa pisane małymi literami, oraz bez znaków specjalnych i cyfr (formuła: @Lower(@JustLetters(@Strip(SŁOWA))) 2. Tworzymy kolumnę o nazwie słowo_1, która będzie pobierać wartość słowa z kolejnego wiersza(formuła: @GetNextValue( "SŁOWO_0" )) 3. Dodajemy następne kolumny zgodnie ze schematem z punktu 2, każdorazowo wskazując jako kolumna źródłowa ostatnio utworzoną kolumnę. Liczba kolumn jest zależna od tego jak długi wzorzec tekstu chcemy zastosować, czyli inaczej ile słów powinien zawierać nasz wzorzec. W naszym przypadku określiliśmy optymalną długość wzorca na poziomie 10 słów 4. Tworzymy kolumnę o nazwie Zdanie która dokona zebrania uzyskanych słów do jednej kolumny, przy okazji oddzielając je pojedynczą spacją (formuła: SŁOWO_0 +" "+ SŁOWO_1 +" "+ SŁOWO_2 +" "+ SŁOWO_3 +" "+ SŁOWO_4 +" "+ SŁOWO_5 +" "+ SŁOWO_6 +" "+ SŁOWO_7 +" "+ SŁOWO_8 +" "+ SŁOWO_9) Z tak uzyskanej bazy wyodrębnimy tylko dwie kolumny, pierwsza z nich zawierać będzie informacje na temat źródła tekstu(kolumna ŹRÓDŁO ), druga natomiast zebrana słowa (kolumna ZDANIE ). W tym celu najlepiej jest skorzystać z modułu Direct zgodnie z poniższym slajdem: Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 4 z 9

Wszystkie powyższe czynności należy przeprowadzić dla drugiego, zaimportowanego pliku tekstowego dla którego dokonamy porównania treści. Dwie przygotowane tak tabele należy następnie połączyć pionowo. Najprościej będzie w tym celu użyć moduł o nazwie Append (dostępny z zakładki Analysis ) zgodnie z poniższym schematem: Teraz dla tak pozyskanego wspólnego pliku tekstów uruchamiamy bardzo interesujący moduł o nazwie Fuzzy. Pozwoli on zidentyfikować podobne fragmenty tekstów w obrębie badanych plików. Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 5 z 9

Na tym etapie musimy wskazać pole kluczowe, dla którego przeprowadzimy porównanie (kolumna Zdanie ), oraz określamy w jakim stopniu fragmenty tekstów mają być do siebie podobne. Pamiętajmy, że zbyt niski poziom tego wskaźnika może spowodować wygenerowanie dużej liczby fałszywych sygnałów, natomiast wartość wskaźnika na poziomie 100% oznacza ze zostaną rozpoznane tylko identyczne fragmenty tekstu. W naszym przypadku ustalamy wartość tego wskaźnika na poziomie 85%. Akceptujemy ustawienia okna dialogowego. Nasza tabela została wzbogacona o dwie kolumny, jedna informuje nas o numerze grupy tekstów(group_id, druga służy do wyliczenia wskaźnika podobieństwa. A ponieważ interesują nas wyłącznie fragmenty tekstów, pochodzące z dwóch różnych źródeł (plików), musimy dodatkowo dokonać zgrupowania wyników wg numerów grupy, a następnie wyszukujemy duplikaty. W tym celu zastosujemy moduł Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 6 z 9

Summarization zgodnie z poniższym schematem: Następnie na tak pozyskanych danych uruchamiamy kolejny moduł o nazwie Dupliacte Key. W ten sposób uzyskamy zestawienie grup dla których w dwóch różnych plikach zidentyfikowano podobny fragment tekstu. Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 7 z 9

Nie pozostaje nam nic innego jak pokazać które fragmenty tekstu z obu plików są podobne. W tym celu otwieramy zestawienie wcześniej uzyskane wyników analiz podobieństw tekstu, a następnie łączymy je z listą duplikatów zgodnie z poniższym slajdem. W ten oto sposób uzyskujemy tabelę informującą nas o takich fragmentach tekstu które występują w obu plikach źródłowych i są względem siebie podobne w co najmniej 85% treści. Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 8 z 9

Cały proces badawczy jest wieloetapowy, warto więc usprawnić całą analizę poprzez zastosowanie intuicyjnych w obsłudze makr. Dzięki temu cała analiza łącznie z importem danych może być sprowadzona do kilku kliknięć, a my możemy się skupić wyłącznie na interpretacji uzyskanych wyników badań. Status: Dokument opracowany przez PBSG Sp. z o.o. www.pbsg.pl Wersja 1.0 z dnia: 2016-02-22 Strona: 9 z 9