Dodatek F. Dane testowe

Podobne dokumenty
Import danych z plików CSV

Dane mikromacierzowe. Mateusz Markowicz Marta Stańska

Archiwum Prac Dyplomowych

Do pola Hasło wpisujemy stare hasło, a następnie przyciskamy przycisk Zaloguj się.

INSTRUKCJA OBSŁUGI KREATORA SKŁADANIA WNIOSKÓW

Ministerstwo Finansów

Po wybraniu formatu wskazujemy ścieżkę, gdzie archiwum ma zostać zapisane. Ścieżka wraz z nazwą pliku zostanie wyświetlona

Import pliku MPW do systemu plusbank24

Politechnika Łódzka. Instytut Systemów Inżynierii Elektrycznej. Laboratorium cyfrowej techniki pomiarowej. Ćwiczenie 4

Rys Należy zalogować się do systemu poprzez podanie otrzymanego od OKE Loginu i Hasła.

Administracja danymi kontaktowymi pracowników w serwisie

Poniższy poradnik opisuje proces kompresji filmu DVD do formatu AVI z wykorzystaniem kodeka XviD w programie FairUse Wizard.

INSTRUKCJA - WYKAZY PRZESYŁANE W FORMIE ELEKTRONICZNEJ

EXCEL TABELE PRZESTAWNE

Generator CABRILLO program Marka SP7DQR (Instrukcja obsługi)

Instrukcja importu deklaracji pacjentów. do dreryka

WEBTRUCKER INSTRUKCJA OBSŁUGI V.2.6

Instrukcja użytkownika. Aplikacja dla Comarch ERP XL

xchekplus Przewodnik Użytkownika

Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF

Kadry Optivum. Jak wykonać eksport danych do SIO z programu Kadry Optivum?

Instrukcja użytkownika. Aplikacja dla Comarch Optima

Moduł Handlowo-Magazynowy Przeprowadzanie inwentaryzacji z użyciem kolektorów danych

5. Praca z klasą. Dodawanie materiałów i plików. Etykieta tematu. Rozdział 5 Praca z klasą

Dokumentacja SMS przez FTP

INSTRUKCJA DOTYCZĄCA POSŁUGIWANIA SIĘ WYKAZEM WYKUPIONEGO MYTA I SZCZEGÓŁOWYM WYKAZEM JAZD W FORMIE ELEKTRONICZNEJ

Uniwersalny Import/Aktualizacja Towarów do Subiekt GT Sfera

Płace VULCAN. Jak na podstawie wbudowanego szablonu utworzyć własny szablon wydruku seryjnego?

INSTRUKCJA IMPORTOWANIA FAKTUR DO SPRAWOZDANIA W SYSTEMIE WITKAC.PL

Tworzenie i wysyłanie do KRN kart zgłoszenia nowotworu złośliwego.

Kadry VULCAN, Płace VULCAN

Instrukcja użytkownika. Aplikacja dla Comarch Optima

CELAB. System Informatyczny. Pracownie krok po kroku LTC 1

Instrukcja użytkownika. Aplikacja dla WF-Mag

Instrukcja korzystania z platformy B2B Black Point S.A.

Instrukcja dotycząca konwersji dokumentów LaTeX do plików w formacie RTF

INICJACJA ELONGACJA TERMINACJA

Instrukcja użytkowania oprogramowania SZOB PRO

Ocena immunologiczna i genetyczna białaczkowych komórek macierzystych

ProfLab Wyniki Online

CitiDirect BE Portal Eksport

DHL24 SZABLONY PRZESYŁEK. Warszawa, listopad 2017

Wczytywanie cenników z poziomu programu Norma EXPERT Tworzenie własnych cenników w programie Norma EXPERT... 4

Jak wykonać eksport danych do SIO z aplikacji Kadry VULCAN?

INSTRUKCJA REJESTRACJI ORGANIZACJI W GENERATORZE WNIOSKÓW APLIKACYJNYCH SI NAWIKUS

Archiwum Prac Dyplomowych

Kurier Siódemka (by CTI)

1. Import środków trwałych z pliku w formacie MS-EXCEL o określonej strukturze.

Zapytania i wstawianie etykiet z bazy danych do rysunku

Tworzenie raportów. Ćwiczenie 1. Utwórz Autoraport przedstawiający tabelę Studenci

Program Import dokumentów XLS dla Subiekta GT.

Program dla praktyki lekarskiej

INSTRUKCJA OBSŁUGI KREATORA SKŁADANIA WNIOSKÓW

PRZEWLEKŁĄ BIAŁACZKĘ SZPIKOWĄ I OSTRĄ BIAŁACZKĘ SZPIKOWĄ

Dokumentacja Użytkownika

Poradnik użytkownika systemu BibbyNet. Część III Raporty, export plików, pozostałe

Instrukcja obsługi. Generatora CSV

OBSŁUGA PRACY DYPLOMOWEJ W APD PRZEZ RECENZENTA

Instrukcja użytkownika

Symfonia Produkcja Instrukcja instalacji. Wersja 2013

WOJEWÓDZTWO PODKARPACKIE

MEDIS_EWUS_AUTOMAT SYSTEM KS MEDIS: AUTOMAT EWUŚ Wydanie: 1.0 Data wydania: Marzec 2013 Strona/stron: 1/5

WEKA klasyfikacja z użyciem sztucznych sieci neuronowych

Załącznik nr 1 do Regulaminu świadczeń dla studentów PWSZ w Suwałkach.

Zakład Elektronicznej Techniki Obliczeniowej Sp. z o.o. Koszalin. Wydawanie paszportów

epuap Jak dodać usługę do KKSP

Przed rozpoczęciem kompresji musimy pobrać program w wersji odpowiedniej dla naszego systemu.

INSTRUKCJA RAPORTOWANIA WYNIKÓW PT W PROGRAMIE BADAŃ BIEGŁOSCI W ZAKRESIE MIKROBIOLOGII ŻYWNOSCI POCHODZENIA ZWIERZĘCEGO

Wyszukiwanie informacji w Internecie

INSTRUKCJA UŻYTKOWNIKA. Wielkopolski system doradztwa. edukacyjno-zawodowego

SUBIEKT GT IMPORT XLS Dokumenty

Instrukcja użytkownika systemu medycznego. Pracownik medyczny psycholog / rehabilitant

Instrukcja obsługi elektronicznego formularza harmonogramu w ZSI SEZAM

(wersja robocza) Spis treści:

WYKONANIE APLIKACJI OKIENKOWEJ OBLICZAJĄCEJ SUMĘ DWÓCH LICZB W ŚRODOWISKU PROGRAMISTYCZNYM. NetBeans. Wykonał: Jacek Ventzke informatyka sem.

Program Powitanie Otwarcie Sympozjum Czego dokonaliśmy- dokąd zmierzamy Prof. D.Perek

1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.

Jak generować i zapisywać raporty. Copyright Tungsten Corporation plc 2018

Instalowanie certyfikatów celem obsługi pracy urządzenia SIMOCODE pro V PN z poziomu przeglądarki internetowej w systemie Android

Problemy techniczne. Jak zainstalować i zarejestrować program Optivum?

Instrukcja użytkowania

Instrukcja obsługi programu:

Zadania użytkowników systemu WOW podczas testu 3 października 2018 r. (w części pokrywające również zadania w dniu wyborów)

Miejskie Przedsiębiorstwo Energetyki Cieplnej Sp. z o.o. we Włocławku. Internetowe Biuro Obsługi Klienta. Instrukcja obsługi

Archiwum Prac Dyplomowych

MS Word Długi dokument. Praca z długim dokumentem. Kinga Sorkowska

Przedszkolaki Przygotowanie organizacyjne

KaŜdy z formularzy naleŝy podpiąć do usługi. Nazwa usługi moŝe pokrywać się z nazwą formularza, nie jest to jednak konieczne.

Archiwum Prac Dyplomowych

Praca z wynikami w ALOORA

Instrukcja obsługi dla studenta

Instrukcja dla programu Ocena.XP

KURIER XL BY CTI DLA SIÓDEMKA

Ratownictwo Medyczne

Płace Optivum. Jak wykonać eksport danych do SIO z programu Płace Optivum? Przygotowanie pliku dla SIO w programie Płace Optivum

Jak eksportować dane z Arkusza do SIO?

Moduł Programy lekowe / chemioterapia

Pobieranie puli numerów recept z Portalu Świadczeniodawcy

Uzupełnij pola tabeli zgodnie z przykładem poniżej,

Transkrypt:

Dodatek F. Dane testowe Wszystkie dane wykorzystane w testach pochodzą ze strony http://sdmc.lit.org.sg/gedatasets/datasets.html. Na stronie tej zamieszczone są różne zbiory danych zebrane z innych serwisów internetowych. Dane zapisane są w formacie znanym jako C4.5 gdzie, każdy zbiór reprezentowany jest przez dwa pliki:.names W tym pliku zawarte są opisy cech (w naszym przypadku genów), informacje o podziale na klasy (etykiety klas), oraz dziedzinę (zbiór możliwych wartości), dla każdej cechy. Schemat pliku.names przedstawia poniższy rysunek..data Ten zbiór zawiera już konkretne dane (próbki), dla każdej cechy (w naszym przypadku są to odpowiednie wartości dotyczące poziomu ekspresji kolejnych genów). Jako separator

kolejnych danych użyty jest przecinek (CSV - comma separated value). Schemat pliku.data przedstawia poniższy rysunek. Przed przystąpieniem do testów dane zostały przekonwertowane do formatu przedstawionego w dodatku E. Do tego celu został napisany prosty program konwertujący. Rys.F1. Okno programu konwertującego Aby dokonać konwersji, w pola Nazwa klasy 1 i Nazwa klasy 2 należy wpisać etykiety klas występujących w zbiorze, w pole Oznaczenie wartości brakującej wpisywana jest wartość (znak) traktowana jako wartość brakująca. Po wypełnieniu tych pól należy wybrać menu plik -> otwórz i wczytać zbiór z danymi. Po wczytaniu danych zostanie wyświetlona

liczba genów i próbek w zbiorze. Teraz można, klikając przycisk Konwertuj, zapisać dane w odpowiednim formacie (dane zostaną zapisane w pliku data.txt w bieżącym katalogu). OPIS DANYCH WYKORZYSTANYCH W TESTACH 1. ALL-AML Leukemia "Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring". Science, 286:531-537, October 1999 38 7129 dwie klasy o etykietach: ALL i AML http://www-genome.wi.mit.edu/cgibin/cancer/publications/pub_paper.cgi?mode=view&paper_id=43 Zbiór zawiera 38 próbek z badań szpiku kostnego 27 pacjentów z rozpoznaną ostrą białaczką limfoblastyczną (ALL) i 13 pacjentów z ostrą białaczką szpikową (AML). 2. Central Nervous System "Prediction of Central Nervous System Embryonal Tumour Outcome Based on Gene Expression", Letters to Nature, Nature, 415:436-442, January 2002. 60 7129 dwie klasy o etykietach: class1 i class0

http://www-genome.wi.mit.edu/mpr/cns/ Dane dotyczą badania guzów centralnego systemu nerwowego (CNS). Próbki pochodzą od pacjentów poddanych procesowi leczenia, 21 próbek pochodzi od pacjentów, którzy przeżyli (próbki z etykietą Class1) a 39 próbek od pacjentów, którzy mimo przyjmowania leków, zmarli (próbki etykietowane Class0). 3. Colon Tumor "Broad Patterns of Gene Expression Revealed by Clustering Analysis of Tumor and Normal Colon Tissues Probed by Oligonucleotide Arrays". Proceedings of National Academy of Sciences of the United States of American, 96:6745-6750, 1999 62 2000 dwie klasy o etykietach: positive i negative http://microarray.princeton.edu/oncology/affydata/index.html Zbiór zawiera 62 próbki pobrane od pacjentów cierpiących na nowotwór jelita grubego. Spośród tych próbek, 40 to biopsje z miejsc, w których rozwinął się nowotwór (próbki z etykietą negative ) a 22 próbki pobrane są ze zdrowych części jelita grubego, tych samych pacjentów (etykieta positive ). 4. Ovarian Cancer "Use of Proteomic Patterns in Serum to Identify Ovarian Cancer". The Lancet, 359:572-577, February, 2002 253

15154 dwie klasy o etykietach: Cancer i Normal http://clinicalproteomics.steem.com/ Zbiór 253 próbek, z których 162 pochodzą od pacjentek z wykrytym nowotworem jajnika (etykieta Cancer ) a 91 próbek są to próbki kontrolne (etykietowane jako Normal ). Dane zawarte w tym zbiorze są znormalizowane, tak że wartości zawierają się w przedziale <0,1>. 5. Prostate Cancer "Gene Expression Correlates of Clinical Prostate Cancer Behavior". Cancer Cell, 1:203-209, March, 2002 102 12600 dwie klasy o etykietach: tumor i normal http://www-genome.wi.mit.edu/mpr/prostate Próbki pobrane zostały od 52 pacjentów u których stwierdzono raka prostaty (etykieta tumor ) oraz od 50 zdrowych pacjentów (etykieta normal ) 6. Lung Cancer "Translation of Microarray Data into Clinically Relevant Cancer Diagnostic Tests Using Gege Expression Ratios in Lung Cancer And Mesothelioma". Cancer Research, 62:4963-4967, 2002

32 12533 dwie klasy o etykietach: MPM i ADCA http://www.chestsurg.org Klasyfikacja pomiędzy złośliwym międzybłoniakiem opłucnej (MPM) i gruczolakorakiem płuca (ADCA). Spośród 32 próbek połowa należy do klasy MPM a połowa do ADCA.