Przykładowa analiza danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Przykładowa analiza danych"

Transkrypt

1 Przykładowa analiza danych W analizie wykorzystano dane pochodzące z publicznego repozytorium ArrayExpress udostępnionego na stronach Europejskiego Instytutu Bioinformatyki (http://www.ebi.ac.uk/). Zbiór zawierał informację o poziomie ekspresji genów w 23 gruczolakorakach płuc i 18 tkankach wolnych od nowotworu. Materiał biologiczny pochodziły od 23 pacjentów. Profil ekspresji genów został wyznaczony techniką mikromacierzy oligonukleotydowych HG- U133A firmy Affymterix. Nazwa i identyfikator eksperymentu: E-TABM-15. Krok pierwszy: analiza niskiego poziomu Analiza niskiego poziomu (zwana dalej w skrócie ANP) obejmuje wszystkie operacje związane z wstępnym przetwarzaniem danych z mikromacierzy. Celem ANP jest uzyskanie wartości ekspresji genów wolnych od błędów systematycznych oraz zapewnienie możliwości porównywania ze sobą danych pochodzących z wielu mikromacierzy. ANP obejmuje korekcję tła, normalizację oraz sumaryzację. Korekcją tła nazywamy ogólnie ujmując odjęcie wartości tła od zmierzonej na mikromacierzy wartości ekspresji genu. Tło powstaje m.in. na skutek odbijania się światła lasera od powierzchni mikromacierzy. Zadaniem normalizacji jest eliminacja niebiologicznego zróżnicowania pomiędzy danymi pochodzącymi z wielu mikromacierzy. Polega ona na takim przetworzeniu danych, by otrzymano wspólną skalę poziomów ekspresji genów dla wszystkich mikromacierzy DNA. W wyniku procesu sumaryzacji powstaje tabela z danymi, której poszczególne wiersze odpowiadają genom, a kolumny badanym próbkom. Każda z kolumn przedstawia profil ekspresji genów w określonej próbie, a każdy z wierszy poziom ekspresji określonego genu we wszystkich analizowanych materiałach genetycznych. Rozmiar uzyskanej tabeli zależy od modelu mikromacierzy wykorzystanej w eksperymencie i liczby badanych prób. Typ mikromacierzy warunkuje liczbę wierszy, a liczba badanych próbek przekłada się na liczbę kolumn. W ramach analizy ANP istnieje możliwość określenia następujących parametrów: korekcja tła: - brak korekcji tła - RMA - GCRMA normalizacji: - kwantylowa (http://en.wikipedia.org/wiki/quantile_normalization) - skalowanie (http://en.wikipedia.org/wiki/feature_scaling)

2 Wybrane parametry dla prezentowanej analizy zaznaczono na czerwono. Do wizualizacji danych przed i po analizie niskiego poziomu wykorzystuje się wykres częstości oraz wykres pudełkowy. rozkład danych przed ANP rozkład danych po ANP Aby można porównywać dane z wielu mikromacierzy DNA, powinny mieć one wspólny rozkład danych. Krok drugi: analiza skupień Analiza skupień (ang. data clustering) jest metodą tzw. klasyfikacji bez nadzoru (ang. unsupervised learning). Jest to metoda wykonująca grupowanie elementów we względnie jednorodne klasy. Podstawą grupowania jest podobieństwo pomiędzy elementami wyrażone przy pomocy miary odległości. Integromika dostarcza możliwość wykonania klasteryzacji hierarchicznej, której rezultat jest przedstawiany w postaci drzewa (dendrogramu). W ramach analizy skupień istnieje możliwość określenia następujących parametrów: miara odległości: - odległość euklidesowa - odległość Czybyszewa - odległość miejska - odległość Canberra - odległość binarna - odległość Minkowskiego metoda aglomeracji (łączenia): - powiększona suma kwadratów odległości (metoda Warda) - pojedyncze połączenie - całkowite połączenie - uśrednione połączenie - ważona średnia klasowa (metoda Mcquitty)

3 - mediana - środki ciężkości klasteryzacja hierarchiczna: - po genach (wierszach) - po próbach (kolumnach) Wybrane wartości parametrów dla prezentowanej analizy zaznaczono na czerwono. dendogram, kolorem zielonym zaznaczano grupę gruczolakoraków płuc, kolor czerwony to kontrole. Skupienia/klastry utworzone w oparciu o ekspresję genów pokrywają się z klasyfikacją histopatologiczną. Jednym z celów analizy skupień może być sprawdzenie czy klasyfikacja prób na podstawie ekspresji genów pokrywa się z klasyfikacją histopatologiczną. Krok trzeci: wyznaczanie genów różnicujących Analiza istotności mikromacierzy (ang. Significance Analysis of Microarray, SAM) to uznana statystyczna metoda typowania genów istotnie różnicujących. Metoda ta bazuje na porównaniu tzw. obserwowanej wartości statystki z tzw. oczekiwaną wartością statystki (wygenerowaną metodami kombinatorycznymi). Po wykonaniu analizy istotności mikromacierzy użytkownik powinien ograniczyć analizowany zbiór do genów istotnie

4 zróżnicowanych (używając w narzędziu analizy Typowanie genów różnicujących SAM etap II ). Czynność tą przeprowadza się za pomocą określenia wartości współczynników: - FDR (false discovery rate) - DELTA Współczynnik FDR określa nam procent genów fałszywie dodatnich. Współczynnik delta jest kryterium zróżnicowania pomiędzy porównywanymi grupami. Zaleca się aby uznać za różnicujący zbiór genów dla którego FDR wynosi 0. Jeśli FDR wynosi np to mniej więcej 5% z genów uznanych za różnicujące może nie być różnicujące. W praktyce, wraz ze wzrostem kryterium delta, spada liczba genów różnicujących i spada wartość FDR. Wykres SAM, kolorem zielonym zaznaczono 38 genów różnicujących. Krok czwarty: analiza głównych składowych Analiza głównych składowych (ang. Principal Component Analysis, PCA) to popularna metoda redukcji wielowymiarowości. Celem PCA jest taki obrót układu współrzędnych, aby maksymalizować w pierwszej kolejności wariancję pierwszej współrzędnej, następnie

5 wariancję drugiej współrzędnej, itd. Można więc pominąć wymiary o niewielkiej wariancji co w efekcie prowadzi do powstania nowego zbioru zmiennych, odzwierciedlających zmienność występującą w oryginalnym zbiorze z pewnym poziomem pokrycia. W ramach analizy głównych składowych istnieje możliwość określenia następujących parametrów: tym macierzy: - macierz korelacji - macierz kowariancji liczba składowych: - 2 (wykres 2D) - 3 (wykres 3D) PCA podobnie jak klasteryzację hierarchiczną można zastosować do próby odpowiedzi na pytanie czy klasyfikacja prób na podstawie ekspresji genów pokrywa się z klasyfikacją histopatologiczną. wykres PCA dla 3 głównych składowych, kolorem zielonym zaznaczano grupę gruczolakoraków płuc, kolor czerwony to kontrole. Krok piąty: sztuczne sieci neuronowe Analiza oparta na sztucznych sieciach neuronowych pozwala na utworzenie i wytrenowanie modelu neuronowego (typu perceptron), który następnie może zostać

6 wykorzystany do rozpoznawania tkanek zdrowych i tkanek zmienionych chorobowo wyłącznie na podstawie profilu ekspresji genów różnicujących. Analiza przebiega w 3 etapach. Etap I: Przygotowanie zbiorów wejściowych W ramach etapu tworzymy tzw. zbiór uczący, testowy i opcjonalnie walidujący. W przedstawionej analizie utworzono zbiór uczący złożony z 29 prób (70 %) i zbiór testowy złożony z 12 prób (30 %). W każdym ze zbiorów, każda z prób jest charakteryzowana przez poziom ekspresji 38 genów. Ponadto każdej z prób przypisano klasę zgodnie z klasyfikacją histopatologiczną. Zbiór uczący: ID PRÓBY _at NM_ FHL _s_at NM_ SPOCK _s_at BE NA _at NM_ WFS _s_at NM_ CAV1 23_1,CEL 8,42 7,44 7,69 6,90 6,76 23_2,CEL 10,64 8,67 9,61 8,15 9,42 32_1,CEL 8,92 7,25 7,76 7,29 6,70 32_2,CEL 10,81 9,99 10,68 8,55 10,30 33_1,CEL 9,91 7,37 8,48 6,98 7,91 40_2,CEL 10,64 9,72 10,04 8,63 9,66 47_2,CEL 10,79 8,98 9,30 8,35 9,87 48_1,CEL 6,95 7,37 8,07 7,14 6,42 48_2,CEL 10,42 10,01 10,73 8,94 10,52 54_1,CEL 7,25 8,24 7,09 7,66 5,93 54_2,CEL 10,74 9,11 8,83 8,50 9,84 61_1,CEL 8,99 7,60 7,65 7,55 6,74 61_2,CEL 11,01 9,03 9,72 8,47 9,05 67_1,CEL 7,01 6,46 7,16 6,07 5,89 71_1,CEL 7,34 7,19 7,52 7,15 6,07 78_1,CEL 7,81 7,72 8,53 7,52 7,54 78_2,CEL 10,58 9,81 10,53 8,93 10,83 79_1,CEL 7,99 7,03 8,22 6,85 6,29 79_2,CEL 10,60 9,33 10,40 8,55 9,87 84_1,CEL 7,27 7,44 6,92 6,93 6,17 84_2,CEL 10,70 9,61 10,39 8,57 10,02 86_1,CEL 8,03 6,38 7,92 6,47 6,33 86_2,CEL 10,58 8,93 10,65 8,29 10,10 87_1,CEL 7,34 5,87 8,10 6,72 6,02 87_2,CEL 10,18 9,89 10,48 8,80 10,15 89_1,CEL 7,23 5,73 8,09 6,55 5,78 89_2,CEL 10,74 9,26 10,36 8,80 10,16 92_1,CEL 6,94 7,20 7,20 7,79 6,45 92_2,CEL 10,78 9,52 9,59 8,63 9, _at X15357 NPR1 KLASYFIKACJA 5,49 0 (kontrola) 6,62 1 (gruczolakorak) 5,57 0 (kontrola) 6,62 1 (gruczolakorak) 5,69 0 (kontrola) 6,26 1 (gruczolakorak) 6,58 1 (gruczolakorak) 5,22 0 (kontrola) 6,52 1 (gruczolakorak) 5,19 0 (kontrola) 6,21 1 (gruczolakorak) 5,65 0 (kontrola) 6,58 1 (gruczolakorak) 5,75 0 (kontrola) 5,05 0 (kontrola) 5,57 0 (kontrola) 6,69 1 (gruczolakorak) 5,64 0 (kontrola) 6,48 1 (gruczolakorak) 5,80 0 (kontrola) 6,42 1 (gruczolakorak) 5,81 0 (kontrola) 6,70 1 (gruczolakorak) 5,01 0 (kontrola) 6,72 1 (gruczolakorak) 5,15 0 (kontrola) 6,42 1 (gruczolakorak) 5,28 0 (kontrola) 6,30 1 (gruczolakorak)

7 Etap II: Uczenie sieci neuronowych Następnie tworzymy i uczymy modele neuronowe o zdefiniowanej przez użytkownika maksymalnej liczbie neuronów w I i II warstwie ukrytej. Użytkownik ma możliwość określenia także innych parametrów jak: liczba cykli uczenia, zakres wag, rodzaj funkcji aktywacji, współczynnik uczenia, momentu. Uczenie przebiega wyłącznie na danych ze zbioru uczącego. W prezentowanej analizie przyjęto następujące wartości dla poszczególnych parametrów: Liczba cykli uczenia: 3000 Uczenie wielu SSN: tak Dolny zakres początkowych wartości wag: 0 Górny zakres początkowych wartości wag: 1 Próg: 1.0 Metoda aktywacji: Sigmoidalna funkcja unipolarna Liczba neuronów w I warstwie ukrytej: 20 Współczynnik uczenia: 0.1 Liczba neuronów w II warstwie ukrytej: 20 Momentum: 0.01 Tak zadane parametry, pozwoliły na utworzenie i wyszkolenie ponad 1200 sztucznych sieci neuronowych. Z pośród tej grupy sieć o strukturze uzyskała najmniejszą wartość błędu średniokwadratowego (czyli najlepiej rozpoznawała poszczególne próby ze zbioru uczącego) i została wybrana do dalszych testów. Etap III: Testowanie sieci neuronowej W kolejnym etapie należy sprawdzić zdolność sieci do uogólnienie zdobytej wiedzy, poprzez analizę testowego zbioru danych. Jeśli wybrany model (w analizowanym przypadku sieć o budowie ) poprawnie zaklasyfikuje próby które nie brały udziału w procesie uczenia, oznacza to że model może być wykorzystana np. jako klasyfikator lub np. istnieje zakładany podział na klasy. ID PRÓBY KLASYFIKACJA ODPOWIEDŹ SIECI BŁĄD 28_1.CEL 0 (kontrola) _2.CEL 1 (gruczolakorak) _2.CEL 1 (gruczolakorak) _1.CEL 0 (kontrola) _2.CEL 1 (gruczolakorak) _1.CEL 0 (kontrola) _1.CEL 0 (kontrola) _2.CEL 1 (gruczolakorak) _1.CEL 0 (kontrola) _1.CEL 0 (kontrola) _1.CEL 0 (kontrola) _1.CEL 0 (kontrola)

8 W prezentowanym przykładzie, wybrana sztuczna sieć neuronowa bezbłędnie zaklasyfikowała wszystkie 12 prób wchodzące w skład zbioru testowego.

9

10

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g

Implementacja wybranych algorytmów eksploracji danych na Oracle 10g Implementacja wybranych algorytmów eksploracji danych na Oracle 10g Sławomir Skowyra, Michał Rudowski Instytut Informatyki Wydziału Elektroniki i Technik Informacyjnych, Politechnika Warszawska S.Skowyra@stud.elka.pw.edu.pl,

Bardziej szczegółowo

WYKORZYSTANIE DO PROGNOZOWANIA WIG

WYKORZYSTANIE DO PROGNOZOWANIA WIG SIECI NEURONOWE WYKORZYSTANIE DO PROGNOZOWANIA WIG Dr Kamila Migdał Najman Dr Krzysztof Najman Katedra Statystyku Wydział Zarządzania Uniwersytet Gdański K.Najman@panda.bg.univ.gda.pl kmn@panda.bg.univ.gda.pl

Bardziej szczegółowo

Analiza i eksploracja danych biznesowych

Analiza i eksploracja danych biznesowych Analiza i eksploracja danych biznesowych Business Intelligence systemy wspomagania decyzji Dr inż. Marcin Blachnik Plan zajęć 1. Dane czym są i jak je reprezentować 2. Metody analizy statystycznej (małe

Bardziej szczegółowo

BAZY DANYCH I NARZĘDZIA ANALITYCZNE W BADANIACH

BAZY DANYCH I NARZĘDZIA ANALITYCZNE W BADANIACH BAZY DANYCH I NARZĘDZIA ANALITYCZNE W BADANIACH SATYSFAKCJI I LOJALNOŚCI Grzegorz Migut StatSoft Polska Sp. z o.o. Bazy danych w strategiach lojalnościowych Podtrzymanie więzi z klientem, traktowanie go

Bardziej szczegółowo

Spis treści. 1.1 Problematyka... 4 1.2 Cele pracy i zakres pracy... 5

Spis treści. 1.1 Problematyka... 4 1.2 Cele pracy i zakres pracy... 5 Spis treści 1 Wstęp 4 1.1 Problematyka.......................... 4 1.2 Cele pracy i zakres pracy...................... 5 2 Analiza zagadnienia 7 2.1 Wprowadzenie.......................... 7 2.2 Eksploracja

Bardziej szczegółowo

Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów. Krzysztof Drelczuk. Praca magisterska

Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów. Krzysztof Drelczuk. Praca magisterska Uniwersytet Ekonomiczny we Wrocławiu Wydział Zarządzania, Informatyki i Finansów Krzysztof Drelczuk Wyszukiwanie wzorców kupna-sprzedaży w finansowych szeregach czasowych za pomocą teorii falek i gazów

Bardziej szczegółowo

Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych.

Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych. Metody Sztucznej Inteligencji 2 Projekt Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych. Autorzy: Robert Wojciechowski Michał Denkiewicz Mateusz Gągol Wstęp Celem projektu

Bardziej szczegółowo

Eksploracja danych Jacek Rumiński

Eksploracja danych Jacek Rumiński Eksploracja danych Jacek Rumiński slajd 1 Kontakt: Katedra Inżynierii Biomedycznej, pk. 106, tel.: 3472678, fax: 3461757, e-mail: jwr@eti.pg.gda.pl Źródła, Internet, SQL/MM i inne standardy (dodatkowy

Bardziej szczegółowo

Wspomaganie planowania finansowego w systemach informatycznych z wykorzystaniem rozwiązań inteligentnych

Wspomaganie planowania finansowego w systemach informatycznych z wykorzystaniem rozwiązań inteligentnych Wspomaganie planowania finansowego w systemach informatycznych 111 Marcin RELICH Zakład Controllingu i Informatyki Ekonomicznej, Uniwersytet Zielonogórski E mail: m.relich@wez.uz.zgora.pl Wspomaganie planowania

Bardziej szczegółowo

TEXT MINING JAKO NARZĘDZIE POZYSKIWANIA INFORMACJI Z DOKUMENTÓW TEKSTOWYCH

TEXT MINING JAKO NARZĘDZIE POZYSKIWANIA INFORMACJI Z DOKUMENTÓW TEKSTOWYCH TEXT MINING JAKO NARZĘDZIE POZYSKIWANIA INFORMACJI Z DOKUMENTÓW TEKSTOWYCH Paweł Lula Akademia Ekonomiczna w Krakowie, Katedra Informatyki Stale i szybko rosnące zasoby informacyjne są jedną z cech współczesności.

Bardziej szczegółowo

red. naukowa Jarosław Protasiewicz

red. naukowa Jarosław Protasiewicz Procedury recenzowania i doboru recenzentów Tom drugi red. naukowa Jarosław Protasiewicz Projekt współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego 1 Procedury recenzowania

Bardziej szczegółowo

Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego

Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego POLITECHNIKA ŁÓDZKA Wydział Fizyki Technicznej, Informatyki i Matematyki Stosowanej Praca dyplomowa Wybrane techniki przygotowywania rekomendacji dla użytkowników serwisu internetowego Artur Ziółkowski

Bardziej szczegółowo

Eksploracja danych TADEUSZ MORZY

Eksploracja danych TADEUSZ MORZY NAUKA 3/2007 83-104 TADEUSZ MORZY Eksploracja danych Intensywny rozwój technologii generowania, gromadzenia i przetwarzania danych z jednej strony, z drugiej, upowszechnienie systemów informatycznych,

Bardziej szczegółowo

4. Metody systemowe zarządzania jakością

4. Metody systemowe zarządzania jakością Zarządzanie jakością w praktyce inżynierskiej 4. Metody systemowe zarządzania jakością 4.1 Metody statystyczne w zarządzaniu jakością Do podstawowych instrumentów monitorowania procesów wytwórczych należą

Bardziej szczegółowo

Ostateczna wersja metodologii prowadzenia monitoringu zawodów deficytowych i nadwyżkowych na lokalnym rynku pracy

Ostateczna wersja metodologii prowadzenia monitoringu zawodów deficytowych i nadwyżkowych na lokalnym rynku pracy Ostateczna wersja metodologii prowadzenia monitoringu zawodów deficytowych i nadwyżkowych na lokalnym rynku pracy OPRACOWANIE NOWYCH ZALECEŃ METODYCZNYCH PROWADZENIA MONITORINGU ZAWODÓW DEFICYTOWYCH I

Bardziej szczegółowo

ZASTOSOWANIE SZTUCZNYCH SIECI NEURONOWYCH W DETEKCJI KARTOWYCH TRANSAKCJI OSZUKAŃCZYCH

ZASTOSOWANIE SZTUCZNYCH SIECI NEURONOWYCH W DETEKCJI KARTOWYCH TRANSAKCJI OSZUKAŃCZYCH ZASTOSOWANIE SZTUCZNYCH SIECI NEURONOWYCH W DETEKCJI KARTOWYCH TRANSAKCJI OSZUKAŃCZYCH Michał Grzywa, ALIOR BANK S.A. Karty płatnicze są powszechnie stosowanym i bezpiecznym instrumentem płatniczym. W

Bardziej szczegółowo

Systemy do dogłębnej analizy danych - porównanie.

Systemy do dogłębnej analizy danych - porównanie. Systemy do dogłębnej analizy danych - porównanie. Tomasz Winiarski Rok akademicki 2000/2001 Praca licencjacka pod kierunkiem prof. dr. hab. W. Ducha Spis treści 1 Wstęp 3 2 Drażenie danych 5 2.1 Pochodzenie

Bardziej szczegółowo

Metody Informatyki Stosowanej

Metody Informatyki Stosowanej Polska Akademia Nauk Oddział w Gdańsku Komisja Informatyki Metody Informatyki Stosowanej Nr 3/2009 (20) Szczecin 2009 Metody Informatyki Stosowanej Kwartalnik Komisji Informatyki Polskiej Akademii Nauk

Bardziej szczegółowo

ANALIZA PROCESÓW TRIBOLOGICZNYCH Z WYKORZYSTANIEM SZTUCZNYCH SIECI NEURONOWYCH

ANALIZA PROCESÓW TRIBOLOGICZNYCH Z WYKORZYSTANIEM SZTUCZNYCH SIECI NEURONOWYCH Dr hab. inż. Henryk CZARNECKI, prof. PCz Instytut Marketingu Politechnika Częstochowska DOI: 10.17814/mechanik.2015.7.223 ANALIZA PROCESÓW TRIBOLOGICZNYCH Z WYKORZYSTANIEM SZTUCZNYCH SIECI NEURONOWYCH

Bardziej szczegółowo

STATISTICA W ADMINISTRACJI PUBLICZNEJ

STATISTICA W ADMINISTRACJI PUBLICZNEJ STATISTICA W ADMINISTRACJI PUBLICZNEJ Piotr Wójtowicz, StatSoft Polska Sp. z o.o. Administracja publiczna to jeden z obszarów, gdzie odpowiednio zastosowane metody analizy danych mogą przynieść znaczne

Bardziej szczegółowo

Optymalizacja systemu rekomendacyjnego na podstawie bazy USOS

Optymalizacja systemu rekomendacyjnego na podstawie bazy USOS Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Karol Kański Nr albumu: 248362 Optymalizacja systemu rekomendacyjnego na podstawie bazy USOS Praca magisterska na kierunku MATEMATYKA

Bardziej szczegółowo

Przegląd darmowego oprogramowania do analizy dużych zbiorów danych

Przegląd darmowego oprogramowania do analizy dużych zbiorów danych Przegląd darmowego oprogramowania do analizy dużych zbiorów danych Tomasz Jach, Tomasz Xięski Uniwersytet Śląski, Instytut Informatyki, ul. Będzińska 39, 41-200 Sosnowiec {tomasz.jach tomasz.xieski}@us.edu.pl

Bardziej szczegółowo

Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych

Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych Oracle Data Mining odkrywanie wiedzy w dużych wolumenach danych Mikołaj Morzy Instytut Informatyki Politechniki Poznańskiej e-mail: Mikolaj.Morzy@cs.put.poznan.pl Abstrakt. Duże wolumeny danych zawierają

Bardziej szczegółowo

Inteligentny system wspomagania decyzji dla sterowania siecią wodociągową 1

Inteligentny system wspomagania decyzji dla sterowania siecią wodociągową 1 Inteligentny system wspomagania decyzji dla sterowania siecią wodociągową 1 Izabela Rojek 2 Streszczenie: Referat przedstawia inteligentny system wspomagania decyzji dla sterowania siecią wodociągową.

Bardziej szczegółowo

Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL)

Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL) Katolicki Uniwersytet Lubelski Jana Pawła II Dr Krzysztof Jurek Praktyczne wykorzystanie IBM SPSS Statistics (wersja 21 PL) Kurs dla użytkowników początkujących i średniozaawansowanych Lublin SPIS TREŚCI

Bardziej szczegółowo

Podręcznik użytkownika programu IBM SPSS Modeler Social Network Analysis 16

Podręcznik użytkownika programu IBM SPSS Modeler Social Network Analysis 16 Podręcznik użytkownika programu IBM SPSS Modeler Social Network Analysis 16 Uwaga Przed użyciem tych informacji i produktu, którego dotyczą, należy zapoznać się z informacjami w sekcji Uwagi na stronie

Bardziej szczegółowo

Data Mining w bazie Oracle 9i

Data Mining w bazie Oracle 9i VIII Konferencja PLOUG Koœcielisko PaŸdziernik 2002 Data Mining w bazie Oracle 9i Mariusz Byrski Biuro Matematyki Stosowanej S.C. mb@bms.krakow.pl Abstrakt Szukanie nieoczywistych zwi¹zków w danych jest

Bardziej szczegółowo

Analiza możliwości zastosowania sieci neuronowych do modelowania wartości kapitału społecznego w firmach IT

Analiza możliwości zastosowania sieci neuronowych do modelowania wartości kapitału społecznego w firmach IT Analiza możliwości zastosowania sieci neuronowych do modelowania wartości kapitału społecznego w firmach IT Julia Siderska Politechnika Białostocka, Wydział Zarządzania, e-mail: j.siderska@pb.edu.pl Streszczenie

Bardziej szczegółowo

Reprezentacja dokumentów tekstowych w modelu przestrzeni wektorowej

Reprezentacja dokumentów tekstowych w modelu przestrzeni wektorowej POLITECHNIKA WARSZAWSKA WYDZIAŁ ELEKTRONIKI I TECHNIK INFORMACYJNYCH INSTYTUT INFORMATYKI Rok akademicki 2004/2005 PRACA DYPLOMOWA MAGISTERSKA Michał Kosmulski Reprezentacja dokumentów tekstowych w modelu

Bardziej szczegółowo

Modele eksploracji danych - CROSS-SELLING, LTV, EVENT

Modele eksploracji danych - CROSS-SELLING, LTV, EVENT Zakład Zaawansowanych Technik Informacyjnych (Z-6) Modele eksploracji danych - CROSS-SELLING, LTV, EVENT Praca statutowa nr 06.30.003.6 Warszawa, grudzień 2006 Modele eksploracji danych - CROSS-SELLING,

Bardziej szczegółowo