Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści

Podobne dokumenty
Przetwarzanie i analiza danych w języku Python / Marek Gągolewski, Maciej Bartoszuk, Anna Cena. Warszawa, Spis treści

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

AUTOMATYKA INFORMATYKA

Podstawy analizy danych numerycznych w języku Python

Myśl w języku Python! : nauka programowania / Allen B. Downey. Gliwice, cop Spis treści

Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych

Programista samouk : profesjonalny przewodnik do samodzielnej nauki kodowania / Cory Althoff. Gliwice, copyright Spis treści

Wprowadzenie do Python

Programowanie dla początkujących w 24 godziny / Greg Perry, Dean Miller. Gliwice, cop Spis treści

R dla każdego : zaawansowane analizy i grafika statystyczna / Jared P. Lander. Warszawa, Spis treści

Język R : kompletny zestaw narzędzi dla analityków danych / Hadley Wickham, Garrett Grolemund. Gliwice, cop Spis treści

ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia

Dariusz Brzeziński Instytut Informatyki, Politechnika Poznańska

Przewodnik po pakiecie R / Przemysław Biecek. Wyd. 4 rozsz. Wrocław, Spis treści

Lektura obowiązkowa dla każdego, kto poważnie myśli o wykorzystaniu okazji, jakie niosą ze sobą wielkie zbiory danych.

4.1. O grafice w R 4.2. Kolorystyka 4.3. Podstawowe komendy graficzne i opcje 4.4. Wykres pudełkowy 4.5. Histogram 4.6. Wykres kolumnowy 4.7.

SQL w 24 godziny / Ryan Stephens, Arie D. Jones, Ron Plew. Warszawa, cop Spis treści

Analiza danych tekstowych i języka naturalnego

Szczegółowy opis przedmiotu zamówienia

Język C : programowanie dla początkujących : przewodnik dla adeptów programowania / Greg Perry, Dean Miller. Gliwice, cop

Klasyfikacja LDA + walidacja

Ontogeniczne sieci neuronowe. O sieciach zmieniających swoją strukturę

Java w 21 dni / Rogers Cadenhead. Gliwice, cop Spis treści. O autorze 11. Wprowadzenie 13 TYDZIEŃ I JĘZYK JAVA

KLASYFIKACJA. Słownik języka polskiego

Metody eksploracji danych Laboratorium 1. Weka + Python + regresja

Obróbka po realnej powierzchni o Bez siatki trójkątów o Lepsza jakość po obróbce wykańczającej o Tylko jedna tolerancja jakości powierzchni

Szczegółowy opis zamówienia:

Teraz bajty. Informatyka dla szkół ponadpodstawowych. Zakres rozszerzony. Część 1.

Wprowadzenie do uczenia maszynowego

Rozpoznawanie obrazów

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Uczenie maszynowe w zastosowaniu do fizyki cząstek

Część I Rozpoczęcie pracy z usługami Reporting Services

Ciągłe dostarczanie oprogramowania : kompletny przewodnik / Eberhard Wolff. Gliwice, cop Spis treści

Widzenie komputerowe (computer vision)

Odczytywanie i zapisywanie obrazów rastrowych do plików, operacje punktowe na tablicach obrazów

Jeśli chcesz łatwo i szybko opanować podstawy C++, sięgnij po tę książkę.

WSTĘP I TAKSONOMIA METODY INŻYNIERII WIEDZY KNOWLEDGE ENGINEERING AND DATA MINING. Adrian Horzyk. Akademia Górniczo-Hutnicza

Interaktywne ustawianie narzędzia Kątowe ustawienie narzędzia Narzędzie pod kątem w obróbce zgrubnej i pośredniej

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

Wykresy i interfejsy użytkownika

Algorytmika i pseudoprogramowanie

Programowanie w języku R : analiza danych, obliczenia, symulacje / Marek Gągolewski. Wyd. 2 poszerz. Warszawa, Spis treści

ALGORYTM RANDOM FOREST

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Spis treści. Przedmowa. Podstawy R

Informatyczne podstawy projektowania Kod przedmiotu

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Zintegrowany system zarządzania produkcją ZKZ-ERP

Obliczenia równoległe i rozproszone. Praca zbiorowa pod redakcją Andrzeja Karbowskiego i Ewy Niewiadomskiej-Szynkiewicz

Metody systemowe i decyzyjne w informatyce

Rozkład materiału do zajęć z informatyki. realizowanych według podręcznika

Programowanie sterowników przemysłowych / Jerzy Kasprzyk. wyd. 2 1 dodr. (PWN). Warszawa, Spis treści

Metody klasyfikacji danych - część 1 p.1/24

Zrównoleglona optymalizacja stochastyczna na dużych zbiorach danych

Kod doskonały : jak tworzyć oprogramowanie pozbawione błędów / Steve McConnell. Gliwice, cop Spis treści. Wstęp 15.

Programowanie w języku R : analiza danych, obliczenia, symulacje / Marek Gągolewski. Warszawa, Spis treści

Spis treści. Część I Wprowadzenie do pakietu oprogramowania Analysis Services

Klasyfikacja i regresja Wstęp do środowiska Weka

WPF 4.5 : księga eksperta / Adam Nathan. Gliwice, cop Spis treści

Spis treści. I. Skuteczne. Od autora... Obliczenia inżynierskie i naukowe... Ostrzeżenia...XVII

Drzewa decyzyjne i lasy losowe

Język programowania DELPHI / Andrzej Marciniak. Poznań, Spis treści

WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU

Uczenie sieci neuronowych i bayesowskich

Grafika i Systemy Multimedialne (IGM)

PROGRAM NAUCZANIA DLA ZAWODU TECHNIK INFORMATYK, O STRUKTURZE PRZEDMIOTOWEJ

Ankieta. Informacje o uczestniku. Imię i nazwisko: Stanowisko : Warsztat Innowacyjne metody dydaktyczne (np. learning by doing, design thinking)

Spis treści 1. Wstęp 2. Ćwiczenia laboratoryjne LPM

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III

INFORMATYKA W SELEKCJI

SQL Server i T-SQL w mgnieniu oka : opanuj język zapytań w 10 minut dziennie / Ben Forta. Gliwice, Spis treści

Wprowadzenie do uczenia maszynowego

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Metody systemowe i decyzyjne w informatyce

Mail: Pokój 214, II piętro

Przedmowa 11 Ważniejsze oznaczenia 14 Spis skrótów i akronimów 15 Wstęp 21 W.1. Obraz naturalny i cyfrowe przetwarzanie obrazów 21 W.2.

E.14.1 Tworzenie stron internetowych / Krzysztof T. Czarkowski, Ilona Nowosad. Warszawa, Spis treści

8. Drzewa decyzyjne, bagging, boosting i lasy losowe

Wymagania edukacyjne z informatyki w klasie VIII

Podstawy statystyki matematycznej w programie R

Wydajne programowanie w R : praktyczny przewodnik po lepszym programowaniu / Colin Gillespie, Robin Lovelace. Warszawa, Spis treści.

C# 6.0 : kompletny przewodnik dla praktyków / Mark Michaelis, Eric Lippert. Gliwice, cop Spis treści

Adobe InDesign CC/CC PL : oficjalny podręcznik / Kelly Kordes Anton, John Cruise. Gliwice, cop Spis treści

Metody i techniki sztucznej inteligencji / Leszek Rutkowski. wyd. 2, 3 dodr. Warszawa, Spis treści

Microsoft Project 2016 : krok po kroku / Carl Chatfield, Timothy Johnson. Warszawa, Spis treści

Microsoft Office 2016 Krok po kroku

Procesy integracji modeli danych do jednolitej struktury WBD. Tadeusz Chrobak, Krystian Kozioł, Artur Krawczyk, Michał Lupa

1 Zrozumieć Flasha... 1 Co można zrobić za pomocą Flasha?... 2 Tworzenie obrazków do strony 3 Animowanie witryny 4 Tworzenie filmów

Algorytmy, które estymują wprost rozkłady czy też mapowania z nazywamy algorytmami dyskryminacyjnymi.

OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak

ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18

KARTA SZKOLENIA 1/5. Po ukończeniu szkolenia uczestnik będzie potrafił:

OPIS PRZEDMIOTU ZAMÓWIENIA. Część nr 8 OPROGRAMOWANIE DO ANALIZ MARKETINGOWYCH (pom. nr 1.21)

Transkrypt:

Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop. 2017 Spis treści O autorach 9 0 recenzencie 10 Wprowadzenie 11 Rozdział 1. Pierwsze kroki 15 Wprowadzenie do nauki o danych i Pythona 16 Instalowanie Pythona 17 Python 2 czy Python 3? 18 Instalacja krok po kroku 19 Instalowanie pakietów 20 Aktualizowanie pakietów 22 Dystrybucje naukowe 22 Środowiska wirtualne 25 Krótki przegląd podstawowych pakietów 28 Wprowadzenie do środowiska Jupyter 37 Szybka instalacja i pierwsze testowe zastosowanie 41 Magiczne polecenia w Jupyterze 42 W jaki sposób notatniki Jupytera mogą być pomocne dla badaczy danych? 44 Zastępniki Jupytera 49 Zbiory danych i kod używane w książce 50 Proste przykładowe zbiory danych z pakietu scikit-learn 50 Podsumowanie 59 Rozdział 2. Przekształcanie danych 61 Proces pracy w nauce o danych 62 Wczytywanie i wstępne przetwarzanie danych za pomocą biblioteki pandas 64 Szybkie i łatwe wczytywanie danych 64 Radzenie sobie z problematycznymi danymi 67 Radzenie sobie z dużymi zbiorami danych 70 Dostęp do danych w innych formatach 73 Wstępne przetwarzanie danych 75 Wybieranie danych 78 Praca z danymi kategorialnymi i tekstowymi 81 Specjalny rodzaj danych tekst 83

Scraping stron internetowych za pomocą pakietu Beautiful Soup 89 Przetwarzanie danych za pomocą pakietu NumPy 92 N-wymiarowe tablice z pakietu NumPy 92 Podstawowe informacje o obiektach ndarray z pakietu NumPy 93 Tworzenie tablic z pakietu NumPy 95 Przekształcanie list w jednowymiarowe tablice 95 Kontrolowanie ilości zajmowanej pamięci 96 Listy niejednorodne 98 Od list do tablic wielowymiarowych 99 Zmiana wielkości tablic 100 Tablice generowane przez funkcje z pakietu NumPy 101 Pobieranie tablicy bezpośrednio z pliku 102 Pobieranie danych ze struktur z biblioteki pandas 103 Szybkie operacje i obliczenia z użyciem pakietu NumPy 104 Operacje na macierzach 106 Tworzenie wycinków i indeksowanie tablic z pakietu NumPy 108 Dodawanie warstw" tablic z pakietu NumPy 110 Podsumowanie 112 Rozdział 3. Potok danych 113 Wprowadzenie do eksploracji danych 113 Tworzenie nowych cech 117 Redukcja liczby wymiarów 120 Macierz kowariancji 120 Analiza głównych składowych 121 Analiza głównych składowych dla big data typ RandomizedPCA 125 Analiza czynników ukrytych 126 Liniowa analiza dyskryminacyjna 127 Analiza ukrytych grup semantycznych 128 Analiza składowych niezależnych 129 Analiza głównych składowych oparta na funkcji jądra 129 Algorytm t-sne 131 Ograniczone maszyny Boltzmanna 132 Wykrywanie i traktowanie wartości odstających 133 Wykrywanie obserwacji odstających za pomocą technik jednoczynnikowych 134 Klasa EllipticEnvelope 136 Klasa OneClassSVM 140 Miary używane do walidacji 144 Klasyfikacja wieloklasowa 144 Klasyfikacja binarna 147 Regresja 148 Testy i walidacja 148 Walidacja krzyżowa 153 Iteratory walidacji krzyżowej 155

Próbkowanie i bootstrapping 157 Optymalizacja hiperparametrów 159 Tworzenie niestandardowych funkcji oceny 162 Skracanie czasu przeszukiwania siatki parametrów 164 Wybór cech 166 Wybór na podstawie wariancji cech 167 Wybór za pomocą modelu jednoczynnikowego 168 Rekurencyjna eliminacja 169 Wybór na podstawie stabilności i regularyzacji L1 171 Opakowywanie wszystkich operacji w potok 173 Łączenie cech i tworzenie łańcuchów transformacji 174 Tworzenie niestandardowych funkcji transformacji 176 Podsumowanie 177 Rozdział 4. Uczenie maszynowe 179 Przygotowywanie narzędzi i zbiorów danych 179 Regresja liniowa i logistyczna 181 Naiwny klasyfikator bayesowski 184 Algorytm knn 187 Algorytmy nieiiniowe 188 Stosowanie algorytmu SVM do klasyfikowania 190 Stosowanie algorytmów SVM do regresji 192 Dostrajanie algorytmu SVM 193 Strategie oparte na zestawach algorytmów 195 Pasting z użyciem losowych próbek 196 Bagging z użyciem słabych klasyfikatorów 196 Podprzestrzenie losowe i obszary losowe 197 Algorytmy Random Forests i Extra-Trees 198 Szacowanie prawdopodobieństwa na podstawie zestawów 200 Sekwencje modeli AdaBoost 202 Metoda GTB 202 XGBoost 203 Przetwarzanie big data 206 Tworzenie przykładowych dużych zbiorów danych 207 Skalowalność ze względu na ilość danych 208 Radzenie sobie z szybkością napływu danych 210 Radzenie sobie z różnorodnością 211 Przegląd algorytmów z rodziny SGD 213 Wprowadzenie do uczenia głębokiego 214 Krótkie omówienie przetwarzania języka naturalnego 221 Podział na tokeny 221 Stemming 222 Oznaczanie części mowy 223 Rozpoznawanie nazw własnych 224 Stop-słowa 225

Kompletny przykład z obszaru nauki o danych klasyfikowanie tekstu 225 Przegląd technik uczenia nienadzorowanego 227 Podsumowanie 237 Rozdział 5. Analizy sieci społecznościowych 239 Wprowadzenie do teorii grafów 239 Algorytmy dla grafów 244 Wczytywanie grafów, zapisywanie ich w pliku i pobieranie z nich podpróbek 252 Podsumowanie 255 Rozdział 6. Wizualizacje, wnioski i wyniki 257 Wprowadzenie do pakietu Matplotlib 257 Rysowanie krzywych 259 Stosowanie paneli 260 Wykresy punktowe określające relacje w danych 262 Histogramy 263 Wykresy słupkowe 264 Wyświetlanie rysunków 265 Wybrane przykłady graficzne z użyciem pakietu pandas 268 Wykresy punktowe 271 Metoda współrzędnych równoległych 273 Opakowywanie poleceń z pakietu Matplotlib 274 Wprowadzenie do biblioteki seaborn 274 Wzbogacanie możliwości z zakresu eksploracji danych 279 Interaktywne wizualizacje z użyciem pakietu Bokeh 284 Zaawansowane reprezentacje dotyczące uczenia się na podstawie danych 288 Krzywe uczenia 288 Krzywe walidacji 290 Znaczenie cech w algorytmie Random Forests 292 Wykresy częściowej zależności oparte na drzewach GBT 293 Budowanie serwera predykcji w modelu ML-AAS 294 Podsumowanie 299 Dodatek A. Utrwalanie podstaw Pythona 301 Lista zagadnień do nauki 302 Listy 302 Słowniki 304 Definiowanie funkcji 305 Klasy, obiekty i programowanie obiektowe 307 Wyjątki 308 Iteratory i generatory 309 Instrukcje warunkowe 310 Wyrażenia listowe i słownikowe 311

Nauka przez obserwację, lekturę i praktykę 311 Masowe otwarte kursy online 311 PyCon i PyData 312 Interaktywne sesje w Jupyterze 312 Nie wstydź się podejmij wyzwanie 312 Skorowidz 315 oprac. BPK