PRZYKŁAD PROGNOZOWANIA Z WYKORZYSTANIEM METOD DATA MINING
|
|
- Lidia Żurek
- 6 lat temu
- Przeglądów:
Transkrypt
1 PRZYKŁAD PROGNOZOWANIA Z WYKORZYSTANIEM METOD DATA MINING Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Prognozowanie jest jednym z najczęściej występujących zadań analizy danych któż nie chciałby wiedzieć, co stanie się w przyszłości, a zwłaszcza wykorzystać tę wiedzę przy podejmowaniu decyzji. Ze względu na popularność prognozowania oraz rozmaite dziedziny jego stosowania opracowano bardzo wiele sposobów budowy modeli prognostycznych (przegląd metod prognozowania znajduje się w podręczniku [1]). My zajmiemy się budową modelu z wykorzystaniem podejścia data mining i przestrzeni roboczej STATISTICA Data Miner. Krótko o data mining Można się spotkać z wieloma definicjami data mining; jedną z rozsądniejszych wydaje się zaproponowana w podręczniku [2]: Data mining jest procesem badania i analizy dużych ilości danych metodami automatycznymi lub półautomatycznymi w celu odkrycia znaczących wzorców i reguł. W podejściu data mining kluczowe jest uzyskanie odpowiedzi na pytanie nurtujące badacza, rozwiązanie konkretnego problemu, przewidzenie wartości pewnej ważnej z praktycznego punktu widzenia wartości. Zazwyczaj mniej ważne jest sformułowanie ogólnego wniosku czy reguły. W data mining model oceniamy na podstawie trafności jego przewidywań. Jednak podczas dopasowywania parametrów modelu (który to proces nazywamy uczeniem) może wystąpić ten sam błąd, który zdarza się popełnić ludziom, tzn. algorytm nauczy się na pamięć rozwiązywania zadań przedstawionych w czasie uczenia. Nauczony na pamięć model świetnie przewiduje wartości, które i tak znamy, ale całkowicie zawodzi dla nowych przypadków czyli jest zupełnie bezużyteczny. Takie zjawisko nazywamy przeuczeniem i aby go uniknąć dzielimy dane na co najmniej dwie próby: uczącą: te dane pokazujemy algorytmowi na etapie tworzenia modelu, Copyright StatSoft Polska,
2 testową: dla tych danych wyłącznie stosujemy uzyskany model i oceniamy jego przydatność. W data mining bardzo często stosujemy metody uczące się, dla których nie określamy z góry postaci zależności (np. że średnia wartość zapotrzebowania na energię elektryczną rośnie liniowo albo wykładniczo), oczekujemy raczej, że algorytm znajdzie odpowiednią postać zależności. Dosyć często uzyskane w ten sposób modele są na tyle skomplikowane, iż nie umożliwiają łatwej interpretacji przez człowieka, i stosujemy je jak czarną skrzynkę: tzn. nie wnikamy w to, jak budowana jest prognoza, byleby tylko była trafna. W data mining stosuje się również tradycyjną statystykę, jednak zazwyczaj mniej restrykcyjnie sprawdza się założenia dotyczące tych metod, a uzyskane wyniki oceniamy raczej poprzez uzyskaną trafność przewidywań, a nie wyniki testów statystycznych modelu. Cel i zadania Naszym celem jest zbudowanie modelu przewidującego godzinowe zapotrzebowanie na energię elektryczną. Będziemy przewidywać zapotrzebowanie w poszczególnych godzinach na następną dobę. Przede wszystkim chcemy uzyskać trafne przewidywania (z małym błędem w próbie testowej) model nie musi być zrozumiały dla człowieka. Rys. 1. Fragment arkusza danych. Dysponujemy danymi z trzech miesięcy: listopada, grudnia i stycznia; łącznie mamy 2208 obserwacji. W pliku danych znajdują się następujące wielkości: Numer kolejny obserwacji zmienna Nr, Czas i data obserwacji: zmienne Miesiąc, DzMiesiąca (numer kolejny dnia miesiąca) oraz Godzina, 62 Copyright StatSoft Polska, 2007
3 Dzień tygodnia: zmienna DTS (jeśli dzień był świąteczny, to zmienna przyjmuje wartość Niedz./Św.), Informacja o pogodzie w ciągu dnia: zmienne Zachmurzenie i Temperatura (wartości zostały uśrednione po całej dobie), Zapotrzebowanie na energię elektryczną: zmienna Z. Ponadto w arkuszu danych umieszczono kolumnę Próba z informacją, czy obserwacja ma trafić do próby uczącej czy testowej. Próbę testową tworzą dwa ostatnie tygodnie obserwowanego okresu. Na rys. 1 widzimy fragment wejściowego arkusza danych. Możemy przyjąć, że dane są dobrej jakości, ponieważ większość z nich jest na bieżąco wykorzystywana w analizach i raportach, zbierana automatycznie (nie wpisywana z klawiatury) i są sprawdzane na etapie wpisywania do bazy danych. Niemniej jednak przeprowadzimy wstępną analizę danych: przede wszystkim w celu uzyskania ogólnego wglądu w zależności i reguły dotyczące zapotrzebowania na energię elektryczną, ale również aby wykryć ewentualne dziwne obserwacje. Wstępna analiza i przygotowanie danych Prognozowanie zazwyczaj zaczynamy od zobaczenia, jak zmienia się w czasie interesująca nas wielkość. Poniżej widzimy wykres liniowy przedstawiający zapotrzebowanie na energię elektryczną w kolejnych godzinach w badanym przez nas okresie Z Numer obserwacji Rys. 2. Wykres przebiegu godzinowego zapotrzebowania na energię elektryczną. Jak widać na wykresie (rys. 2), w przebiegu zapotrzebowania nie pojawiają się dziwne, gwałtowne skoki. Widzimy natomiast dosyć wyraźną okresowość (sezonowość). Nie ma Copyright StatSoft Polska,
4 wyraźnego trendu, natomiast wydaje się, że mniej więcej od 1/3 obserwacji nastąpił wzrost średniego zapotrzebowania na energię. Trend będziemy mogli łatwiej zauważyć, jeśli sporządzimy wykres przedstawiający dane zagregowane (opcja umożliwiająca tworzenie takich wykresów znajduje się w STATISTICA na karcie Więcej okna Wykresy liniowe 2W). Na rys. 3 poniżej widzimy, jak wygląda średnie zapotrzebowanie godzinowe w obrębie kolejnych dób Z Numer dnia Rys. 3. Wykres przebiegu godzinowego zapotrzebowania uśrednionego po całej dobie. Na wykresie wyraźniejsza jest okresowość, brak trendu i skok średniego zużycia, o których pisaliśmy powyżej. W prognozowaniu często wykorzystuje się zmienne opóźnione, tzn. przewidujemy wartość zmiennej na podstawie jej wcześniejszych obserwacji. Związek miedzy bieżącym zapotrzebowaniem a jego poprzednimi wartościami zbadamy za pomocą wykresu autokorelacji (rys. 4). W oczy rzuca się bardzo silny związek między bieżącym zapotrzebowaniem a jego wartością godzinę wcześniej: współczynnik korelacji tych wielkości wynosi 0,958. Tak duża wartość daje nadzieję, iż wykorzystanie w modelu obserwacji opóźnionej o 1 zaowocowałoby trafnymi przewidywaniami. Jednak nasze zadanie polega na przewidywaniu całej przyszłej doby i dlatego nie wykorzystamy zapotrzebowania z poprzedniej godziny w modelu. Zauważmy, że bardzo wyraźna jest również autokorelacja z zapotrzebowaniem z poprzedniej doby (obserwacja opóźniona o 24): współczynnik korelacji wynosi 0,762. Tę wielkość będziemy mogli wykorzystać w naszym modelu Copyright StatSoft Polska, 2007
5 Opóźn Kor. S.E 1 +,958, ,874, ,768, ,647, ,523, ,410, ,316, ,246, ,199, ,169, ,145, ,130, ,124, ,127, ,136, ,164, ,218, ,298, ,393, ,498, ,599, ,682, ,741, ,762, ,722, ,644, ,541, ,423, ,303, ,194, ,102, ,035, ,008, ,035, ,055, ,065, ,0-0,5 0,0 0,5 1,0 Rys. 4. Autokorelacja dla zapotrzebowania. Q p 2028, 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, , 0, E2 0, E2 0, E2 0, E2 0, E2 0, E2 0, E2 0, E2 0,000 0 Teraz zajmiemy się wpływem na zapotrzebowanie na energię elektryczną zmiennych, które są zapisane w wejściowym pliku danych i możemy je wykorzystać do przewidywania. Na wykresie ramka-wąsy przedstawionym na rys. 5 widzimy, jak kształtuje się zapotrzebowanie w poszczególnych godzinach. Zależność jest bardzo wyraźna i silna, a jej przebieg zgodny ze zdrowym rozsądkiem Z Średnia Średnia±Błąd std Średnia±1,96*Błąd std Godzina Rys. 5. Zapotrzebowanie w różnych godzinach. Copyright StatSoft Polska,
6 W pliku danych zapisana jest średnia temperatura dobowa, która powinna również wpływać na zapotrzebowanie na energię elektryczną. Wpływ temperatury na zapotrzebowanie pokazuje diagram korelacyjny na rys. 6. Jak widać, im niższa temperatura, tym większe zapotrzebowanie na energię w okresie zimowym jest to jak najbardziej rozsądny wynik. Na wykresie naniesione jest równanie regresji liniowej zapotrzebowania w funkcji temperatury: możemy je zinterpretować tak, że spadek temperatury o jeden stopień powoduje średnie zwiększenie zapotrzebowania o około 3 jednostki, jest to mniej więcej 1% średniej wartości zapotrzebowania na energię. Z Temperatura:Z: r = -0,3414; p = 00,0000 Z = 362,0274-2,9271*x Temperatura Rys. 6. Zapotrzebowanie na energię a temperatura. Dane zawierają zmienną Zachmurzenie, wydaje się, że ta wielkość powinna wpływać na zapotrzebowanie na energię elektryczną. Moglibyśmy przeanalizować ten wpływ podobnie jak wpływ temperatury. Przy tworzeniu wykresu spotka nas przykra niespodzianka: otóż Zachmurzenie przyjmuje wyłącznie jedną wartość: B/D i na nic nam się nie przyda. Budowa modelu w przestrzeni roboczej STATISTICA Data Miner Po wstępnej analizie danych przechodzimy do budowy w przestrzeni roboczej STATISTICA Data Miner modelu przewidującego zapotrzebowanie na energię elektryczną. Z menu Data Mining wybieramy pozycję Przestrzenie robocze Modelowanie i eksploracja wielowymiarowa Podręczny projekt dla modeli liniowych. Na ekranie pojawi się przestrzeń robocza przedstawiona na rys. 7. W przestrzeni roboczej model i sposób jego stosowania dla nowych danych określamy jako schemat (graf) przepływu danych. Dzięki temu mamy przejrzystą prezentację operacji wykonywanych w celu uzyskania modelu, możemy łatwo aktualizować modele i wprowadzać do nich zmiany Copyright StatSoft Polska, 2007
7 Rys. 7. Przestrzeń robocza Podręczny projekt dla modeli liniowych. Pierwszym krokiem określania modelu jest wskazanie źródła danych: w tym celu klikamy przycisk Źródło danych na pasku narzędzi przestrzeni roboczej (zob. rys. 7) i wskazujemy plik z danymi o zapotrzebowaniu na energię (Prognozowanie.sta). Po wskazaniu źródła danych program wyświetla okno Wybierz zmienne zależne i predyktory, w którym określamy typy zmiennych wykorzystywanych w analizie. W naszym przypadku Z będzie zależną zmienną ilościową, Temperatura predyktorem ilościowym, a Godzina, DTS oraz Zachmurzenie predyktorami jakościowymi. Rys. 8. Wybór zmiennych. W zbiorze danych mamy zmienną Próba, rozróżniającą próby: uczącą i testową. Aby wykonać podział na próby według wartości tej zmiennej (zamiast domyślnego losowego podziału), przechodzimy na kartę Więcej, i w grupie Identyfikacja próby uczącej/testowej klikamy przycisk Zmienna kodująca i wybieramy zmienną Próba jako identyfikator próby, po czym jako kod danych uczących wskazujemy u, a testowych t. Ustawienia na obu kartach okna Wybierz zmienne zależne i predyktory widzimy na rys. 8. Copyright StatSoft Polska,
8 Jak wspomnieliśmy wcześniej, zmienna Zachmurzenie jest stała i na nic nam się nie przyda. Moglibyśmy po prostu jej nie wybierać do analizy, ale postąpimy inaczej, tak aby zabezpieczyć się przed wystąpieniem takiego problemu dla innych zmiennych w przyszłości. Do eliminacji zmiennych, które przyjmują tylko jedną wartość, zastosujemy węzeł Usuń stałe zmienne z foldera Czyszczenie danych przeglądarki węzłów. Do przestrzeni roboczej węzeł Usuń stałe zmienne wstawiamy, klikając przycisk Przeglądarka węzłów na pasku narzędzi przestrzeni roboczej (zob. rys. 7), przechodząc do odpowiedniego foldera i dwukrotnie klikając węzeł analogicznie jak w eksploratorze Windows. W celu wykonania operacji klikamy przycisk Uruchom lub naciskamy klawisz F5. Po zakończeniu przetwarzania w przestrzeni roboczej pojawi się nowe źródło danych, już bez stałej zmiennej (zawartość źródła danych możemy podejrzeć poleceniem Pokaż dokument z menu Węzły). Wynik wykonania projektu data mining pokazano na rys. 9. Rys. 9. Przestrzeń robocza po uruchomieniu węzła usuwającego stałe zmienne i wynikowy arkusz danych. Do prognozowania chcemy wykorzystać zmienną, której nie ma w pliku wejściowym: wartość zapotrzebowania z poprzedniego dnia. Użyjemy do tego celu węzła Przekształcenia zmiennych (z foldera Przekształcenia danych), obliczającego nowe wartości zmiennej na podstawie wzoru podanego przez użytkownika. Po wstawieniu tego węzła do przestrzeni roboczej klikamy go dwukrotnie, po czym w oknie Edytuj parametry naciskamy przycisk Edytuj i podajemy formułę tak jak na rys. 10. W formule korzystamy ze standardowej funkcji arkusza Lag(x,op), zwracającej wartość x sprzed op obserwacji. Po lewej stronie znaku równości wpisaliśmy zmienną Z_wczoraj, której do tej pory nie było w arkuszu w takim przypadku program doda nową zmienną o tej nazwie do arkusza i obliczy jej wartości według podanego wzoru Copyright StatSoft Polska, 2007
9 Po dodaniu nowej zmiennej do arkusza powinniśmy uwzględnić ją na liście predyktorów. W tym celu dwukrotnie klikamy nowe źródło danych, a potem w oknie Wybierz zmienne zależne i predyktory klikamy przycisk Zmienne i dołączamy zmienną Z_wczoraj do listy predyktorów ilościowych (np. klikając jej nazwę na tej liście przy wciśniętym klawiszu Ctrl). Rys. 10. Określanie wzoru dla obliczenia zmiennej z wczorajszym zapotrzebowaniem na energię. Po dokonaniu wyboru zmiennych łączymy strzałką wynikowe źródło danych z węzłem dzielącym dane na część uczącą i testową. Rys. 11. Przestrzeń robocza po wstawieniu węzłów analitycznych. Copyright StatSoft Polska,
10 W zastosowanym przez nas szablonie projektu znajduje się jeden węzeł budujący model. Węzeł ten wykorzystuje uogólniona regresję liniową. Oprócz tego węzła do przestrzeni roboczej wstawimy węzły stosujące dwie techniki typowe dla data mining: wzmacniane drzewa regresyjne (ang. boosted regression trees) oraz metodę wektorów nośnych (wspierających, ang. support vector machines). Finalny projekt data mining przedstawiony jest na rys. 11. Obie te metody umożliwiają modelowanie bardzo złożonych, nieliniowych zależności i są oceniane jako jedne z najsilniejszych technik data mining. Opis wzmacnianych drzew regresyjnych i metody wektorów nośnych znajduje się w podręcznikach [3] i [4]. Aby użyć tych metod, do przestrzeni roboczej wstawiamy węzły Wzmacniane drzewa regresyjne z wdrożeniem i Metoda wektorów wspierających z wdrożeniem (regresja). Warto zauważyć jedną ważną zaletę tworzenia projektów w przestrzeni roboczej. Otóż jeśli pojawią się nowe dane (np. za kolejny miesiąc), to wystarczy je podpiąć do projektu i reszta wykona się automatycznie. Przed uruchomieniem projektu zmienimy jeszcze ustawienia węzła regresji: otóż dla uzyskania dobrego modelu, bez zbędnych zmiennych, dobrze jest włączyć automatyczny dobór zmiennych. Zastosujemy metodę krokową postępującą: polega ona na tym, że zaczynamy od modelu zawierającego wyłącznie stałą (wyraz wolny), następnie wstawiamy do modelu najsilniejszy predyktor (tzn. taki, dla którego poziom p 1 jest najmniejszy) i tak dalej, aż do osiągnięcia takiej sytuacji, że dla każdego dostępnego predyktora poziom p jest większy od wartości progowej (zazwyczaj 0,05). Rys. 12. Ustawienia dla węzła wykonującego regresję. 1 W modelach regresyjnych poziom p dla zmiennej jest obliczamy jako prawdopodobieństwo tego, że współczynnik dla danej zmiennej w równaniu regresji przyjmie obserwowaną lub większą wartość, gdy w rzeczywistości (mówiąc bardziej ściśle w populacji generalnej) współczynnik ten jest równy zeru Copyright StatSoft Polska, 2007
11 W celu włączenia automatycznego doboru zmiennych dwukrotnie klikamy węzeł Ogólna regresja krokowa i najlepszego podzbioru z wdrożeniem i w oknie jego parametrów na liście Metoda budowy modelu wybieramy Krokowa postępująca, tak jak na rys. 12. Po uruchomieniu projektu program znajdzie model trzema wybranymi przez nas metodami. Uzyskane modele zostaną zastosowane dla danych z próby testowej, a w przestrzeni roboczej pojawią się dla każdego modelu: nowe źródło danych z wynikami stosowania modelu oraz węzeł ze skoroszytem podsumowującym proces budowy modelu (w części Raporty). Przestrzeń roboczą po wykonaniu modeli przedstawia rys. 13. Rys. 13. Przestrzeń robocza po uruchomieniu węzłów analitycznych. Po uzyskaniu modeli należy ocenić trafność ich przewidywań. Do tego celu użyjemy węzła Dobroć dopasowania (znajduje się on w przeglądarce węzłów w folderze Data mining Dobroć dopasowania). Podłączamy ten węzeł do każdego ze źródeł danych powstałych w wyniku stosowania modeli dla danych testowych. Wcześniej wybieramy zmienne dla tych źródeł: jako zmienną zależną ilościową wskazujemy obserwowane wartości (Z), a jako predyktor wartości przewidywanej (zmienne te noszą nazwę tworzoną z identyfikatora metody i przyrostka Przew). W tabeli poniżej zestawiono miary jakości dopasowania dla stosowanych przez nas metod. Miara Metoda Regresja Wzmacniane drzewa regresyjne Wektory wspierające Średnia kwadratów reszt Średni błąd bezwzględny 14,9 15,9 14,8 Względne odchylenie przeciętne 0,0417 0,0445 0,0411 Copyright StatSoft Polska,
12 Najlepsze wskaźniki ma metoda wektorów wspierających, aczkolwiek zwykła regresja daje przewidywania porównywalnej jakości. Dla obu tych metod przeciętnie mylimy się o około 4%. Pomimo uzyskiwania lepszych wyników metodą wektorów wspierających, w praktyce być może lepiej byłoby zastosować regresję, ze względu na jej prostotę, łatwość wdrożenia i możliwości interpretacji wyników. Możemy jeszcze spróbować poeksperymentować z parametrami analiz, aby uzyskać lepsze modele. W przypadku wektorów wspierających (nośnych) warto spróbować zmienić wykorzystywane jądro i parametry modelu Pojemność, Epsilon i Ni (na karcie SVM parametrów węzła). Pamiętajmy, że nie musimy dokładnie wiedzieć, co oznaczają te parametry: wystarczy metodą prób i błędów sprawdzić, czy ich zmiana poprawia uzyskiwane prognozy. W naszym przypadku pozytywny efekt daje zastosowanie jądra wielomianowego zamiast domyślnego RBF: uzyskujemy średnią kwadratów reszt 348 zamiast 365. W przypadku wzmacnianych drzew regresyjnych zazwyczaj najlepsze wyniki dają ustawienia domyślne. Czasami jednak model polepsza się, gdy zwiększymy parametr Maksymalna liczba węzłów tak jest właśnie w naszym przypadku. Domyślnie Maksymalna liczba węzłów wynosi 3, jeżeli zwiększymy ją do 7, to uzyskamy zauważalną poprawę trafności przewidywań, na tyle dużą, że wzmacniane drzewa wyprzedzą wektory nośne. W poniższej tabeli mamy zestawienie miar jakości przewidywań po wprowadzeniu zmian. Miara Metoda Regresja Wzmacniane drzewa regresyjne Wektory wspierające Średnia kwadratów reszt Średni błąd bezwzględny 14,9 13,7 14,6 Względne odchylenie przeciętne 0,0417 0,0382 0,04058 Po statystycznej ocenie modeli, należy ocenić je pod kątem ich planowanego zastosowania. W zależności do tego, jaki jest nasz cel, może się okazać, że względne odchylenie przeciętne na poziomie 3,8% jest świetnym wynikiem, albo nie do przyjęcia to już zależy od praktycznych uwarunkowań. Jeśli uznamy, że model jest odpowiedni, to zazwyczaj będziemy stosować go dla nowych danych. Możemy wyznaczać przewidywane wartości w przestrzeni roboczej STATISTICA Data Miner: w tym celu wystarczy podpiąć nowe dane do węzła Przewidywania wszystkich modeli (regresja) i uruchomić projekt. Inny sposób to zapisanie formuły modelu w postaci kodu C lub XML (mówiąc dokładniej specjalnego dialektu XML o nazwie PMML przeznaczonego do stosowania modeli data mining) i stosowanie go we własnych programach. Ponadto to w skład systemu STATISTICA Data Miner wchodzi specjalne narzędzie do zapisywania przewidywanych wartości w bazach danych Copyright StatSoft Polska, 2007
13 Literatura 1. Dittman P., Prognozowanie w przedsiębiorstwie. 2004, Kraków, Oficyna Ekonomiczna. 2. Berry M. J. A., Linoff G., Data mining techniques: for marketing, sales, and customer support 1997, John Willey & Sons. 3. Koronacki J., Ćwik J., Statystyczne systemy uczące się, 2005, Wydawnictwo Naukowo- Techniczne. 4. Hastie T., Tibshirani R., Friedman J., The Elements of Statistical Learning, 2002, Springer-Verlag. Copyright StatSoft Polska,
TWORZENIE I STOSOWANIE MODELU PROGNOSTYCZNEGO Z WYKORZYSTANIEM STATISTICA ENTERPRISE
TWORZENIE I STOSOWANIE MODELU PROGNOSTYCZNEGO Z WYKORZYSTANIEM STATISTICA ENTERPRISE Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Badanie przebiegu rozmaitych wielkości w czasie w celu znalezienia
TWORZENIE I STOSOWANIE MODELU DATA MINING ZA POMOCĄ PRZEPISÓW STATISTICA DATA MINER NA PRZYKŁADZIE WYKRYWANIA NADUŻYĆ
TWORZENIE I STOSOWANIE MODELU DATA MINING ZA POMOCĄ PRZEPISÓW STATISTICA DATA MINER NA PRZYKŁADZIE WYKRYWANIA NADUŻYĆ Tomasz Demski, StatSoft Polska Sp. z o.o. Narzędzia zgłębiania danych (data mining)
PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN
PRZEWIDYWANIE WŁAŚCIWOŚCI PRODUKTU Z WYKORZYSTANIEM UCZENIA MASZYN Tomasz Demski, StatSoft Polska Sp. z o.o. Przewidywanie właściwości produktu na podstawie składu surowcowego oraz parametrów przebiegu
PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING
PROGNOZOWANIE Z WYKORZYSTANIEM METOD DATA MINING Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Jednym z ważnych obszarów analizy danych jest prognozowanie szeregów czasowych. Któż nie chciałby znać przyszłości
DATA MINING W STEROWANIU PROCESEM (QC DATA MINING)
DATA MINING W STEROWANIU PROCESEM (QC DATA MINING) Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Sterowanie i optymalizacja jakości to dziedziny, w których zastosowanie zgłębiania danych (data
( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Dopasowywanie modelu do danych
Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;
Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.
ANALIZA SKUPIEŃ Metoda k-means I. Cel zadania Zadaniem jest analiza zbioru danych, gdzie zmiennymi są poziomy ekspresji genów. Podczas badań pobrano próbki DNA od 36 różnych pacjentów z chorobą nowotworową.
LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU
LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny
Analiza sezonowości Wiele zjawisk charakteryzuje się nie tylko trendem i wahaniami przypadkowymi, lecz także pewną sezonowością. Występowanie wahań sezonowych może mieć charakter kwartalny, miesięczny,
5. Model sezonowości i autoregresji zmiennej prognozowanej
5. Model sezonowości i autoregresji zmiennej prognozowanej 1. Model Sezonowości kwartalnej i autoregresji zmiennej prognozowanej (rząd istotnej autokorelacji K = 1) Szacowana postać: y = c Q + ρ y, t =
parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,
诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów
Co to jest arkusz kalkulacyjny?
Co to jest arkusz kalkulacyjny? Arkusz kalkulacyjny jest programem służącym do wykonywania obliczeń matematycznych. Za jego pomocą możemy również w czytelny sposób, wykonane obliczenia przedstawić w postaci
Arkusz kalkulacyjny EXCEL
ARKUSZ KALKULACYJNY EXCEL 1 Arkusz kalkulacyjny EXCEL Aby obrysować tabelę krawędziami należy: 1. Zaznaczyć komórki, które chcemy obrysować. 2. Kursor myszy ustawić na menu FORMAT i raz kliknąć lewym klawiszem
Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.
STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą
Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej
Regresja liniowa, współczynnik zmienności, współczynnik korelacji liniowej, współczynnik korelacji wielorakiej Paweł Cibis pawel@cibis.pl 23 lutego 2007 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa
PRZYKŁAD TWORZENIA KART KONTROLNYCH W STATISTICA
PRZYKŁAD TWORZENIA KART KONTROLNYCH W STATISTICA Tomasz Demski, StatSoft Polska Sp. z o.o. Karty kontrolne są jednym z najczęściej wykorzystywanych narzędzi analizy danych. Zaproponowane w latach dwudziestych
Regresja linearyzowalna
1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:
PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK
1 PROGNOZOWANIE I SYMULACJE 2 http://www.outcome-seo.pl/excel1.xls DODATEK SOLVER WERSJE EXCELA 5.0, 95, 97, 2000, 2002/XP i 2003. 3 Dodatek Solver jest dostępny w menu Narzędzia. Jeżeli Solver nie jest
Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt
Przed rozpoczęciem pracy otwórz nowy plik (Ctrl +N) wykorzystując szablon acadiso.dwt Zadanie: Utwórz szablon rysunkowy składający się z: - warstw - tabelki rysunkowej w postaci bloku (według wzoru poniżej)
PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA
PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA Krzysztof Suwada, StatSoft Polska Sp. z o.o. Wstęp Wiele różnych analiz dotyczy danych opisujących wielkości charakterystyczne bądź silnie
ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL. sin x2 (1)
ROZWIĄZYWANIE UKŁADÓW RÓWNAŃ NIELINIOWYCH PRZY POMOCY DODATKU SOLVER PROGRAMU MICROSOFT EXCEL 1. Problem Rozważmy układ dwóch równań z dwiema niewiadomymi (x 1, x 2 ): 1 x1 sin x2 x2 cos x1 (1) Nie jest
PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU
PROGNOZOWANIE SPRZEDAŻY STUDIUM PRZYPADKU prof. dr hab. Andrzej Sokołowski 2 W tym opracowaniu przedstawiony zostanie przebieg procesu poszukiwania modelu prognostycznego wykorzystującego jedynie przeszłe
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Rys.1. Technika zestawiania części za pomocą polecenia WSTAWIAJĄCE (insert)
Procesy i techniki produkcyjne Wydział Mechaniczny Ćwiczenie 3 (2) CAD/CAM Zasady budowy bibliotek parametrycznych Cel ćwiczenia: Celem tego zestawu ćwiczeń 3.1, 3.2 jest opanowanie techniki budowy i wykorzystania
TWORZENIE I ZARZĄDZANIE MODELAMI PROGNOSTYCZNYMI W STATISTICA ENTERPRISE
TWORZENIE I ZARZĄDZANIE MODELAMI PROGNOSTYCZNYMI W STATISTICA ENTERPRISE Tomasz Demski, StatSoft Polska Sp. z o.o. W bardzo wielu dziedzinach stajemy przed wyzwaniem przewidzenia przyszłości, innymi słowy
STATISTICA DATA MINER I STATISTICA ENTERPRISE SPOSÓB NA SZYBKĄ BUDOWĘ I WDRAŻANIE MODELI
STATISTICA DATA MINER I STATISTICA ENTERPRISE SPOSÓB NA SZYBKĄ BUDOWĘ I WDRAŻANIE MODELI Grzegorz Migut, StatSoft Polska Sp. z o.o. Modelowanie statystyczne staje się obecnie nieodzownym elementem wsparcia
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
Indeksy dynamiki (o stałej i zmiennej podstawie)
Indeksy dynamiki (o stałej i zmiennej podstawie) Proste indeksy dynamiki określają tempo zmian pojedynczego szeregu czasowego. Wyodrębnia się dwa podstawowe typy indeksów: indeksy o stałej podstawie; indeksy
Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Tworzenie, zapisywanie oraz otwieranie pliku... 23
Spis treści Szybki start... 4 Podstawowe informacje opis okien... 6 Plik... 7 Okna... 8 Aktywny scenariusz... 9 Oblicz scenariusz... 10 Lista zmiennych... 11 Wartości zmiennych... 12 Lista scenariuszy/lista
7.4 Automatyczne stawianie prognoz
szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu
Przewodnik dla każdego po: Dla każdego coś miłego Microsoft Excel 2010
Przewodnik dla każdego po: Dla każdego coś miłego Microsoft Excel 2010 Czym jest Excel 2010 Excel jest programem umożliwiającym tworzenie tabel, a także obliczanie i analizowanie danych. Należy do typu
Temat: Organizacja skoroszytów i arkuszy
Temat: Organizacja skoroszytów i arkuszy Podstawowe informacje o skoroszycie Excel jest najczęściej wykorzystywany do tworzenia skoroszytów. Skoroszyt jest zbiorem informacji, które są przechowywane w
Edytor tekstu OpenOffice Writer Podstawy
Edytor tekstu OpenOffice Writer Podstawy Cz. 5. Tabulatory i inne funkcje edytora OpenOffice Writer Tabulatory umożliwiają wyrównanie tekstu do lewej, do prawej, do środka, do znaku dziesiętnego lub do
PROGNOZOWANIE Z WYKORZYSTANIEM UCZENIA MASZYN
PROGNOZOWANIE Z WYKORZYSTANIEM UCZENIA MASZYN Któż z nas nie chciałby trafnie przewidywać przyszłości? Potrzeba przewidywania występuje nieomal wszędzie: w życiu codziennym, gdy np. chcemy zaplanować najlepszy
I Tworzenie prezentacji za pomocą szablonu w programie Power-Point. 1. Wybieramy z górnego menu polecenie Nowy a następnie Utwórz z szablonu
I Tworzenie prezentacji za pomocą szablonu w programie Power-Point 1. Wybieramy z górnego menu polecenie Nowy a następnie Utwórz z szablonu 2. Po wybraniu szablonu ukaŝe się nam ekran jak poniŝej 3. Następnie
Ćwiczenie 12. Metody eksploracji danych
Ćwiczenie 12. Metody eksploracji danych Modelowanie regresji (Regression modeling) 1. Zadanie regresji Modelowanie regresji jest metodą szacowania wartości ciągłej zmiennej celu. Do najczęściej stosowanych
Jedną z ciekawych funkcjonalności NOLa jest możliwość dokonywania analizy technicznej na wykresach, które mogą być otwierane z poziomu okna notowań:
Wykresy w NOLu Jedną z ciekawych funkcjonalności NOLa jest możliwość dokonywania analizy technicznej na wykresach, które mogą być otwierane z poziomu okna notowań: Po naciśnięciu F2 otwiera się nowe okno,
Obliczanie wartości średniej i odchylenia standardowego średniej w programie Origin
Obliczanie wartości średniej i odchylenia standardowego średniej w programie Origin Po uruchomieniu programu pojawia się arkusz kalkulacyjny Data1, do którego (w dowolnej kolumnie) wpisujemy wyniki pomiarów
Rozdział 8. Regresja. Definiowanie modelu
Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność
Przenoszenie, kopiowanie formuł
Przenoszenie, kopiowanie formuł Jeżeli będziemy kopiowali komórki wypełnione tekstem lub liczbami możemy wykorzystywać tradycyjny sposób kopiowania lub przenoszenia zawartości w inne miejsce. Jednak przy
Usługi Informatyczne "SZANSA" - Gabriela Ciszyńska-Matuszek ul. Świerkowa 25, Bielsko-Biała
Usługi Informatyczne "SZANSA" - Gabriela Ciszyńska-Matuszek ul. Świerkowa 25, 43-305 Bielsko-Biała NIP 937-22-97-52 tel. +48 33 488 89 39 zwcad@zwcad.pl www.zwcad.pl Aplikacja do rysowania wykresów i oznaczania
Wprowadzenie do analizy dyskryminacyjnej
Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela
INSTRUKCJA OBSŁUGI PROGRAMU LOGGER PRO
CENTRUM NAUCZANIA MATEMATYKI I FIZYKI 1 LABORATORIUM FIZYKI INSTRUKCJA OBSŁUGI PROGRAMU LOGGER PRO 1. Wprowadzanie danych. 2. Dokonywanie obliczeń zestawionych w kolumnach. 3. Tworzenie wykresu. 4. Dopasowanie
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
Wprowadzenie do MS Excel
Wprowadzenie do MS Excel Czym jest Excel? Excel jest programem umożliwiającym tworzenie tabel, a także obliczanie i analizowanie danych. Należy do typu programów nazywanych arkuszami kalkulacyjnymi. W
Dodatek Solver Teoria Dodatek Solver jest częścią zestawu poleceń czasami zwaną narzędziami analizy typu co-jśli (analiza typu co, jeśli?
Dodatek Solver Teoria Dodatek Solver jest częścią zestawu poleceń czasami zwaną narzędziami analizy typu co-jśli (analiza typu co, jeśli? : Proces zmieniania wartości w komórkach w celu sprawdzenia, jak
Zagadnienia: Program ten umożliwi Tobie między innymi: tworzenie arkuszy kalkulacyjnych wyszukiwanie i analizę danych tworzenie wykresów (diagramów)
Rozdział 5: Zagadnienia: Tworzenie arkuszy kalkulacyjnych 1. Wprowadzanie i formatowanie danych 2. Praktyczne wykorzystanie możliwości Microsoft Office Excel 3. Podstawowe opcje Microsoft Office Excel
Wprowadzenie do teorii prognozowania
Wprowadzenie do teorii prognozowania I Pojęcia: 1. Prognoza i zmienna prognozowana (przedmiot prognozy). Prognoza punktowa i przedziałowa. 2. Okres prognozy i horyzont prognozy. Prognozy krótkoterminowe
SPIS ILUSTRACJI, BIBLIOGRAFIA
SPIS ILUSTRACJI, BIBLIOGRAFIA Ćwiczenie 1 Automatyczne tworzenie spisu ilustracji 1. Wstaw do tekstu roboczego kilka rysunków (WSTAWIANIE OBRAZ z pliku). 2. Ustaw kursor w wersie pod zdjęciem i kliknij
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji
Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1
Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1
Wyższa Szkoła Ekologii i Zarządzania Informatyka Arkusz kalkulacyjny 2010 dla WINDOWS cz. 1 Slajd 1 Slajd 2 Ogólne informacje Arkusz kalkulacyjny podstawowe narzędzie pracy menadżera Arkusz kalkulacyjny
4.Arkusz kalkulacyjny Calc
4.Arkusz kalkulacyjny Calc 4.1. Okno programu Calc Arkusz kalkulacyjny Calc jest zawarty w bezpłatnym pakiecie OpenOffice.org 2.4. Można go uruchomić, podobnie jak inne aplikacje tego środowiska, wybierając
Metody statystyczne kontroli jakości i niezawodności Lekcja II: Karty kontrolne.
Metody statystyczne kontroli jakości i niezawodności Lekcja II: Karty kontrolne. Wydział Matematyki Politechniki Wrocławskiej Karty kontroli jakości: przypomnienie Załóżmy, że chcemy mierzyć pewną charakterystykę.
PRZYKŁAD WDROŻENIA KART KONTROLNYCH KROK PO KROKU
PRZYKŁAD WDROŻENIA KART KONTROLNYCH KROK PO KROKU Tomasz Demski, StatSoft Polska Sp. z o.o. Przykład przedstawia tworzenie karty kontrolnej p dla nowego procesu, określanie wartości granic kontrolnych
Tworzenie prezentacji w MS PowerPoint
Tworzenie prezentacji w MS PowerPoint Program PowerPoint dostarczany jest w pakiecie Office i daje nam możliwość stworzenia prezentacji oraz uatrakcyjnienia materiału, który chcemy przedstawić. Prezentacje
Mathcad c.d. - Macierze, wykresy 3D, rozwiązywanie równań, pochodne i całki, animacje
Mathcad c.d. - Macierze, wykresy 3D, rozwiązywanie równań, pochodne i całki, animacje Opracował: Zbigniew Rudnicki Powtórka z poprzedniego wykładu 2 1 Dokument, regiony, klawisze: Dokument Mathcada realizuje
Trik 1 Mniejszy rozmiar skoroszytu dzięki kompresji grafiki
:: Trik 1. Mniejszy rozmiar skoroszytu dzięki kompresji grafiki :: Trik 2. Hurtowe odkrywanie wierszy lub kolumn :: Trik 3. Kwoty mniejsze od średniej oznaczone kolorem :: Trik 4. Wygodne porównywanie
Prezentacja multimedialna MS PowerPoint 2010 (podstawy)
Prezentacja multimedialna MS PowerPoint 2010 (podstawy) Cz. 1. Tworzenie slajdów MS PowerPoint 2010 to najnowsza wersja popularnego programu do tworzenia prezentacji multimedialnych. Wygląd programu w
Instrukcja szybkiej obsługi
Instrukcja szybkiej obsługi Uwaga!!! Dla prawidłowego działania wymagany jest program Excel 2003 lub nowszy. Program należy ściągnąć ze strony internetowej i zapisać na dysku twardym. Wyjście z programu
Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1
Wyższa Szkoła Ekologii i Zarządzania Informatyka Arkusz kalkulacyjny Excel 2010 dla WINDOWS cz. 1 Slajd 1 Excel Slajd 2 Ogólne informacje Arkusz kalkulacyjny podstawowe narzędzie pracy menadżera Arkusz
Excel zadania sprawdzające 263
Excel zadania sprawdzające 263 Przykładowe zadania do samodzielnego rozwiązania Zadanie 1 Wpisać dane i wykonać odpowiednie obliczenia. Wykorzystać wbudowane funkcje Excela: SUMA oraz ŚREDNIA. Sformatować
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Spis treści. Laboratorium III: Testy statystyczne. Inżynieria biomedyczna, I rok, semestr letni 2013/2014 Analiza danych pomiarowych
1 Laboratorium III: Testy statystyczne Spis treści Laboratorium III: Testy statystyczne... 1 Wiadomości ogólne... 2 1. Krótkie przypomnienie wiadomości na temat testów statystycznych... 2 1.1. Weryfikacja
Statystyka. Wykład 9. Magdalena Alama-Bućko. 24 kwietnia Magdalena Alama-Bućko Statystyka 24 kwietnia / 34
Statystyka Wykład 9 Magdalena Alama-Bućko 24 kwietnia 2017 Magdalena Alama-Bućko Statystyka 24 kwietnia 2017 1 / 34 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Celem ćwiczenia jest zapoznanie się z podstawowymi funkcjami i pojęciami związanymi ze środowiskiem AutoCAD 2012 w polskiej wersji językowej.
W przygotowaniu ćwiczeń wykorzystano m.in. następujące materiały: 1. Program AutoCAD 2012. 2. Graf J.: AutoCAD 14PL Ćwiczenia. Mikom 1998. 3. Kłosowski P., Grabowska A.: Obsługa programu AutoCAD 14 i 2000.
znajdowały się różne instrukcje) to tak naprawdę definicja funkcji main.
Część XVI C++ Funkcje Jeśli nasz program rozrósł się już do kilkudziesięciu linijek, warto pomyśleć o jego podziale na mniejsze części. Poznajmy więc funkcje. Szybko się przekonamy, że funkcja to bardzo
BIBLIOTEKA LOKALNE CENTRUM WIEDZY PRAKTYCZNEJ PRZEWODNIK PO NARZĘDZIACH WARSZTAT NR 1: ARKUSZE KALKULACYJNE - MINI SKRYPT
BIBLIOTEKA LOKALNE CENTRUM WIEDZY PRAKTYCZNEJ PRZEWODNIK PO NARZĘDZIACH WARSZTAT NR 1: ARKUSZE KALKULACYJNE - MINI SKRYPT 1. Wprowadzenie Arkusze kalkulacyjne Google umożliwiają łatwe tworzenie, udostępnianie
JAK PROSTO I SKUTECZNIE WYKORZYSTAĆ ARKUSZ KALKULACYJNY DO OBLICZENIA PARAMETRÓW PROSTEJ METODĄ NAJMNIEJSZYCH KWADRATÓW
JAK PROSTO I SKUTECZNIE WYKORZYSTAĆ ARKUSZ KALKULACYJNY DO OBLICZENIA PARAMETRÓW PROSTEJ METODĄ NAJMNIEJSZYCH KWADRATÓW Z tego dokumentu dowiesz się jak wykorzystać wbudowane funkcje arkusza kalkulacyjnego
ZASTOSOWANIE TECHNIK DATA MINING W BADANIACH NAUKOWYCH
ZASTOSOWANIE TECHNIK DATA MINING W BADANIACH NAUKOWYCH Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Zakres zastosowań analizy danych w różnych dziedzinach badań naukowych stale się poszerza. Wynika to
Informatyka dla klas I wykresy funkcji
2013 mgr Jerzy Wałaszek I LO w Tarnowie Informatyka dla klas I wykresy funkcji Prezentowane materiały są przeznaczone dla uczniów szkół ponadgimnazjalnych. Autor artykułu: mgr Jerzy Wałaszek, wersja1.0
Nawigacja po długim dokumencie może być męcząca, dlatego warto poznać następujące skróty klawiszowe
Zestawienie wydatków rok 2015 1 Wstaw numerację stron. Aby to zrobić przejdź na zakładkę Wstawianie i w grupie Nagłówek i stopka wybierz Numer strony. Następnie określ pozycję numeru na stronie (na przykład
Operacje na Wielu Arkuszach
Operacje na Wielu Arkuszach 1. Operacje na wielu arkuszach na raz. 2. Przenoszenie i kopiowanie arkuszy pomiędzy plikami. 3. Ukrywanie arkuszy. Przykład 1. Operacje na wielu arkuszach na raz. Często pracując
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
3. Modele tendencji czasowej w prognozowaniu
II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa
Analiza Statystyczna
Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza
Tworzenie dokumentacji 2D
Tworzenie dokumentacji 2D Tworzenie dokumentacji technicznej 2D dotyczy określonej części (detalu), uprzednio wykonanej w przestrzeni trójwymiarowej. Tworzenie rysunku 2D rozpoczynamy wybierając z menu
Sterowanie wielkością zamówienia w Excelu - cz. 3
Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji
Uruchom polecenie z menu Wstaw Wykres lub ikonę Kreator wykresów na Standardowym pasku narzędzi.
Tworzenie wykresów w Excelu. Część pierwsza. Kreator wykresów Wpisz do arkusza poniższą tabelę. Podczas tworzenia wykresów nie ma znaczenia czy tabela posiada obramowanie lub inne elementy formatowania
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania
Regresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
Analiza zależności liniowych
Narzędzie do ustalenia, które zmienne są ważne dla Inwestora Analiza zależności liniowych Identyfikuje siłę i kierunek powiązania pomiędzy zmiennymi Umożliwia wybór zmiennych wpływających na giełdę Ustala
Szybki start SAMOOCENA W NOR-STA
Szybki start SAMOOCENA W NOR-STA W kwadrans nauczysz się jak: oceniać zgodność ze standardem w NOR-STA przeglądać i prezentować wyniki ocen oraz generować raporty z dowolnymi wykresami i zestawieniami
Podręczna pomoc Microsoft Power Point 2007
Podręczna pomoc Microsoft Power Point 2007 Animacja (przejście) slajdu... 2 Wybór przejścia slajdu... 2 Ustawienie dźwięku dla przejścia... 3 Ustawienie szybkości przejścia slajdu... 4 Sposób przełączenia
ABC 2002/XP PL EXCEL. Autor: Edward C. Willett, Steve Cummings. Rozdział 1. Podstawy pracy z programem (9) Uruchamianie programu (9)
ABC 2002/XP PL EXCEL Autor: Edward C. Willett, Steve Cummings Rozdział 1. Podstawy pracy z programem (9) Uruchamianie programu (9) Obszar roboczy programu (10) o Pasek tytułowy (10) o Przyciski Minimalizuj
Ekonometria. Regresja liniowa, współczynnik zmienności, współczynnik korelacji, współczynnik korelacji wielorakiej. Paweł Cibis
Regresja liniowa, współczynnik zmienności, współczynnik korelacji, współczynnik korelacji wielorakiej Paweł Cibis pcibis@o2.pl 9 marca 2006 1 Regresja liniowa 2 wzory funkcje 3 Korelacja liniowa wzory
Współpraca Integry z programami zewnętrznymi
Współpraca Integry z programami zewnętrznymi Uwaga! Do współpracy Integry z programami zewnętrznymi potrzebne są dodatkowe pliki. MoŜna je pobrać z sekcji Download -> Pozostałe po zalogowaniu do Strefy
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9 Uruchamianie edytora OpenOffice.ux.pl Writer 9 Dostosowywanie środowiska pracy 11 Menu Widok 14 Ustawienia dokumentu 16 Rozdział 2. OpenOffice
PRZEWIDYWANIE LOJALNOŚCI KLIENTÓW
PRZEWIDWANIE LOJALNOŚCI KLIENTÓW Tomasz Demski StatSoft Polska Sp. z o.o. Wprowadzenie Podstawowe znaczenie terminu lojalność klienta oznacza jego skłonność do wielokrotnych zakupów u jednego dostawcy.
Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
Ćwiczenia nr 4. Arkusz kalkulacyjny i programy do obliczeń statystycznych
Ćwiczenia nr 4 Arkusz kalkulacyjny i programy do obliczeń statystycznych Arkusz kalkulacyjny składa się z komórek powstałych z przecięcia wierszy, oznaczających zwykle przypadki, z kolumnami, oznaczającymi
Szybki start SAMOOCENA W NOR-STA
Szybki start SAMOOCENA W NOR-STA W kwadrans nauczysz się jak: oceniać zgodność ze standardem w NOR-STA przeglądać i prezentować wyniki ocen oraz generować raporty z dowolnymi wykresami i zestawieniami
Zadanie 10. Stosowanie dokumentu głównego do organizowania dużych projektów
Zadanie 10. Stosowanie dokumentu głównego do organizowania dużych projektów Za pomocą edytora Word można pracować zespołowo nad jednym dużym projektem (dokumentem). Tworzy się wówczas dokument główny,
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM