FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1
|
|
- Sebastian Piotrowski
- 6 lat temu
- Przeglądów:
Transkrypt
1 Tomasz Bartłomowicz Uniwersytet Ekonomiczny we Wrocławiu FILTROWANIE ZBIORU OFERT NIERUCHOMOŚCI Z WYKORZYSTANIEM INFORMACJI O PREFERENCJACH 1 Streszczenie. Punktem wyjścia artykułu jest spostrzeżenie, iż internetowe strony udostępniające szczegóły ofert sprzedaży nieruchomości umożliwiają ich sortowanie oraz filtrowanie niemal wyłącznie ze względu na ceny nieruchomości. Stąd głównym założeniem prezentowanego opracowania jest udoskonalenie omawianego mechanizmu o możliwość filtrowania ofert nieruchomości ze względu na ich cechy (atrybuty), w tym przeważające w opisie nieruchomości atrybuty typowo jakościowe. W opracowaniu algorytm filtrowania opiera się na rozpoznaniu preferencji wyrażonych użytkowników nieruchomościowej strony internetowej oraz metodzie klasyfikacji w postaci metody k-nn. Ze względu na przedmiot badania (nieruchomości) w procesie klasyfikacji do wyznaczenia macierzy odległości wykorzystano uogólnioną miarę odległości GDM. Umożliwia to filtrowanie zbioru ofert nieruchomości z wykorzystaniem miary GDM oraz informacji o ich preferencjach. RETRIEVAL OF PROPERTIES OFFERS WITH INFORMATION ABOUT PREFERENCES Summary. The paper presents strengths and failures of data retrieval using on web pages with offers to sell some properties. The main idea of the article is that data on those pages is only retrieval by the price of properties. Therefore the paper presents some concept to refine that action. For classification some properties author proposes k-nearest neighbors method with Generalized Distance Measure (GDM). Author illustrates presented method on an empirical example. 1 Praca naukowa finansowana częściowo ze środków na działalność statutową Katedry Ekonometrii i Informatyki w roku 2010 oraz ze środków na naukę w latach jako projekt badawczy nr N N
2 1. Wprowadzenie Sortowanie i filtrowanie danych to jedne z podstawowych zagadnień informatyki, polegające w pierwszym przypadku na uporządkowaniu, w drugim na selekcji zbioru danych względem pewnych zmiennych (cech, atrybutów) charakterystycznych dla każdego z elementów tego zbioru 2. Czynności te, choć niedostrzegane, stanowią podstawową praktykę wszędzie tam, gdzie ilość prezentowanego materiału przekracza możliwości jego pełnego poznania. Przykładem mogą być tutaj oferty sprzedaży nieruchomości dostępne na internetowych stronach biur pośrednictwa w obrocie nieruchomościami. W artykule przedstawia się zalety i wady stosowanych rozwiązań w zakresie filtrowania internetowych ofert sprzedaży nieruchomości, a w świetle tych ostatnich dokonuje się próby udoskonalenia tego mechanizmu. Służyć temu ma wykorzystanie naukowej metody klasyfikacji, odpowiedniej miary podobieństwa oraz, w postaci prezentowanego przykładu, przekonanie co do możliwości połączenia powyższych w ramach mechanizmu filtrowania innego, niż ma to miejsce obecnie na stronie internetowej. 2. Definicja problemu W artykule punktem wyjścia jest spostrzeżenie, iż internetowe strony udostępniające oferty biur pośrednictwa w obrocie nieruchomościami umożliwiają sortowanie i filtrowanie zawartych tam informacji z punktu widzenia jednego lub co najwyżej kilku kryteriów. Najczęściej jest to cena nieruchomości, sporadycznie inne metryczne (ilościowe) cechy nieruchomości. Poza ceną można w tym miejscu dodatkowo wymienić powierzchnię działki, liczbę pokoi, piętrową lokalizację lokalu itp. W przypadku cech niemetrycznych (jakościowych) sortowanie, a w dalszej kolejności filtrowanie ofert nieruchomości zazwyczaj w ogóle nie jest przewidziane w mechanizmach strony internetowej. Oznacza to brak uwzględnienia w wyszukiwaniu nieruchomości m.in. takich zmiennych, jak: lokalizacja nieruchomości, uzbrojenie terenu, kształt działki, otoczenie środowiskowe nieruchomości, o bardziej specyficznych cechach nieruchomości nie wspominając. Ponadto należy zauważyć, iż nieruchomości to wyjątkowy i specyficzny przedmiot wymiany rynkowej. O ich specyfice przekonuje m.in. fakt braku nieruchomości identycznych, 2 Opis na podstawie internetowego słownika języka polskiego dostępnego pod adresem:
3 tj. charakteryzujących się kompletem takich samych atrybutów i ich poziomów. W przypadku rynku nieruchomości mówi się co najwyżej o nieruchomościach podobnych. Należy zatem zauważyć, iż deklaracja bardzo konkretnych kryteriów filtrowania ofert nieruchomości może w praktyce jako wynik filtrowania za każdym razem oznaczać co najwyżej pojedynczy jej wariant lub nawet brak jakichkolwiek wyników wyszukiwania. Do wad istniejących rozwiązań trzeba także dodać, iż deklaracja właściwych kryteriów wyszukiwania (reguł filtrowania) oznacza potrzebę dysponowania choćby minimalną wiedzą na temat filtrowanych obiektów nieruchomości i ich atrybutów. Dostępne na stronach internetowych mechanizmy sortowania i filtrowania ofert nieruchomości, z uwagi na przedmiot filtrowania, są co najmniej niewystarczające, a nawet co stanowi tezę niniejszego artykułu nieadekwatne do ich przedmiotu. W przekonaniu autora, głównie z racji przewagi wspomnianych cech jakościowych, dedykowane rozwiązania w postaci klasycznych mechanizmów filtrowania uszczuplają możliwości przeglądu stron internetowych z ofertami sprzedaży nieruchomości. Tym samym głównym celem artykułu jest prezentacja rozwiązania pozwalającego wyeliminować wymienione wady, a przynajmniej w wysokim stopniu je ograniczyć. 3. Proponowane rozwiązanie Rozwiązanie postawionego w artykule problemu polega na zaproponowaniu sposobu sortowania (filtrowania) ofert nieruchomości przy wykorzystaniu naukowej metody klasyfikacji i adekwatnej do przykładu miary podobieństwa. Warto w tym miejscu podkreślić, iż z uwagi na definiowaną przez użytkownika strony www liczebność zbioru przefiltrowanych ofert nieruchomości w rozwiązaniu zdecydowano się wykorzystać metodę klasyfikacji w postaci metody k-najbliższych sąsiadów (k-nn). W tej znanej i prostej metodzie, klasyfikacja polega na wyborze k obserwacji leżących najbliżej nieznanej obserwacji i przypisaniu jej do tej klasy, do której należy najwięcej spośród jej k sąsiadów (por. Tadeusiewicz, Lasiński, 1991, s ). W sposób graficzny działanie metody k-nn w ograniczeniu do dwóch atrybutów przedstawia rysunek 1. Obiekt ze znakiem zapytania reprezentuje obiekt klasyfikowany do pierwszej klasy klasy obiektów zakreskowanych lub drugiej klasy klasy obiektów zacieniowanych. W sytuacji gdy k = 1 obiekt jest klasyfikowany do pierwszej klasy z uwagi na najbliższą odległość obiektu zakreskowanego. W sytuacji gdy k = 3 obiekt jest klasyfikowany
4 do klasy drugiej ponieważ wewnątrz okręgu, zawierającego 3 najbliższe obserwacje, znajdują się 2 zacieniowane kółka i tylko 1 kółko zakreskowane 3. Atrybut 1 1NN? 3NN 2NN Atrybut 2 Rysunek 1. Graficzna prezentacja działania metody k-najbliższych sąsiadów Źródło: Opracowanie własne na podstawie dokumentu Classification: k Nearest Neighbours dostępnego pod adresem: Należy w tym miejscu zauważyć, iż definicja najbliższej obserwacji sprowadza się do minimalizacji pewnej metryki, mierzącej odległość między wektorami zmiennych dwóch obiektów. Choć znane są przypadki stosowania takich miar jak miejska czy Mahalanobisa, najczęściej stosowana jest w tym miejscu odległość euklidesowa (1): d E = m ( xil xkl ) l= 1 2 (1) gdzie: d E euklidesowa miara odległości, i = 1,, k numer obiektu, l = 1,, m numer zmiennej. 3 W sytuacji gdy zastosowanie metody k-nn ogranicza się do pomiaru odległości oraz wyboru najbliższych sąsiadów oznacza to klasyfikację obserwacji do k licznych klas. Ponadto metoda k-najbliższych sąsiadów umożliwia także prognozowanie.
5 Należy jednak pamiętać, iż z uwagi na przedmiot zainteresowania w postaci nieruchomości przewagę zmiennych opisujących klasyfikowane obiekty stanowią zmienne mierzone na skali porządkowej. W konsekwencji oznacza to potrzebę zastosowania miary adekwatnej do skali pomiaru, w tym przypadku uogólnionej miary odległości GDM (2) (por. Walesiak, 2003, s. 37; Gatnar, Walesiak, 2004, s. 355; Walesiak, 2006, s. 36): d GDM m 1 ikj kij j= 1 j= 1 l= 1 l i, k = 2 2 a b + m n m n 2 ailj j= 1 l= 1 j= 1 l= 1 m n a ilj b b 2 klj klj 1 2 (2) gdzie: d GDM uogólniona miara odległości GDM, i, k, l = 1,, n numer obiektu, j = 1,, m numer zmiennej. Jak podaje M. Walesiak, miarę [ ] można stosować w sytuacji, gdy w zbiorze są zmienne mierzone na skali porządkowej (por. Walesiak, 2002, s. 75). Co więcej, w literaturze z zakresu statystycznej analizy wielowymiarowej nie zaproponowano dotychczas innych miar odległości dla zmiennych porządkowych (por. Walesiak, 2002, s. 76). Sposób zastosowania uogólnionej miary odległości GDM oraz wzór rozwiązania postawionego w artykule problemu filtrowania internetowych ofert nieruchomości z wykorzystaniem metody k-najbliższych sąsiadów prezentuje poniższy przykład. 4. Przykład filtrowania ofert nieruchomości metodą k-nn Praktyczne zastosowanie metody k-najbliższych sąsiadów w każdym przypadku oznacza konieczność dysponowania zbiorem obiektów, którym w przykładzie są warianty (profile) niezabudowanych nieruchomości gruntowych (działek budowlanych) opisane zestawem sześciu cech (atrybutów, zmiennych objaśniających) w postaci lokalizacji nieruchomości w strefie miasta, powierzchni, uzbrojenia terenu, rodzaju formy władania
6 nieruchomością, kształtu i położenia środowiskowego działki 4. Należy zauważyć, iż każda ze zmiennych realizowana jest przez odpowiadające jej poziomy. W przypadku lokalizacji nieruchomości w strefie miasta jest to odpowiednio lokalizacja: centralna, śródmiejska i peryferyjna, w przypadku pozostałych cech odpowiednio: powierzchnia nieruchomości mała (poniżej 800 m 2 ), średnia ( m 2 ) i duża (powyżej 2000 m 2 ); uzbrojenie terenu podstawowe, niepełne i pełne ; forma władania nieruchomością własność i użytkowanie wieczyste ; kształt typowy i nietypowy ; położenie środowiskowe nieruchomości niekorzystne, przeciętne i korzystne (por. tabela 1). Tabela 1. Cechy niezabudowanych nieruchomości gruntowych na jeleniogórskim rynku nieruchomości z oferty wybranych biur pośrednictwa w obrocie nieruchomościami Kod Oznaczenie Nazwa cechy Realizacje cechy realizacji cechy cechy Centralna 1 X 1 X 2 X 3 X 4 X 5 Lokalizacja nieruchomości gruntowej w strefie miasta Powierzchnia nieruchomości Uzbrojenie terenu (tzw. media) Forma władania nieruchomością Kształt Śródmiejska 2 Peryferyjna 3 Mała 1 Średnia 2 Duża 3 Podstawowe 1 Niepełne 2 Pełne 3 Własność 1 użytkowanie wieczyste 2 Typowy 1 Nietypowy 2 4 Pomimo iż przykład ma charakter uproszczony, wybór cech opisujących nieruchomości bazuje na przeprowadzonych przez autora badaniach relatywnej ważności cech nieruchomości i odzwierciedla najważniejsze cechy niezabudowanych nieruchomości gruntowych (por. T. Bartłomowicz, 2002, s ; R. Pawlukowicz, T. Bartłomowicz, 2005, s ).
7 X 6 Położenie (otoczenie) środowiskowe nieruchomości Niekorzystne 1 Przeciętne 2 Korzystne 3 Źródło: Opracowanie własne. W przykładzie źródło danych stanowią strony internetowe jeleniogórskich biur pośrednictwa w obrocie nieruchomościami, z których ostatecznie wybrano 16 ofert (profilów) nieruchomości (P01, P02,, P16). Charakterystykę wykorzystanych ofert z uwzględnieniem kodów realizacji poszczególnych cech (por. tabela 1) prezentuje w postaci macierzy danych tabela 2. Należy zauważyć, iż wszystkie zaczerpnięte oferty charakteryzują się pełną własnością (kod 1 dla zmiennej X 4 ). Oznacza to, iż o zróżnicowaniu obiektów de facto decydują pozostałe zmienne (X 1, X 2, X 3, X 5, X 6 ). Na potrzeby prezentacji proponowanego rozwiązania przyjmuje się założenie, iż użytkownika strony internetowej szczególnie interesuje jeden z wariantów nieruchomości w postaci profilu P09 ( śródmiejska lokalizacja, średnia powierzchnia, niepełne uzbrojenie, własność, typowy kształt oraz korzystne położenie). Jednocześnie zakłada się, iż użytkownika interesuje pewien zbiór działek budowlanych, które spełniają wszystkie lub większość tych samych kryteriów są najbardziej podobne do profilu P09. Przedstawione w artykule rozwiązanie w miejsce klasycznego filtrowania ofert nieruchomości, które wymagałoby zastosowania kryteriów wyszukiwania w postaci atrybutów profilu P09, proponuje mechanizm polegający każdorazowo na możliwości wyszukania nieruchomości z definicji najbardziej podobnych do profilu będącego punktem wyjścia (profilu wzorcowego). Co ważne, z racji sugerowanej metody klasyfikacji w postaci k-nn, w mechanizmie tym przewiduje się możliwość deklaracji liczby poszukiwanych nieruchomości podobnych 5. W praktyce odpowiada to sytuacji, w której użytkownik strony internetowej zaciekawiony wybraną ofertą nieruchomości jest w stanie wyszukać z bazy ofert konkretną, z góry zadeklarowaną liczbę nieruchomości najbardziej podobnych do danej oferty, przy czym operacja ta odbywa się bez podawania jakichkolwiek dodatkowych kryteriów. Oznacza to, iż wiedza o preferowanych wariantach nieruchomości czerpana jest z 5 Od strony technicznej umożliwia to idea metody k-najbliższych sąsiadów, w której klasyfikacja odbywa się do k licznych klas k jako liczba sąsiadów jest definiowane w przeciwieństwie do innych metod klasyfikacji, gdzie podział następuje do k klas.
8 opisu profilu startowego (wzorcowego) w postaci preferencji wyrażonych 6 strony internetowej. użytkownika Tabela 2. Macierz danych (realizacje cech rynkowych w zbiorze klasyfikowanych nieruchomości) Cechy rynkowe i ich realizacje Profile (według tabeli 1) nieruchomości X 1 X 2 X 3 X 4 X 5 X 6 P P P P P P P P P P P P P P P P Źródło: Opracowanie własne. 6 W przeciwieństwie do preferencji ujawnionych, preferencje wyrażone to hipotetyczne (deklarowane) preferencje nabywców wyrażające ich intencje (por. Bąk, 2004, s. 43).
9 Aby możliwe było numeryczne zastosowanie metody k-nn, dane niemetryczne opisujące wszystkie profile nieruchomości zakodowano (por. tabela 2), co umożliwiło za pomocą wzorów (1) i (2) wyznaczenie macierzy odległości między poszczególnymi wariantami nieruchomości. Obliczenia, wykorzystując w tym celu polecenie dist.gdm z modułu clustersim, zrealizowano w środowisku R i otrzymano następujący zestaw wyników dla miary GDM (por. Walesiak, Gatnar, 2009, s. 421): > data(properties) > matrix <- dist.gdm(properties, method="gdm2") > print(round(matrix, 2))
10 W przypadku miary euklidesowej mającej za zadanie potwierdzić wskazania GDM obliczenia zrealizowano za pomocą programu MsExcel. Sumaryczne wyniki odległości nieruchomości opisanej profilem P09 od pozostałych ofert nieruchomości prezentuje tabela 3. Przy założeniu k = 3 uzyskane wyniki pozwalają jednoznacznie wyróżnić trzech najbliższych sąsiadów dla wariantu wzorcowego. W przykładzie są to profile: P02, P08 i P13 7. Wyróżnienie najbliższych sąsiadów dla wariantu wzorcowego oznacza znalezienie klasy nieruchomości dla wariantu charakteryzującego się atrybutami uznanymi za interesujące. W przełożeniu na działanie proponowanego mechanizmu filtrowania oznacza to wyszukanie zadeklarowanej liczby ofert, które ze wszystkich dostępnych na stronie internetowej w największym stopniu odpowiadają ofercie porównywanej. Należy w tym miejscu podkreślić, iż mechanizm ten, co należy uznać za jego zaletę, pozwala bez względu na objętość bazy danych wyszukać oferty najbardziej i nie do końca spełniające kryteria obiektu wzorcowego. Warto podkreślić, iż filtrowanie w klasycznym rozumieniu tego pojęcia takiej możliwości nie daje. Tabela 3. Odległości euklidesowe oraz GDM profilu nr 9 od pozostałych ofert nieruchomości Odległość Profil nieruchomości Euklidesowa GDM P01 1,41 0,22 P02 1,00 0,09 P03 2,00 0,39 P04 1,41 0,20 P05 1,41 0,22 P06 2,83 0,41 7 W przypadku k = 4 do trzech ww. wariantów zgodnie z ideą poszukiwania najmniejszej odległości pomiędzy wariantem wzorcowym a pozostałymi wariantami należałoby dodać wariant P04, w przypadku k = 5 wariant P05, w przypadku k = 6 wariant P01 itd.
11 P07 1,73 0,31 P08 1,00 0,09 P09 0,00 0,00 P10 2,45 0,42 P11 2,00 0,38 P12 2,24 0,28 P13 1,00 0,11 P14 1,73 0,31 P15 2,00 0,29 P16 2,45 0,41 Źródło: Obliczenia własne. 5. Podsumowanie Przedstawione rozwiązanie, głównie z uwagi na brak możliwości definiowania indywidualnych kryteriów, należy traktować jako rozwinięcie znanych i dostępnych mechanizmów filtrowania zawartości internetowych stron, w tym przypadku ofert sprzedaży nieruchomości. Wydaje się, iż zaproponowany mechanizm sortowania (filtrowania) dla tego typu zbioru danych, jakim są nieruchomości, jest bardziej adekwatny od rozwiązań standardowych, które niekoniecznie są dla tego typu danych dedykowane. Zaletą proponowanego rozwiązania jest niewątpliwie możliwość ograniczenia niebezpieczeństw wspomnianych w artykule, tj. m.in. możliwości uzyskania zbyt małej lub zbyt dużej liczby przefiltrowanych wyników. Jak zostało to już zauważone, wynika to z zastosowania odpowiedniej metody klasyfikacji. W opinii autora artykułu możliwość deklaracji liczby wyników filtrowania należy uznać za przejaw funkcjonalności proponowanego rozwiązania. Jednak za największą zaletę prezentowanego mechanizmu należy uznać możliwość uzyskania wśród filtrowanych wyników rekordów najbardziej podobnych do rekordu wzorca, szczególnie że proponowany mechanizm uwzględnia wybór rekordów różniących się od
12 wzorca w mniejszym lub większym stopniu. Jak już zauważono, każdorazowo pozwala to wyszukać oferty najbardziej, nawet jeśli nie do końca, spełniające określone kryteria. W połączeniu z wcześniej wspomnianą zaletą na przykładzie nieruchomości daje to gwarancję wyszukania określonej liczby ofert, co w przypadku filtrowania w klasycznym rozumieniu tego pojęcia takiej pewności nie daje. W opinii autora artykułu proponowany mechanizm przeszukiwania strony www nadaje się do szerszego zastosowania nie tylko w odniesieniu do nieruchomości. Wszędzie, gdzie sortowanie (filtrowanie) jest niezbędne, a większość cech to zmienne niemetryczne, proponowane rozwiązanie wydaje się przewyższać rozwiązania uniwersalne. Gdy dodatkowo zauważy się, iż numerycznie procedurę obliczeniową metody będącej podstawą klasyfikacji można zrealizować w języku programowania strony internetowej, to zaprezentowane rozwiązanie jawi się jako interesujące narzędzie filtrowania zbioru ofert z wykorzystaniem informacji o preferencjach użytkownika strony internetowej. Bibliografia 1. Bartłomowicz T., Zastosowanie metody conjoint analysis do pomiaru preferencji potencjalnych nabywców nieruchomości, w: Jajuga K., Walesiak M. (red.), Klasyfikacja i analiza danych teoria i zastosowania. Taksonomia 9, Wydawnictwo AE we Wrocławiu, Wrocław Bąk A., Dekompozycyjne metody pomiaru preferencji w badaniach marketingowych, Wydawnictwo AE we Wrocławiu, Wrocław Classification: k Nearest Neighbours, dokument dostępny w internecie na stronie: 4. Gatnar E., Walesiak M. (red.), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wydawnictwo AE we Wrocławiu, Wrocław Pawlukowicz R., Bartłomowicz T., Conjoint analysis jako sposób wyznaczania wag cech rynkowych w wycenie rynkowej nieruchomości za pomocą podejścia porównawczego, w: Ekonometria 15, red. J. Dziechciarz, Wydawnictwo AE we Wrocławiu, Wrocław Słownik języka polskiego, PWN, słownik dostępny w internecie na stronie: 7. Tadeusiewicz R., Lasiński M., Rozpoznawanie obrazów, PWN, Warszawa 1991.
13 8. Walesiak M., Gatnar E. (red.), Statystyczna analiza danych z wykorzystaniem programu R, PWN, Warszawa Walesiak M., Obszary zastosowań uogólnionej miary odległości GDM w statystycznej analizie wielowymiarowej, w: Ekonometria 11, red. J. Dziechciarz, Wydawnictwo AE we Wrocławiu, Wrocław Walesiak M., Pomiar podobieństwa obiektów w świetle skal pomiaru i wag zmiennych, w: Ekonometria 10, red. J. Dziechciarz, Wydawnictwo AE we Wrocławiu, Wrocław Walesiak M., Uogólniona miara odległości w statystycznej analizie wielowymiarowej, wydanie 2 rozszerzone, Wydawnictwo AE we Wrocławiu, Wrocław 2006.
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis
Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce
Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce Mgr inż. Agata Binderman Dzienne Studia Doktoranckie przy Wydziale Ekonomiczno-Rolniczym Katedra Ekonometrii i Informatyki SGGW Opiekun
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
WYKAZ PRAC PUBLIKOWANYCH
Dr hab. Andrzej Bąk Prof. nadzw. AE WYKAZ PRAC PUBLIKOWANYCH I. Publikacje zwarte I.1. KsiąŜki 1. Walesiak M., Bąk A. [1997], Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu
Badania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki
Zeszyty Naukowe Wyższej Szkoły Bankowej w Poznaniu Nr / Rafał Czyżycki Uniwersytet Szczeciński Badanie rozwoju społeczno-gospodarczego województw - wpływ metodyki badań na uzyskane wyniki Streszczenie,
UE we Wrocławiu, WEZiT w Jeleniej Górze Katedra Ekonometrii i Informatyki
UE we Wrocławiu, WEZiT w Jeleniej Górze Katedra Ekonometrii i Informatyki http://keii.ue.wroc.pl Prognozowanie procesów gospodarczych prowadzący: dr inż. Tomasz Bartłomowicz tomasz.bartlomowicz@ue.wroc.pl
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Proces badawczy schemat i zasady realizacji
Proces badawczy schemat i zasady realizacji Agata Górny Wydział Nauk Ekonomicznych UW Warszawa, 28 października 2014 Najważniejsze rodzaje badań Typy badań Podział wg celu badawczego Kryteria przyczynowości
Adrian Horzyk
Metody Inteligencji Obliczeniowej Metoda K Najbliższych Sąsiadów (KNN) Adrian Horzyk horzyk@agh.edu.pl AGH Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Wykład 10 Skalowanie wielowymiarowe
Wykład 10 Skalowanie wielowymiarowe Wrocław, 30.05.2018r Skalowanie wielowymiarowe (Multidimensional Scaling (MDS)) Główne cele MDS: przedstawienie struktury badanych obiektów przez określenie treści wymiarów
Statystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
NOTA INTERPETACYJNA ZASTOSOWANIE PODEJŚCIA PORÓWNAWCZEGO W WYCENIE NIERUCHOMOŚCI
POWSZECHNE KRAJOWE ZASADY WYCENY (PKZW) NOTA INTERPETACYJNA ZASTOSOWANIE PODEJŚCIA PORÓWNAWCZEGO W WYCENIE NIERUCHOMOŚCI 1. WPROWADZENIE 1.1. Celem niniejszej noty jest przedstawienie uzgodnionych w środowisku
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.
STRESZCZENIE rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. Zasadniczym czynnikiem stanowiącym motywację dla podjętych w pracy rozważań
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
NOTA INTERPETACYJNA ZASTOSOWANIE PODEJŚCIA PORÓWNAWCZEGO W WYCENIE NIERUCHOMOŚCI
POWSZECHNE KRAJOWE ZASADY WYCENY (PKZW) NOTA INTERPETACYJNA ZASTOSOWANIE PODEJŚCIA PORÓWNAWCZEGO W WYCENIE NIERUCHOMOŚCI 1. WPROWADZENIE...2 2. PRZEDMIOT I ZAKRES STOSOWANIA NOTY...2 3. ZAŁOŻENIA OGÓLNE
MINISTER INWESTYCJI I ROZWOJU 1)
projekt z dnia 22 lutego 2019 r. MINISTER INWESTYCJI I ROZWOJU 1) Warszawa, dnia STANDARD ZAWODOWY RZECZOZNAWCÓW MAJĄTKOWYCH NR 2 WYCENA NIERUCHOMOŚCI PRZY ZASTOSOWANIU PODEJŚCIA PORÓWNAWCZEGO Na podstawie
Proces badawczy schemat i zasady realizacji
Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 23 października 2016 Metodologia i metoda naukowa 1 Metodologia Metodologia nauka o metodach nauki
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY Autorzy: M. Lewicka, K. Stańczyk Kraków 2008 Cel pracy projekt i implementacja systemu rozpoznawania twarzy, który na podstawie
Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
Badania eksploracyjne Badania opisowe Badania wyjaśniające (przyczynowe)
Proces badawczy schemat i zasady realizacji Agata Górny Demografia Wydział Nauk Ekonomicznych UW Warszawa, 4 listopada 2008 Najważniejsze rodzaje badań Typy badań Podział wg celu badawczego Badania eksploracyjne
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Operacjonalizacja zmiennych
Metodologia badań naukowych - wykład 2 Operacjonalizacja zmiennych Pojęcie zmiennej Definiowanie zmiennych w planie badania Mierzenie. Skale mierzenia Pojęcie wskaźnika. Dobór wskaźnika dla zmiennej Kryteria
Wykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD
Dr inż. Jacek WARCHULSKI Dr inż. Marcin WARCHULSKI Mgr inż. Witold BUŻANTOWICZ Wojskowa Akademia Techniczna SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Streszczenie: W referacie przedstawiono możliwości
Proces badawczy schemat i zasady realizacji
Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 14 grudnia 2014 Metodologia i metoda badawcza Metodologia Zadania metodologii Metodologia nauka
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa
Prof. dr hab. Edward Nowak Uniwersytet Ekonomiczny we Wrocławiu Katedra Rachunku Kosztów, Rachunkowości Zarządczej i Controllingu Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność
Systemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Wykaz publikacji. Pozycje zwarte:
Wykaz publikacji Pozycje zwarte: 1. Zadania z metod ilościowych w ekonomii. Skrypt. Praca zbiorowa pod red. M. Montygierda-Łoyby. Wrocław AE 1988, 209 s. (Współautorzy: Z. Bobowski, T. Borys, M. Budrewicz,
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
ZASTOSOWANIE METODY ANALIZY STATYSTYCZNEJ RYNKU W SZACOWANIU WARTOŚCI TECHNICZNYCH ŚRODKÓW PRODUKCJI NA PRZYKŁADZIE CIĄGNIKA ROLNICZEGO
Inżynieria Rolnicza 6(94)/2007 ZASTOSOWANIE METODY ANALIZY STATYSTYCZNEJ RYNKU W SZACOWANIU WARTOŚCI TECHNICZNYCH ŚRODKÓW PRODUKCJI NA PRZYKŁADZIE CIĄGNIKA ROLNICZEGO Zbigniew Kowalczyk Katedra Inżynierii
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Internetowy system e-crm do obsługi biura podróży. Marek Bytnar, Paweł Kraiński
Internetowy system e-crm do obsługi biura podróży Marek Bytnar, Paweł Kraiński Cele pracy utworzenie nowoczesnego systemu CRM dla biura podróży, które oferuje swoje usługi przez Internet zaproponowanie
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy Wykorzystane materiały: Zadanie W dalszej części prezentacji będzie omawiane zagadnienie rozpoznawania twarzy Problem ten można jednak uogólnić
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY WALIDACJA KRZYŻOWA dla ZAAWANSOWANEGO KLASYFIKATORA KNN ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
B3.5 Koncentracja. Raport pochodzi z portalu
B3.5 Koncentracja System PIK umożliwia wyznaczanie potencjału gospodarczego regionu z wykorzystaniem wskaźników lokacji i wskaźników przesunięć. Jest to dalszy logiczny krok analizy zaraz po modułach B3.1
BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI
14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Skalowanie wielowymiarowe idea
Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy
PRZEWODNIK PO PRZEDMIOCIE. stacjonarne. II stopnia. ogólnoakademicki. podstawowy WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu Kierunek Forma studiów Poziom kwalifikacji Rok Semestr Jednostka prowadząca Osoba sporządzająca Profil Rodzaj
Eksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
TYTUŁ PRACY LICENCJACKIEJ/MAGISTERSKIEJ
UNIWERSYTET EKONOMICZNY W KATOWICACH NAZWA WYDZIAŁU NAZWA KIERUNKU IMIĘ I NAZWISKO AUTORA TYTUŁ PRACY LICENCJACKIEJ/MAGISTERSKIEJ (W JĘZYKU POLSKIM) TYTUŁ PRACY LICENCJACKIEJ/MAGISTERSKIEJ (W JĘZYKU ANGIELSKIM)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Wektory, układ współrzędnych
Wektory, układ współrzędnych Wielkości występujące w przyrodzie możemy podzielić na: Skalarne, to jest takie wielkości, które potrafimy opisać przy pomocy jednej liczby (skalara), np. masa, czy temperatura.
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 50 2012 ANALIZA WŁASNOŚCI OPCJI SUPERSHARE
ZESZYTY NAUKOWE UNIWERSYTETU SZCZECIŃSKIEGO NR 689 FINANSE, RYNKI FINANSOWE, UBEZPIECZENIA NR 5 212 EWA DZIAWGO ANALIZA WŁASNOŚCI OPCJI SUPERSHARE Wprowadzenie Proces globalizacji rynków finansowych stwarza
Tabela 1. Macierz preferencji dotycząca pięciu przykładowych produktów (obiektów) i sześciu respondentów
Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Katedra Ekonometrii i Informatyki ZASTOSOWANIE ANALIZY UNFOLDING W OCENIE PREFERENCJI UCZNIÓW SZKOŁY POLICEALNEJ Streszczenie: W artykule przedstawiono
w pierwszym okresie nauki w gimnazjum
Wojdedh Walczak Ośrodek Pedagogiczno-Wydawniczy CHEJRON w Łodzi Związek pomiędzy dwoma typami oceniania w podstawowej a wynikami osiąganymi przez uczniów w pierwszym okresie nauki w gimnazjum Wstęp Niniejsze
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Wykład z Technologii Informacyjnych. Piotr Mika
Wykład z Technologii Informacyjnych Piotr Mika Uniwersalna forma graficznego zapisu algorytmów Schemat blokowy zbiór bloków, powiązanych ze sobą liniami zorientowanymi. Jest to rodzaj grafu, którego węzły
METODY ILOŚCIOWE W ZARZĄDZANIU
1.1.1 Metody ilościowe w zarządzaniu I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE METODY ILOŚCIOWE W ZARZĄDZANIU Nazwa jednostki organizacyjnej prowadzącej kierunek: Kod przedmiotu: RiAF_PS5 Wydział Zamiejscowy
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Programowanie liniowe w zagadnieniach finansowych i logistycznych Linear programming in financial and logistics problems Kierunek: Matematyka Rodzaj przedmiotu: obowiązkowy dla specjalności
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)
Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące
Wykaz publikacji. Pozycje zwarte:
Wykaz publikacji Pozycje zwarte: 1. Zadania z metod ilościowych w ekonomii. Skrypt. Praca zbiorowa pod red. M. Montygierda-Łoyby. Wrocław AE 1988, 209 s. (Współautorzy: Z. Bobowski, T. Borys, M. Budrewicz,
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Programowanie liniowe w technice Linear programming in engineering problems Kierunek: Rodzaj przedmiotu: obowiązkowy na kierunku matematyka przemysłowa Rodzaj zajęć: wykład, laboratorium,
INFRASTRUKTURA I EKOLOGIA TERENÓW WIEJSKICH INFRASTRUCTURE AND ECOLOGY OF RURAL AREAS
Badania autokorelacji przestrzennej INFRASTRUKTURA I EKOLOGIA TERENÓW WIEJSKICH INFRASTRUCTURE AND ECOLOGY OF RURAL AREAS Nr 8/2008, POLSKA AKADEMIA NAUK, Oddział w Krakowie, s. 207 214 Komisja Technicznej
Model referencyjny doboru narzędzi Open Source dla zarządzania wymaganiami
Politechnika Gdańska Wydział Zarządzania i Ekonomii Katedra Zastosowań Informatyki w Zarządzaniu Zakład Zarządzania Technologiami Informatycznymi Model referencyjny Open Source dla dr hab. inż. Cezary
Jakość wyrobów i usług. Tomasz Poskrobko
Jakość wyrobów i usług Tomasz Poskrobko Jakość??????????????? Jakość Wszystkie definicje jakości można przydzielić do jednej z dwóch interpretacji: wartościującej (oceniającej, preferencyjnej), niewartościującej
WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu Kierunek Forma studiów Poziom kwalifikacji Rok Semestr Jednostka prowadząca Osoba sporządzająca Profil Rodzaj
Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi
Systemy baz danych w zarządzaniu przedsiębiorstwem W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Proces zarządzania danymi Zarządzanie danymi obejmuje czynności: gromadzenie
Optymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Badania biegłości laboratorium poprzez porównania międzylaboratoryjne
Badania biegłości laboratorium poprzez porównania międzylaboratoryjne Dr inż. Maciej Wojtczak, Politechnika Łódzka Badanie biegłości (ang. Proficienty testing) laboratorium jest to określenie, za pomocą
Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania
Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja
4.3 Grupowanie według podobieństwa
4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi
Prawdopodobieństwo czerwonych = = 0.33
Temat zajęć: Naiwny klasyfikator Bayesa a algorytm KNN Część I: Naiwny klasyfikator Bayesa Naiwny klasyfikator bayerowski jest prostym probabilistycznym klasyfikatorem. Naiwne klasyfikatory bayesowskie
Wnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
Algorytm grupowania danych typu kwantyzacji wektorów
Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, rozważane dotychczas problemy koncentrowały się na nauczeniu na podstawie zbioru treningowego i zbioru etykiet klasyfikacji
Priorytetyzacja przypadków testowych za pomocą macierzy
Priorytetyzacja przypadków testowych za pomocą macierzy W niniejszym artykule przedstawiony został problem przyporządkowania priorytetów do przypadków testowych przed rozpoczęciem testów oprogramowania.
Dziennik Urzędowy Unii Europejskiej L 274/9
20.10.2009 Dziennik Urzędowy Unii Europejskiej L 274/9 ROZPORZĄDZENIE KOMISJI (WE) NR 976/2009 z dnia 19 października 2009 r. w sprawie wykonania dyrektywy 2007/2/WE Parlamentu Europejskiego i Rady w zakresie
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Statystyka społeczna. Liczba godzin stacjonarne: Wykłady: 15 Ćwiczenia: 15. niestacjonarne: Wykłady: 9 Ćwiczenia: 9
Karta przedmiotu Wydział: Wydział Zarządzania Kierunek: Analityka gospodarcza I. Informacje podstawowe Nazwa przedmiotu Statystyka społeczna Nazwa przedmiotu w j. ang. Język prowadzenia przedmiotu polski
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE. Nie dotyczy. podstawowy i kierunkowy
1.1.1 Statystyka opisowa I. OGÓLNE INFORMACJE PODSTAWOWE O PRZEDMIOCIE STATYSTYKA OPISOWA Nazwa jednostki organizacyjnej prowadzącej kierunek: Kod przedmiotu: P6 Wydział Zamiejscowy w Ostrowie Wielkopolskim
Badania Statystyczne
Statystyka Opisowa z Demografią oraz Biostatystyka Badania Statystyczne Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka
MODEL KOMPETENCYJNY DYREKTORA
MODEL KOMPETENCYJNY DYREKTORA JAKO NARZĘDZIE WSPOMAGAJĄCE ZARZĄDZANIE PLACÓWKĄ ZARZĄDZANIE PO WROCŁAWSKU prof. UWr Kinga Lachowicz-Tabaczek Instytut Psychologii Uniwersytetu Wrocławskiego, HR Projekt Wrocław
1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:
Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,
Geoportal.gov.pl Przewodnik użytkownika Załącznik 1 Dokumentacja profilu GUGIK usługi OpenLS
Geoportal.gov.pl Przewodnik użytkownika Załącznik 1 Dokumentacja profilu GUGIK usługi OpenLS Spis treści 1. Wprowadzenie... 2 2. gugik_ols: AddressPoint... 2 3. gugik_ols: AdministrativeUnit... 3 4. gugik_ols:
Podstawy Informatyki Systemy sterowane przepływem argumentów
Podstawy Informatyki alina.momot@polsl.pl http://zti.polsl.pl/amomot/pi Plan wykładu 1 Komputer i jego architektura Taksonomia Flynna 2 Komputer i jego architektura Taksonomia Flynna Komputer Komputer
Metody badań w naukach ekonomicznych
Metody badań w naukach ekonomicznych Tomasz Poskrobko Metodyka badań naukowych Metody badań ilościowe jakościowe eksperymentalne Metody badań ilościowe jakościowe eksperymentalne Metody ilościowe metody
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza
ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego
Skrypt 17. Podobieństwo figur. 1. Figury podobne skala podobieństwa. Obliczanie wymiarów wielokątów powiększonych bądź pomniejszonych.
Projekt Innowacyjny program nauczania matematyki dla gimnazjów współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego Skrypt 17 Podobieństwo figur 1. Figury podobne skala
KLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
INSTRUKCJA DO ĆWICZENIA NR 1
L01 ---2014/10/17 ---10:52---page1---#1 KATEDRA MECHANIKI STOSOWANEJ Wydział Mechaniczny POLITECHNIKA LUBELSKA INSTRUKCJA DO ĆWICZENIA NR 1 PRZEDMIOT TEMAT Wybrane zagadnienia z optymalizacji elementów
1 Wprowadzenie do algorytmiki
Teoretyczne podstawy informatyki - ćwiczenia: Prowadzący: dr inż. Dariusz W Brzeziński 1 Wprowadzenie do algorytmiki 1.1 Algorytm 1. Skończony, uporządkowany ciąg precyzyjnie i zrozumiale opisanych czynności
Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze
Barbara Batóg Jacek Batóg Uniwersytet Szczeciński Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze W 2004 roku planowane
Niepewności pomiarów
Niepewności pomiarów Międzynarodowa Organizacja Normalizacyjna (ISO) w roku 1995 opublikowała normy dotyczące terminologii i sposobu określania niepewności pomiarów [1]. W roku 1999 normy zostały opublikowane
Wykorzystanie komputera przez uczniów klas IV VI szkoły podstawowej w uczeniu się sprawozdanie z badań sondażowych
Wydawnictwo UR 2017 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 3/21/2017 www.eti.rzeszow.pl DOI: 10.15584/eti.2017.3.36 MAREK HALLADA Wykorzystanie komputera przez uczniów klas