PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
|
|
- Ewa Bukowska
- 7 lat temu
- Przeglądów:
Transkrypt
1 PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2016
2 Redaktor Wydawnictwa: Agnieszka Flasińska Redaktor techniczny: Barbara Łopusiewicz Korektor: Barbara Cibis Łamanie: Beata Mazur Projekt okładki: Beata Dębska Tytuł dofinansowany ze środków Narodowego Banku Polskiego oraz ze środków Sekcji Klasyfikacji i Analizy Danych PTS Informacje o naborze artykułów i zasadach recenzowania znajdują się na stronach internetowych Publikacja udostępniona na licencji Creative Commons Uznanie autorstwa-użycie niekomercyjne-bez utworów zależnych 3.0 Polska (CC BY-NC-ND 3.0 PL) Copyright by Uniwersytet Ekonomiczny we Wrocławiu Wrocław 2016 ISSN (Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu) e-issn ISSN (Taksonomia) Wersja pierwotna: publikacja drukowana Zamówienia na opublikowane prace należy składać na adres: Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu ul. Komandorska 118/120, Wrocław tel./fax ; econbook@ue.wroc.pl Druk i oprawa: TOTEM
3 Spis treści Wstęp... 9 Beata Bal-Domańska: Propozycja procedury oceny zrównoważonego rozwoju w układzie presja stan reakcja w ujęciu przestrzennym / Proposal of the assessment of poviats sustainable development in the pressure state response system in spatial terms Tomasz Bartłomowicz: Pomiar preferencji konsumentów z wykorzystaniem metody Analytic Hierarchy Process / Analytic Hierarchy Process as a method of measurement of consumers preferences Maciej Beręsewicz, Marcin Szymkowiak: Analiza skupień wybranych lokalnych rynków nieruchomości w Polsce z wykorzystaniem internetowych źródeł danych / Cluster analysis of selected local real estate markets in Poland based on Internet data sources Beata Bieszk-Stolorz: Wybrane modele przeciętnego efektu oddziaływania w analizie procesu wychodzenia z bezrobocia / Chosen average treatment effect models in the analysis of unemployment exit process Justyna Brzezińska: Modele IRT i modele Rascha w badaniach testowych / IRT and Rasch models in test measurement Mariola Chrzanowska, Nina Drejerska: Geograficznie ważona regresja jako narzędzie analizy poziomu rozwoju społeczno-gospodarczego na przykładzie regionów Unii Europejskiej / Geographically weighted regression as a tool of analysis of socio-economic development level of regions in the European Union Sabina Denkowska: Zastosowanie analizy wrażliwości do oceny wpływu nieobserwowanej zmiennej w Propensity Score Matching / The application of sensitivity analysis in assessing the impact of an unobserved confounder in Propensity Score Matching Adam Depta: Zastosowanie analizy czynnikowej do wyodrębnienia aspektów zdrowia wpływających na jakość życia osób jąkających się / The application of factor analysis to the identification of the health aspects affecting the quality of life of stuttering people Mariusz Doszyń, Sebastian Gnat: Taksonomiczno-ekonometryczna procedura wyceny nieruchomości dla różnych miar porządkowania / Taxonomic and econometric method of real estate valuation for various classification measures... 84
4 6 Spis treści Marta Dziechciarz-Duda, Anna Król: Segmentacja konsumentów smartfonów na podstawie preferencji wyrażonych / Segmentation of smartphones consumers on the basis of stated preferences Ewa Genge: Zmienne towarzyszące w ukrytym modelu Markowa analiza oszczędności polskich gospodarstw domowych / Latent Markov model with covariates Polish households saving behaviour Joanna Górna, Karolina Górna: Modelowanie wzrostu gospodarczego z wykorzystaniem narzędzi ekonometrii przestrzennej / Economic growth modelling with the application of spatial econometrics tools Alicja Grześkowiak: Wielowymiarowa analiza kompetencji zawodowych według grup wieku ludności / Multivariate analysis of professional competencies with respect to the age groups of the population Agnieszka Kozera, Feliks Wysocki: Problem ustalania współrzędnych obiektów modelowych w metodach porządkowania liniowego obiektów / The problem of determining the coordinates of model objects in object linear ordering methods Mariusz Kubus: Lokalna ocena mocy dyskryminacyjnej zmiennych / Local evaluation of a discrimination power of the variables Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski: Analiza wydźwięku polskojęzycznych opinii konsumenckich ukierunkowanych na cechy produktu / Feature-based sentiment analysis of opinions in Polish Aleksandra Łuczak, Agnieszka Kozera, Feliks Wysocki: Ocena sytuacji finansowej jednostek samorządu terytorialnego z wykorzystaniem rozmytych metod klasyfikacji i programu R / Assessment of financial condition of local government units with the use of fuzzy classification methods and program R Dorota Rozmus: Badanie stabilności taksonomicznej czynnikowej metody odległości probabilistycznej / Stability of the factor probability distance clustering method Adam Sagan, Aneta Rybicka, Justyna Brzezińska: Conjoint analysis oparta na modelach IRT w zagadnieniu optymalizacji produktów bankowych / An IRT-approach for conjoint analysis for banking products preferences Michał Stachura: O szacowaniu centrum populacji określonego obszaru na przykładzie Polski / On estimating centre of population of a given territory. Poland s case Michał Stachura, Barbara Wodecka: Wybrane aspekty i zastosowania modeli zdarzeń ekstremalnych / Selected facets and application of models of extremal events Iwona Staniec, Jan Żółtowski: Wykorzystanie analizy log-liniowej do wyboru czynników determinujących współpracę w przedsiębiorczości
5 Spis treści 7 technologicznej / Use of log-linear analysis for the selection determinants of cooperation in technological entrepreneurship Marcin Szymkowiak, Wojciech Roszka: Potencjał gospodarczy gmin aglomeracji poznańskiej w ujęciu taksonomicznym / The economic potential of municipalities of the Poznań agglomeration in the light of taxonomy analysis Lucyna Wojcieska: Zastosowanie modeli klas ukrytych w badaniu opinii respondentów na temat roli państwa w gospodarce / Implementation of latent class models in the respondents survey on the role of the country in economy
6 Wstęp W dniach września 2015 r. w Hotelu Novotel Gdańsk Marina w Gdańsku odbyła się XXIV Konferencja Naukowa Sekcji Klasyfikacji i Analizy Danych PTS (XXIX Konferencja Taksonomiczna) Klasyfikacja i analiza danych teoria i zastosowania, zorganizowana przez Sekcję Klasyfikacji i Analizy Danych Polskiego Towarzystwa Statystycznego oraz Katedrę Statystyki Wydziału Zarządzania Uniwersytetu Gdańskiego. W trakcie dwóch sesji plenarnych oraz 13 sesji równoległych wygłoszono 58 referatów poświęconych aspektom teoretycznym i aplikacyjnym zagadnienia klasyfikacji i analizy danych. Odbyła się również sesja plakatowa, na której zaprezentowano 14 plakatów. Teksty 24 recenzowanych artykułów naukowych stanowią zawartość prezentowanej publikacji z serii Taksonomia nr 27. Teksty 25 recenzowanych artykułów naukowych znajdują się w Taksonomii nr 26. Krzysztof Jajuga, Marek Walesiak
7 PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU nr 207 RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr Taksonomia 27 ISSN Klasyfikacja i analiza danych teoria i zastosowania e-issn Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie s: {lulap; wojcikk; tuchowsj}@uek.krakow.pl ANALIZA WYDŹWIĘKU POLSKOJĘZYCZNYCH OPINII KONSUMENCKICH UKIERUNKOWANYCH NA CECHY PRODUKTU 1 FEATURE-BASED SENTIMENT ANALYSIS OF OPINIONS IN POLISH DOI: /pn Streszczenie: Opinie konsumenckie są szczególnym rodzajem dokumentów ze względu na swoją zawartość ich głównym celem nie jest przekazanie obiektywnej informacji, ale subiektywnego nastawienia autora do produktu lub jego elementów. Przedstawione w opinii nastawienie opiniodawcy nazywane jest wydźwiękiem. Opinia może odnosić się do produktu w całości, lub też do jego elementów. Celem pracy jest zaprezentowanie autorskiej metody automatycznej oceny wydźwięku opinii konsumenckich ukierunkowanych na cechy produktu. Zadanie to jest realizowane poprzez analizę słów występujących w bezpośrednim sąsiedztwie miejsca w tekście zawierającego odniesienie do zidentyfikowanych cech produktu. Wyznaczone na podstawie tekstu oceny wyróżnionych elementów produktu mogą zostać przypisane do właściwych elementów drzewa opisu produktu, a następnie przetwarzane w sposób właściwy dla przyjętego celu analizy. Słowa kluczowe: text-mining, opinion mining, sentiment analysis, ontologia, odległość semantyczna, analiza ukierunkowana na cechy produktu. Summary: Consumer reviews are a special type of text documents due to their content their main purpose is not to provide objective information, but to show a subjective attitude of its authors to the product or its components. The attitude presented in the opinion is called overtones. Opinion may refer to a product as a whole or its components. The aim of the paper is to present the authors method for automatic evaluation of features-concentrated opinions overtones. This task is realized by analyzing the words in the direct neighbourhood of the product s characteristics found in the text. Sentiments of distinguished product s components identified on the basis of opinion can be assigned to the appropriate parts of the product description tree and then processed according to the purpose of analysis. Keywords: text-mining, opinion mining, sentiment analysis, ontology, semantic similarity, feature-based analysis. 1 Publikacja dofinansowana ze środków przyznanych Wydziałowi Zarządzania Uniwersytetu Ekonomicznego w Krakowie w ramach dotacji przyznanej na utrzymanie potencjału badawczego oraz w ramach dotacji na finansowanie zadań służących rozwojowi młodych naukowców.
8 154 Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski 1. Wstęp Opinie konsumenckie są szczególnym rodzajem dokumentów ze względu na swoją zawartość ich głównym celem jest przekazanie nie obiektywnej informacji, ale subiektywnego nastawienia autora do produktu lub jego elementów. Przedstawione w opinii nastawienie opiniodawcy nazywane jest wydźwiękiem. W najprostszej sytuacji wyróżnia się opinie o wydźwięku pozytywnym lub negatywnym. W części badań uwzględnia się również opinie neutralne. Opinia może odnosić się do produktu w całości lub też do jego elementów. W tym drugim przypadku ogólne nastawienie autora do produktu powstaje poprzez zagregowanie ocen cząstkowych, dotyczących poszczególnych elementów. Dokonując agregacji, należy uwzględnić znaczenie poszczególnych składowych w całości produktu. Celem artykułu jest prezentacja autorskiej metody automatycznej oceny wydźwięku opinii konsumenckich ukierunkowanych na cechy produktu. Zakłada się, że struktura produktu opisana jest w postaci ontologii przyjmującej postać drzewa. W trakcie pierwszego kroku analizy znajdujące się w tekście opinii wyrazy odnoszące się do ocenianego produktu wiązane są z właściwymi elementami ontologii, a następnie analizowany jest wydźwięk (nacechowanie) słów znajdujących się w bezpośrednim sąsiedztwie zidentyfikowanych terminów. Na tej podstawie dokonywana jest ocena wymienionej w tekście cechy produktu. Drzewiasta struktura ontologii pozwala na agregowanie tak uzyskanych informacji i uzyskanie ocen o ustalonym przez badacza stopniu szczegółowości. 2. Automatyczna analiza opinii konsumenckich Automatyczna analiza opinii konsumenckich (sentiment analysis, opinion mining) to ogół działań mających na celu zautomatyzowanie procesu wyszukiwania, ekstrakcji i analizy danych pochodzących ze specyficznych tekstów, jakimi są opinie użytkowników. Są to działania z pogranicza przetwarzania języka naturalnego (Natural Language Processing NLP), lingwistyki komputerowej (computational linguistics) oraz eksploracyjnej analizy tekstu (text mining). Jej celem jest określenie nastawienia autora wypowiedzi do jej przedmiotu. W literaturze światowej zagadnienie analizy lub eksploracji opinii (określane jako opinion mining) pojawiło się w 2003 r. [Dave, Lawrence, Pennock 2003]. Stosowane jest również pojęcie analiza wydźwięku (sentiment analysis), które pojawiło się w pracach [Das, Chen 2001; Turney 2002; Pang, Lee, Vaithyanathan 2002; Nasukawa, Yi 2003]. W wielu przypadkach wspomniane terminy stosowane są zamiennie. Wydaje się jednak, że analiza wydźwięku jest zagadnieniem znacznie węższym i stanowi jeden z problemów rozpatrywanych w ramach automatycznej analizy opinii konsumenckich. Badanie wydźwięku porównać można do zada-
9 Analiza wydźwięku polskojęzycznych opinii konsumenckich 155 nia klasyfikacji wzorcowej polegającego na przypisaniu opinii do jednej z grup obejmujących wypowiedzi pozytywne, negatywne lub neutralne. Zadanie to określane jest również jako badanie polaryzacji (polarity) opinii. Opinie można podzielić na grupy według ich formatu [Liu 2007]: 1) zalety i wady, oraz podsumowanie, 2) zalety i wady, 3) dowolny. Analiza opinii konsumenckich jest jednym z najbardziej wymagających problemów rozpatrywanych na gruncie automatycznej analizy języka naturalnego. Do najważniejszych czynników utrudniających analizę należy zaliczyć [Cambria i in. 2013; Cambria, Hussain 2012; Pang, Lee 2008]): cel badań jakim jest analiza emocji lub nastawienia nie zawsze jest w sposób bezpośredni przedstawiony w tekście, sarkastyczny lub ironiczny charakter wypowiedzi, błędy ortograficzne i stylistyczne w opiniach umieszczanych w serwisach społecznościowych, potrzeba przeprowadzania analiza nawiązań (wielokrotne odwołań do obiektów bezpośrednio nieprzywoływanych w tekście określanych jako odwołania koreferencyjne), badanie znaczenia powtórzeń zwrotów lub słów (anafor), konieczność właściwej interpretacji wyrażeń negujących, problem identyfikacji nazw własnych, stosowanie porównań, wieloznaczność słów i dłuższych wypowiedzi (np. stwierdzenie idź na spacer samo w sobie nie ma negatywnego zabarwienia, ale jeśli pojawi się w recenzji filmu to nabiera ujemnego wydźwięku) Podejścia do automatycznej analizy opinii konsumentów W ramach automatycznej analizy opinii konsumenckich wyróżnić można trzy rodzaje działań, takie jak [Liu 2007]: identyfikacja ogólnego charakteru i klasyfikacja opinii, analiza ukierunkowana na cechy produktu, analiza porównawcza produktów. Pierwsze z wymienionych zadań ma na celu określenie ogólnego nastawienia autora do opiniowanego produktu i zaklasyfikowanie opinii jako pozytywnej, negatywnej lub neutralnej. Tak opisany problem określany jest również jako identyfikacja polaryzacji, nacechowania lub wydźwięku opinii lub analiza sentymentu. Celem analizy ukierunkowanej na cechy produktu jest wydobycie z tekstu opinii fragmentów dotyczących poszczególnych cech produktu i określenie stosunku autora tekstu do każdej z nich. W niektórych pracach analiza ukierunkowana na
10 156 Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski cechy produktu opisywana jest jako głębszy poziom analizy nacechowania opinii [Liu 2010]. Zebrane w ten sposób informacje cząstkowe mogą zostać w trakcie kolejnych etapów analizy zagregowane w celu wyznaczenia ogólnego nastawienia opiniującego do produktu. Wykonanie takiej operacji wymaga wiedzy dotyczącej struktury produktu będącego przedmiotem opinii determinującej sposób wykonania agregacji. Szczególnym przypadkiem analizy opinii konsumenckich jest analiza porównawcza mająca na celu dokonanie oceny dwóch produktów lub ich cech w kategoriach lepszy lub gorszy. Wyróżnić można cztery text miningowe podejścia do automatycznej analizy opinii konsumentów [Lula, Wójcik 2011]. 1. Podejście oparte na słowach (word-based approach). Stosując podejście oparte na słowach, dokonuje się podziału tekstu na poszczególne słowa. W kolejnym kroku określa się nacechowanie każdego ze słów. Do wykonania tej operacji wykorzystywane są słowniki sentymentu, które mogą dla znajdujących w nich słów zawierać informację o nacechowaniu w postaci etykiety pozytywny lub negatywny lub też zawierać informację o nacechowaniu w postaci wartości numerycznej. Słowom niewystępującym w słowniku przypisuje się zwykle nacechowanie neutralne. Słowniki sentymentu tworzone są głównie dla języka angielskiego (za przykład może służyć SentiWordNet [Esuli, Sebastiani 2006]). Ocena podejścia opartego na słowach wykorzystującego chmury tagów zbudowane z wad i zalet będących częścią opinii przedstawiona została w pracy [Wójcik, Tuchowski 2013]. 2. Podejście oparte na wzorcach (pattern-based approach). Jedną z najistotniejszych wad podejścia opartego na słowach jest to, że w trakcie analizy nie uwzględnia się informacji o kolejności słów, lecz każdy wyraz rozpatruje się niezależnie od kontekstu, w jakim wystąpił. Podejście oparte na wzorcach ma na celu przynajmniej w sposób częściowy rozwiązać ten problem. Zakłada ono, że algorytm analizujący tekst opinii potrafi rozpoznać frazy lub specyficzne struktury gramatyczne i uwzględnić te informacje przy określaniu nacechowania. Przykładem tego typu podejścia może być zastosowanie reguł aplikacji Spejd opartych na mechanizmie wyrażeń regularnych w sposób ułatwiający tworzenie opisów sekwencji słów. Omówienie i ocenę podejścia opartego na wzorcach zamieszczono w pracy [Wójcik, Tuchowski 2015]. 3. Podejście oparte na ontologii (ontology-based approach). Podejście oparte na ontologii zakłada, że w trakcie analizy opinii dostępna jest wiedza na temat opisywanego produktu (elementów składowych i sposobu ich powiązania, cech opisujących najistotniejsze charakterystyki czy też realizowanych funkcji). Sformalizowany opis wiedzy dotyczącej produktu przybiera postać ontologii. W filozofii pojęcie ontologii odnosi się do nauki o bycie. Za prekursorów rozważań z tego zakresu uznaje się Parmenidesa z Etei, Platona i Arystotelesa. Natomiast samo
11 Analiza wydźwięku polskojęzycznych opinii konsumenckich 157 pojęcie ontologia zaistniało się w nauce w XVII w. Po raz pierwszy pojawiło się w pracy Jacobusa Lorhardusa w 1606 r. [Lorhardus 1606]. W niniejszej pracy termin ten używany jest w znaczeniu podanym przez T.R. Grubera, który określa ontologię jako jednoznacznie zdefiniowaną specyfikację konceptualizacji pewnego obszaru wiedzy [Gruber 1993]. Ontologia traktowana jest jako jedna z podstawowych metod reprezentacji wiedzy o charakterze dziedzinowym. Jej stosowanie wymaga zdefiniowania klas będących opisami typy obiektów występujących w rozpatrywanym wycinku rzeczywistości, powiązań pomiędzy klasami oraz obiektów (o strukturze opisanej przez zdefiniowane wcześniej klasy) reprezentujących elementy składające się na rozpatrywany fragment rzeczywistości. Nie ulega wątpliwości, że najistotniejszym pojęciem związanym z ontologiczną reprezentacją wiedzy jest klasa. Klasa reprezentuje dany rodzaj (typ) obiektów. Definiując klasę należy wskazać jej atrybuty (czyli cechy charakterystyczne) oraz charakterystyczne dla niej zachowania (czynności charakterystyczne dla danego typu obiektów lub stany, w których może się on znaleźć). Klasy są zwykle ze sobą powiązane, a istniejące związki najczęściej dotyczą relacji hierarchicznych i wskazują na klasę bazową i klasy potomne, będące szczególnymi przypadkami (uszczegółowieniem) klasy podstawowej. Obszerniejsze omówienie metod analizy opinii wykorzystujących ontologie zawarte jest w pracy [Wójcik, Tuchowski 2014]. 4. Podejście wykorzystujące uczenie maszynowe (machine learning approach). Podejście wykorzystujące uczenie maszynowe zakłada, że wiedza na temat badanego zjawiska pozyskiwana jest w wyniku analizy i uogólniania informacji opisujących kolejne jego realizacje. Najistotniejszą zaletą takiego podejścia jest możliwość zastąpienia wiedzy eksperckiej pozyskiwanej od człowieka wiedzą pozyskaną w wyniku eksploracji danych. Należy jednak również pamiętać o słabych stronach uczenia maszynowego: konieczności zgromadzenia dużej liczby przypadków uczących, złożoności obliczeniowej i konieczności doboru właściwego algorytmu pozyskiwania wiedzy. W pracy [Cambria i in. 2013] znaleźć można podobną klasyfikację podejść do automatycznej analizy opinii konsumentów. Koncentrując się na analizie ukierunkowanej na cechy produktu, można w niej zastosować trzy pierwsze podejścia. 3. Propozycja autorskiej metody analizy nacechowania opinii ukierunkowanych na cechy produktu Uprzednio przeprowadzone badania pokazały zalety oraz wady różnych podejść do automatycznej analizy wydźwięku polskojęzycznych opinii konsumentów ukierunkowanych na cechy produktu. Wyniki tych analiz skłoniły autorów do opracowania modelu, który będzie łączył w sobie różne podejścia, wykorzystując ich zalety dla większej efektywności podejścia mieszanego. W badaniach wykorzystano materiał
12 158 Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski badawczy zebrany na potrzeby wcześniejszych eksperymentów, aby wyniki były porównywalne. Celami prac były: 1) zaproponowanie algorytmu pozwalającego w sposób automatyczny określić nastawienie konsumentów do poszczególnych cech ocenianego produktu oraz do produktu jako całości. Przyjęto, że algorytm powinien wykorzystywać wiedzę dziedzinową określoną w postaci ontologii, ale jednocześnie nie powinien wymagać manualnego znakowania fragmentów tekstu odpowiadającym poszczególnym pojęciom zdefiniowanym w ontologii; 2) przeprowadzenie przykładowych badań przy wykorzystaniu zaproponowanej metody Zbiór opinii W badaniach empirycznych wykorzystano 737 opinii w formie pierwszej (wady, zalety, posumowanie). Opinie pochodziły z serwisu Ceneo.pl 2 i dotyczyły smartfonów Samsung Galaxy S II, S III, S4 oraz S5. Do każdej opinii dołączona była ocena punktowa w postaci gwiazdek w przedziale [0,5; 5] z krokiem 0,5. Opinie z serwisu internetowego zostały pobrane do bazy. Następnie z bazy danych zostały one wyeksportowane do plików tekstowych. Każda opinia została zapisana w osobnym pliku tekstowym Słowniki W badaniach empirycznych wykorzystano słowniki wyrazów pozytywnych i negatywnych utworzone w trakcie wcześniejszych badań [Wójcik, Tuchowski 2015]. Każdy ze słowników zawiera ok. 200 słów. Wyrazy w słownikach występują w wersji podstawowej (po redukcji do rdzenia). Słowniki przygotowano w dwóch wersjach: sentyment o wartości 1 dla słów pozytywnych i 1 dla negatywnych, sentyment dodatni dla słów pozytywnych i ujemny dla negatywnych, wartość zależy od siły nacechowania, wartości całkowite od 10 do 10 bez 0. W słownikach pominięto problematyczne słowa, takie jak: wysoki/niski, szybko/wolno, długo/krótko. Słowa te w zależności od kontekstu będą miały przeciwne nacechowanie Ontologia Na potrzeby badań utworzona została ontologia smartfonu. Przyjęto, że struktura telefonu opisana jest przez drzewo przedstawione na rys Dostęp r.
13 Analiza wydźwięku polskojęzycznych opinii konsumenckich 159
14 160 Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski 3.4. Algorytm Proponowany algorytm wykorzystuje: wiedzę dziedzinową opisującą strukturę opisywanego produktu w postaci ontologii, słownik nacechowania. Danymi przetwarzanymi przez algorytm są teksty zawierające opinie konsumenckie. Proponowany algorytm składa się z następujących kroków. Krok 1. Scalenie wszystkich analizowanych opinii w jeden dokument. Krok 2. Podział dokumentu zawierającego opinie na fragmenty. Podział dokonywany jest w miejscu wystąpienia separatora. W realizowanym eksperymencie przyjęto, że rolę separatora spełnia znak przejście do nowego akapitu oraz kropka kończąca zdania. Krok 3. Wstępne przetworzenie tekstu zawierającego opinie. Operacja ta obejmuje: przekształcenie wyrazów do formy podstawowej, zamianę wszystkich liter na małe, usunięcie znaków interpunkcyjnych i wyrazów o długości nie przekraczającej dwóch znaków, usunięcie wyrazów nieistotnych (na podstawie stoplisty), powiązanie pojęć pochodzących z ontologii z wyrazami wchodzącymi w skład badanego tekstu i odnoszącymi się do elementów telefonu (np. takie określenia, jak głośniki, głośnik czy głośniczki powiązano z elementem Speakers ). Krok 4. Utworzenie w obrębie każdego fragmentu tekstu (utworzonego w drugim kroku algorytmu) podłańcuchów o określonej długości, wykorzystując podejście oparte na przesuwnym oknie. W trakcie realizacji obliczeń zastosowano okno o szerokości trzech wyrazów, co doprowadziło do utworzenia trigramów. Krok 5. Na podstawie podłańcuchów utworzonych w poprzednim kroku tworzona jest macierz współwystępowania. Jest to macierz, której kolumny odpowiadają cechom produktu uwzględnionym w przyjętej ontologii opisującej opiniowany produkt, wiersze zaś odnoszą się do poszczególnych określeń występujących w słowniku nacechowania. Wartości macierzy wskazują ile razy w wyodrębnionych podłańcuchach występują łącznie odpowiadająca kolumnie cecha produktu i odpowiadające wierszowi określenie nacechowania. Krok 6. Realizacja obliczeń.
15 Analiza wydźwięku polskojęzycznych opinii konsumenckich 161 Produkt (N, Eval,NLocal, EvalLocal) Cecha 1 (N, Eval,NLocal, EvalLocal) Cecha 2 (N, Eval,NLocal, EvalLocal) Cecha N (N, Eval,NLocal, EvalLocal) Cecha... (NLocal, EvalLocal) Cecha... (NLocal, EvalLocal) Cecha... (NLocal, EvalLocal) Rys. 2. Drzewo prezentujące schemat obliczeń Źródło: opracowanie własne. Obliczenia wykonywane są w kolejności określonej przez strukturę drzewa opisującego oceniany produkt (rys. 2). W pierwszej kolejności następuje przejście po liściach drzewa. Dla każdego z nich wyznaczane są dwie wartości: NLocal zarejestrowana w macierzy współwystępowania liczba odwołań do cechy produktu reprezentowanej przez dany element ontologii, EvalLocal wyznaczona na podstawie opinii ocena i-tej cechy produktu będąca wartością z przedziału [ 1, +1]. Wartość ta obliczana jest według wzoru: N pos N neg pos pos neg neg w k l k wk l k k = 1 k = 1 EvalLocal i =, (1) N pos N neg pos pos neg neg max, wk l k wk l k k = 1 k = 1 gdzie: N pos, N neg liczby terminów występujących w słowniku terminów o nacechowaniu pozytywnym i słowniku wyrazów o nacechowaniu negatywnym; pos neg wk, w k to wartości nacechowania odpowiadające k-temu terminowi ze pos neg słownika nacechowania; lk, l k to liczba odwołań do k-tego terminu ze słownika nacechowania (pozytywnego lub negatywnego) występującego łącznie w podłańcuchach (krok 4) z odwołaniem do i-tej cechy produktu.
16 162 Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski Rys. 3. Wyniki obliczeń wydźwięku opinii o smartfonach Samsung Galaxy S ukierunkowanych na cechy produktu Źródło: opracowanie własne.
17 Analiza wydźwięku polskojęzycznych opinii konsumenckich 163 Następnie obliczenia prowadzone są dla wszystkich pozostałych węzłów. Oprócz wartości NLocal i EvalLocal obliczane są: N zarejestrowana w macierzy współwystępowania liczba odwołań do cechy produktu reprezentowanej przez rozpatrywany element ontologii i wszystkie elementy podrzędne (będące potomkami bezpośrednimi lub pośrednimi danego elementu), Eval należąca do przedziału [ 1, +1] ocena cechy produktu reprezentowanej przez rozpatrywany element ontologii liczona jako średnia ważona z wartości EvalLocal obliczonej dla bieżącego elementu i wartości EvalLocal wyznaczonych dla wszystkich bezpośrednich potomków elementu bieżącego. W charakterze wag wykorzystywane są wartości NLocal. Przedstawiony schemat postępowania powtarzany jest dla wszystkich węzłów wewnętrznych, w tym również dla elementu będącego korzeniem drzewa. Obliczone miary określają nastawienie autorów opinii do rozpatrywanej cechy produktu (wszystkie węzły z wyjątkiem korzenia) lub do produktu jako całości (korzeń drzewa). Wyznaczone mierniki należą do przedziału [ 1, +1]. Wartość ujemna wskazuje na ocenę negatywną, dodatnia zaś na pozytywną Wyniki analizy opinii dotyczących telefonów komórkowych Samsung Galaxy Obliczenia prowadzono według przedstawionego powyżej schematu. Wyniki zostały zaprezentowane na rys. 3. W celu ułatwienia interpretacji uzyskanych wyników oceny pozytywne zaznaczono kolorem zielonym, negatywne zaś kolorem czerwonym. Stopień wypełnienia komórek zawierających informację o liczebności jest proporcjonalny do liczby opinii, a tym samym określa zaufanie do wartości określającej ocenę danego aspektu produktu. 4. Zakończenie Na podstawie przeprowadzonych badań wydaje się, że podejście oparte na współwystępowaniu cech produktu i ich oceny pozwala zidentyfikować nastawienie użytkownika zarówno do produktu, jak i do jego składowych. Mimo uproszczenia modelu poprzez nieuwzględnienie wielu aspektów lingwistycznych opinii, uzyskane wyniki mogą mieć wartościowy charakter. Mogą również posłużyć do modyfikacji ontologii poprzez wskazanie cech niekomentowanych przez użytkowników oraz tych komentowanych najczęściej. Podejście wymaga dalszych badań związanych z właściwym doborem długości analizowanego podłańcucha tekstu i elementów rozdzielających fragmenty wypowiedzi.
18 164 Paweł Lula, Katarzyna Wójcik, Janusz Tuchowski Literatura Cambria E., Hussain A. 2012, Sentic Computing: Techniques, Tools, and Applications, google.pl/books?id=8dplz8kljrkc ( ). Cambria E., Schuller B., Xia Y., Havasi C New avenues in opinion mining and sentiment analysis, IEEE Intelligent Systems, vol. 28, no. 2, s , doi: /mis Das S., Chen M., 2001, Yahoo! for {Amazon}: Extracting market sentiment from stock message boards, [w:] Proceedings of the Asia Pacific Finance Association Annual Conference (APFA), vol. 33, Bangkok. Dave K., Lawrence S., Pennock D.M., 2003, Mining the peanut gallery: Opinion extraction and semantic classification of product reviews, [w:] Proceedings of the 12th International Conference on World Wide Web, ACM, New York, s , doi: / Esuli A., Sebastiani F., 2006, SENTIWORDNET: A Publicly Available Lexical Resource, [w:] Proceedings of the 5th Conference on Language Resources and Evaluation (LREC 06), s , Gruber T.R., 1993, A translation approach to portable ontology specifications, Knowledge Acquisition, vol. 5, no. 2, s Liu B., 2007, Web DataMining. Exploring Hyperlinks, Contents, and Usage Data, Springer-Verlag, Heidelberg Berlin. Liu B., 2010, Sentiment analysis and subjectivity, [w:] N. Indurkhya, F. Damerau (red.), Handbook of Natural Language Processing, Chapman & Hall/CRC Machine Learning & Pattern Recognition Series,,Chapman & Hall/CRC, t. 2, s Lorhardus J., 1606, Ogdoas Scholastica, continens Diagraphen Typicam artium: Grammatices (Latinae, Graecae), Logices, Rhetorices, Astronomices, Ethices, Physices, Metaphysices, seu Ontologia, Apud Georgium Straub, Sangalii. Lula P. Wójcik K., 2011, Sentiment analysis of consumer opinions written in Polish, Economics and Management, nr 16, s Nasukawa T., Yi J., 2003, Sentiment analysis: Capturing favorability using natural language processing, [w:] Proceedings of the 2nd International Conference on Knowledge Capture (K-CAP), ACM, New York, s Pang B., Lee L., 2008, Opinion mining and sentiment analysis, Foundations and Trends in Information Retrieval, vol. 2, no ½, s Pang B., Lee L., Vaithyanathan S., 2002, Thumbs Up? Sentiment Classification Using Machine Learning Techniques, Proceedings of EMNLP, s Turney P., 2002, Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews, Proceedings of the Association for Computational Linguistics (ACL), s Wójcik K., Tuchowski J., 2013, Sentiment analysis of opinions about hotels extracted from the Internet, [w:] P. Lula, B. Mikuła, A. Jaki (red.), Knowledge Economy Society. Global and Regional challenges of the 21st Century Economy, Foundation of the Cracow University of Economics, Kraków, s Wójcik K., Tuchowski J., 2014, Ontology based approach to sentiment analysis, [w:] P. Lula, T. Rojek (red.), Knowledge Economy Society. Contemporary Tools of Organisational Resources Management, Fundacja Uniwersytetu Ekonomicznego w Krakowie, Kraków, s Wójcik K., Tuchowski J., 2015, Wykorzystanie metody opartej na wzorcach w automatycznej analizie opinii konsumenckich, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 385, Taksonomia 25: Klasyfikacja i analiza danych teoria i zastosowania, s
Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji cha- rakteru opinii konsumenckich. 1 Wstęp
mgr Katarzyna Wójcik mgr Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji charakteru opinii konsumenckich. 1 Wstęp Analiza opinii
Dobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy
Katarzyna Wójcik, Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Dobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy Streszczenie. Analiza opinii
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
strona 1 / 12 Autor: Walesiak Marek Publikacje:
Autor: Walesiak Marek Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii i zastosowań metod taksonomicznych, s.
strona 1 / 11 Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje:
Autor: Walesiak Marek Subdyscyplina: Klasyfikacja i analiza danych Publikacje: 1. Autorzy rozdziału: Borys Tadeusz; Strahl Danuta; Walesiak Marek Tytuł rozdziału: Wkład ośrodka wrocławskiego w rozwój teorii
PROGRAM KONFERENCJI SKAD 2015
XXIV KONFERENCJA NAUKOWA SEKCJI KLASYFIKACJI I ANALIZY DANYCH PTS oraz XXIX KONFERENCJA TAKSONOMICZNA nt. Klasyfikacja i analiza danych teoria i zastosowania Gdańsk, 14-16 września 2015 13 WRZEŚNIA 2015,
Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis
Komitet Redakcyjny Andrzej Matysiak (przewodniczący), Tadeusz Borys, Andrzej Gospodarowicz, Jan Lichtarski, Adam Nowicki, Walenty Ostasiewicz, Zdzisław Pisz, Teresa Znamierowska Recenzenci Stefan Mynarski,
Ekonometria. Zastosowania Metod Ilościowych 30/2011
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2011 Ekonometria. Zastosowania Metod Ilościowych 30/2011 Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Available at:
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 385 Taksonomia 25 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
TRZYDZIEŚCI KONFERENCJI TAKSONOMICZNYCH KILKA FAKTÓW I REFLEKSJI 1 THIRTY TAXONOMIC CONFERENCES SOME FACTS AND REFLECTIONS
PRACE NAUKOWE UNIWERSYTETU EKONOMICZNEGO WE WROCŁAWIU RESEARCH PAPERS OF WROCŁAW UNIVERSITY OF ECONOMICS nr 468 2017 Taksonomia 28 ISSN 1899-3192 Klasyfikacja i analiza danych teoria i zastosowania e-issn
WYKAZ PRAC PUBLIKOWANYCH
Dr hab. Andrzej Bąk Prof. nadzw. AE WYKAZ PRAC PUBLIKOWANYCH I. Publikacje zwarte I.1. KsiąŜki 1. Walesiak M., Bąk A. [1997], Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu
WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską
Dr Marcin Pełka Uniwersytet Ekonomiczny we Wrocławiu Wydział Ekonomii, Zarządzania i Turystyki Katedra Ekonometrii i Informatyki WYKAZ PUBLIKACJI I. Artykuły Ia. Opublikowane przed obroną doktorską 1.
Spis treści. Wstęp... 9
Spis treści Wstęp.............................................................. 9 Małgorzata Rószkiewicz, Wizualizacja danych nominalnych oraz różnego typu danych porządkowych w procedurze skalowania optymalnego...
Ekonometria. Zastosowania metod ilościowych 18/2007
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2007 Ekonometria. Zastosowania metod ilościowych 18/2007 Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Available at:
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 396 Finanse i rachunkowość na rzecz zrównoważonego rozwoju odpowiedzialność, etyka, stabilność
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Latent Dirichlet Allocation Models and their Evaluation IT for Practice 2016
Latent Dirichlet Allocation Models and their Evaluation IT for Practice 2016 Paweł Lula Cracow University of Economics, Poland pawel.lula@uek.krakow.pl Latent Dirichlet Allocation (LDA) Documents Latent
SPRAWOZDANIA SPRAWOZDANIE Z XXIV KONFERENCJI NAUKOWEJ NT. KLASYFIKACJA I ANALIZA DANYCH TEORIA I ZASTOSOWANIA
PRZEGLĄD STATYSTYCZNY R. LXII ZESZYT 4 2015 SPRAWOZDANIA KRZYSZTOF JAJUGA 1, KRZYSZTOF NAJMAN 2, MAREK WALESIAK 3 SPRAWOZDANIE Z XXIV KONFERENCJI NAUKOWEJ NT. KLASYFIKACJA I ANALIZA DANYCH TEORIA I ZASTOSOWANIA
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.
STRESZCZENIE rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. Zasadniczym czynnikiem stanowiącym motywację dla podjętych w pracy rozważań
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
Krytyczne czynniki sukcesu w zarządzaniu projektami
Seweryn SPAŁEK Krytyczne czynniki sukcesu w zarządzaniu projektami MONOGRAFIA Wydawnictwo Politechniki Śląskiej Gliwice 2004 SPIS TREŚCI WPROWADZENIE 5 1. ZARZĄDZANIE PROJEKTAMI W ORGANIZACJI 13 1.1. Zarządzanie
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics Nr 427 Taksonomia 27 Klasyfikacja i analiza danych teoria i zastosowania Wydawnictwo Uniwersytetu
WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
Semantyczne podobieństwo stron internetowych
Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej Adam Żychowski Definicja problemu Każdy z obiektów może należeć do więcej niż jednej kategorii. Alternatywna definicja Zastosowania
Zagadnienia (1/3) Data-flow diagramy przepływów danych ERD diagramy związków encji Diagramy obiektowe w UML (ang. Unified Modeling Language)
Zagadnienia (1/3) Rola modelu systemu w procesie analizy wymagań (inżynierii wymagań) Prezentacja różnego rodzaju informacji o systemie w zależności od rodzaju modelu. Budowanie pełnego obrazu systemu
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka
Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka L.p. Nazwisko i imię studenta Promotor Temat pracy magisterskiej 1. Wojciech Kłopocki dr Bartosz Ziemkiewicz Automatyczne
EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa
, semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu
Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce
Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce Mgr inż. Agata Binderman Dzienne Studia Doktoranckie przy Wydziale Ekonomiczno-Rolniczym Katedra Ekonometrii i Informatyki SGGW Opiekun
Ewa Pancer-Cybulska, tukasz Olipra, Leszek Cybulski, Agata Suröwka TRANSPORT LOTNICZY A REGIONALNE RYNKI PRACY W POLSCE THE IMPACT OF AIR TRANSPORT
Ewa Pancer-Cybulska, tukasz Olipra, Leszek Cybulski, Agata Suröwka TRANSPORT LOTNICZY A REGIONALNE RYNKI PRACY W POLSCE THE IMPACT OF AIR TRANSPORT ON REGIONAL LABOUR MARICETS IN POLAND jt^l Wydawnictwo
Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć zorganizowanych w
WYDZIAŁ MATEMATYKI KARTA PRZEDMIOTU Nazwa w języku polskim: Analiza danych ankietowych Nazwa w języku angielskim: Categorical Data Analysis Kierunek studiów (jeśli dotyczy): Matematyka stosowana Specjalność
IMPLEMENTATION AND APLICATION ASPECTS OF SUSTAINABLE DEVELOPMENT. Scientific monograph edited by Edyta Sidorczuk Pietraszko
IMPLEMENTATION AND APLICATION ASPECTS OF SUSTAINABLE DEVELOPMENT Scientific monograph edited by Edyta Sidorczuk Pietraszko SPIS TREŚCI WSTĘP Edyta Sidorczuk Pietraszko... 9 Rozdział 1. Metody pomiaru zrównoważonego
Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling
Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Ontologie, czyli o inteligentnych danych
1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
Taksonomia 29 Klasyfikacja i analiza danych teoria i zastosowania
Taksonomia 29 Klasyfikacja i analiza danych teoria i zastosowania RADA NAUKOWA Daniel Baier (Universität Bayreuth, Niemcy) Andrzej Bąk (Uniwersytet Ekonomiczny we Wrocławiu) Małgorzata Teresa Domiter (Uniwersytet
Katedra Demografii i Statystki Ekonomicznej
Katedra Demografii i Statystki Ekonomicznej Wydział Informatyki i Komunikacji http://www.ue.katowice.pl/jednostki/katedry/katedry-wiik/ Skład osobowy Katedry Pracownicy: prof. zw. dr hab. Grażyna Trzpiot
INFORMATYKA EKONOMICZNA
INFORMATYKA EKONOMICZNA BUSINESS INFORMATICS 3 (41) 2016 RADA NAUKOWA Frederic Andres (National Institute of Informatics, Japonia) Dimitar Christozov (American University in Bulgaria, Bułgaria) Jerzy Gołuchowski
Formularz recenzji magazynu. Journal of Corporate Responsibility and Leadership Review Form
Formularz recenzji magazynu Review Form Identyfikator magazynu/ Journal identification number: Tytuł artykułu/ Paper title: Recenzent/ Reviewer: (imię i nazwisko, stopień naukowy/name and surname, academic
SATYSFAKCJA KLIENTÓW SKLEPÓW SPOŻYWCZYCH FUNKCJONUJĄCYCH W SIECI HANDLOWEJ - BADANIA ANKIETOWE
Anna Kasprzyk Mariusz Giemza Katedra Zarządzania Jakością Uniwersytet Ekonomiczny w Krakowie SATYSFAKCJA KLIENTÓW SKLEPÓW SPOŻYWCZYCH FUNKCJONUJĄCYCH W SIECI HANDLOWEJ - BADANIA ANKIETOWE Wprowadzenie
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze
Barbara Batóg Jacek Batóg Uniwersytet Szczeciński Badanie zróżnicowania krajów członkowskich i stowarzyszonych Unii Europejskiej w oparciu o wybrane zmienne społeczno-gospodarcze W 2004 roku planowane
KLASYFIKACJA OBIEKTÓW W SYSTEMIE KRAJOWYCH RAM KWALI- FIKACJI OPISANYCH ZA POMOCĄ ONTOLOGII
Janusz Tuchowski, Katarzyna Wójcik Uniwersytet Ekonomiczny w Krakowie KLASYFIKACJA OBIEKTÓW W SYSTEMIE KRAJOWYCH RAM KWALI- FIKACJI OPISANYCH ZA POMOCĄ ONTOLOGII Streszczenie. W artykule podjęto się próby
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
ŚLĄSKI PRZEGLĄD STATYSTYCZNY
Polskie Towarzystwo Statystyczne Oddział we Wrocławiu ŚLĄSKI Silesian Statistical Review Nr 8 (14) Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu Wrocław 2o10 RADA PROGRAMOWA Walenty Ostasiewicz (przewodniczący),
Ekonometria. Modele regresji wielorakiej - dobór zmiennych, szacowanie. Paweł Cibis pawel@cibis.pl. 1 kwietnia 2007
Modele regresji wielorakiej - dobór zmiennych, szacowanie Paweł Cibis pawel@cibis.pl 1 kwietnia 2007 1 Współczynnik zmienności Współczynnik zmienności wzory Współczynnik zmienności funkcje 2 Korelacja
1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Agnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
ANALIZA DANYCH ZE ŹRÓDEŁ OTWARTYCH CENNE ŹRÓDŁO INFORMACJI DR INŻ. MARIUSZ DZIECIĄTKO
ANALIZA DANYCH ZE ŹRÓDEŁ OTWARTYCH CENNE ŹRÓDŁO INFORMACJI DR INŻ. MARIUSZ DZIECIĄTKO Copyrigh t 2013, SAS Institute Inc. All rights reserve d. POLSKI INTERNET W LICZBACH 56% korzysta z Internetu co najmniej
Opisy przedmiotów do wyboru
Opisy przedmiotów do wyboru moduły specjalistyczne oferowane na stacjonarnych studiach II stopnia (magisterskich) dla 2 roku matematyki semestr letni, rok akademicki 2017/2018 Spis treści 1. Data mining
Wyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
w ekonomii, finansach i towaroznawstwie
w ekonomii, finansach i towaroznawstwie spotykane określenia: zgłębianie danych, eksploracyjna analiza danych, przekopywanie danych, męczenie danych proces wykrywania zależności w zbiorach danych poprzez
ZASTOSOWANIE METOD OPTYMALIZACJI W DOBORZE CECH GEOMETRYCZNYCH KARBU ODCIĄŻAJĄCEGO
MODELOWANIE INŻYNIERSKIE ISSN 1896-771X 40, s. 43-48, Gliwice 2010 ZASTOSOWANIE METOD OPTYMALIZACJI W DOBORZE CECH GEOMETRYCZNYCH KARBU ODCIĄŻAJĄCEGO TOMASZ CZAPLA, MARIUSZ PAWLAK Katedra Mechaniki Stosowanej,
Ontology-based system of job offers analysis
Cracow University of Economics, Poland Ontology-based system of job offers analysis IT for Practice 2018 VSB-Technical University Ostrava, October, 17 th, 2018 Goal Goal of the research: design and implementation
Analiza wybranych aspektów wyników egzaminu gimnazjalnego
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2012 Analiza wybranych aspektów wyników egzaminu gimnazjalnego Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Agnieszka
Imię/Imiona Nazwisko/a afiliacja Tytuł referatu Publikacja Temat sesji Numer sesji
Imię/Imiona Nazwisko/a afiliacja Tytuł referatu Publikacja Temat sesji Numer sesji czas Krzysztof Jajuga e Krystyna Magdalena Mazurek- Łopacińska Sobocińska e Stanisław Kaczmarczyk Mikołaja Kopernika Big
Badania eksperymentalne
Badania eksperymentalne Analiza CONJOINT mgr Agnieszka Zięba Zakład Badań Marketingowych Instytut Statystyki i Demografii Szkoła Główna Handlowa Najpopularniejsze sposoby oceny wyników eksperymentu w schematach
Uchwała Senatu Uniwersytetu Kazimierza Wielkiego. Nr 62/2015/2016. z dnia 26 kwietnia 2016 r.
Uchwała Senatu Uniwersytetu Kazimierza Wielkiego Nr 62/2015/2016 z dnia 26 kwietnia 2016 r. w sprawie określenia zakładanych efektów kształcenia dla kierunku studiów geografia studia pierwszego stopnia,
Nazwa przedmiotu. I. Informacje podstawowe. Wydział: Wydział Zarządzania Kierunek: Zarządzanie. Nazwa przedmiotu w j. ang.
Karta przedmiotu Wydział: Wydział Zarządzania Kierunek: Zarządzanie I. Informacje podstawowe Nazwa przedmiotu Nazwa przedmiotu w j. ang. Język prowadzenia przedmiotu polski /Specjalność WZ-ZA-ZZ-X2-17/18Z-STAPAC
Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska
Algorytmy rozpoznawania obrazów 11. Analiza skupień dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Analiza skupień Określenia: analiza skupień (cluster analysis), klasteryzacja (clustering), klasyfikacja
UNIA EUROPEJSKA PERSPEKTYWY SPOŁECZNO-EKONOMICZNE ROCZNIK NAUKOWY 2/2010
UNIA EUROPEJSKA PERSPEKTYWY SPOŁECZNO-EKONOMICZNE ROCZNIK NAUKOWY 2/2010 PRZYGOTOWANY PRZY WSPÓŁPRACY PUNKTU INFORMACYJNEGO KOMISJI EUROPEJSKIEJ EUROPE DIRECT INOWROCŁAW ORAZ WYDZIAŁU EKONOMICZNO-SPOŁECZNEGO
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Analiza porównawcza odczuć satysfakcji zawodowej. Polska na tle wybranych krajów Unii Europejskiej
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2007 Analiza porównawcza odczuć satysfakcji zawodowej. Polska na tle wybranych krajów Unii Europejskiej Jozef Z. Dziechciarz,
Elementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Wstęp... 9. Część 1. Systemy informacyjne zarządzania
Spis treści Wstęp... 9 Część 1. Systemy informacyjne zarządzania Jarosław Becker, Monika Stankiewicz, Koncepcja systemu CRM na potrzeby analizy preferencji klientów przedsiębiorstwa... 13 Andrzej Chluski,
Cracow University of Economics Poland
Cracow University of Economics Poland Sources of Real GDP per Capita Growth: Polish Regional-Macroeconomic Dimensions 2000-2005 - Keynote Speech - Presented by: Dr. David Clowes The Growth Research Unit,
Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania
Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
WSPÓŁCZESNE KONCEPCJE ZARZĄDZANIA PRZEDSIĘBIORSTWEM
1 Politechnika Częstochowska Wydział Zarządzania WSPÓŁCZESNE KONCEPCJE ZARZĄDZANIA PRZEDSIĘBIORSTWEM Monografia redakcja naukowa Oksana SEROKA-STOLKA Częstochowa 2014 2 Recenzenci: Prof. PCz dr hab. Agata
Wykaz prac złożonych do druku, przyjętych do druku lub opublikowanych w wyniku realizacji projektu
Wykaz prac złożonych do druku, przyjętych do druku lub opublikowanych w wyniku realizacji projektu Publikacje w czasopismach Podstawy teoretyczne sieci 43 2013 47-58 brak https://ekonom.ug.edu.pl/web/download.php?openfile=1181
METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH
Marcin Pełka Akademia Ekonomiczna we Wrocławiu METODY SKALOWANIA WIELOWYMIAROWEGO OBIEKTÓW SYMBOLICZNYCH 1. Wprowadzenie Metody skalowania wielowymiarowego obiektów symbolicznych, podobnie jak w przypadku
Taksonomia 21. Klasyfikacja i analiza danych teoria i zastosowania. Krzysztof Jajuga Marek Walesiak
PRACE NAUKOWE Uniwersytetu Ekonomicznego we Wrocławiu RESEARCH PAPERS of Wrocław University of Economics 279 Taksonomia 21 Klasyfikacja i analiza danych teoria i zastosowania Redaktorzy naukowi Krzysztof
Metody analizy przestrzennej. Liczba godzin stacjonarne: Wykłady: 30 Ćwiczenia: 30. niestacjonarne: Wykłady: 18 Ćwiczenia: 18
Karta przedmiotu Wydział: Wydział Finansów Kierunek: Gospodarka przestrzenna I. Informacje podstawowe Nazwa przedmiotu Metody analizy przestrzennej Nazwa przedmiotu w j. ang. Język prowadzenia przedmiotu
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA SYSTEMY ROZMYTE Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium
GML w praktyce geodezyjnej
GML w praktyce geodezyjnej Adam Iwaniak Kon-Dor s.c. Konferencja GML w praktyce, 12 kwietnia 2013, Warszawa SWING Rok 1995, standard de jure Wymiany danych pomiędzy bazami danych systemów informatycznych
Wykład z dnia 8 lub 15 października 2014 roku
Wykład z dnia 8 lub 15 października 2014 roku Istota i przedmiot statystyki oraz demografii. Prezentacja danych statystycznych Znaczenia słowa statystyka Znaczenie I - nazwa zbioru danych liczbowych prezentujących
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU
Zał. nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim STATYSTYCZNA ANALIZA DANYCH Nazwa w języku angielskim STATISTICAL DATA ANALYSIS Kierunek studiów (jeśli dotyczy):
TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction
TTIC 31210: Advanced Natural Language Processing Kevin Gimpel Spring 2019 Lecture 9: Inference in Structured Prediction 1 intro (1 lecture) Roadmap deep learning for NLP (5 lectures) structured prediction
CLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
HARMONIZACJA DANYCH PRZESTRZENNYCH JERZY GAŹDZICKI
HARMONIZACJA DANYCH PRZESTRZENNYCH JERZY GAŹDZICKI PODSTAWOWE POJĘCIA (1) 1. Dane przestrzenne (dane geoprzestrzenne) dane bezpośrednio lub pośrednio odniesione do określonego położenia lub obszaru geograficznego
strona 1 / 5 Specjalizacja: B4. Analiza kointegracyjna Publikacje:
Specjalizacja: B4. Analiza kointegracyjna Publikacje: 1. Autorzy: Grabowski Wojciech; Welfe Aleksander Tytuł: Global Stability of Dynamic Models Strony: 782-784 - Teoria ekonometrii (B1. Makroekonometria)
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Anna Osiewalska Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie
Anna Osiewalska Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie Bibliografie czasopism naukowych Biblioteki Głównej UEK jako źródło danych dla analiz bibliometrycznych Streszczenie Przedstawiono
Komisja Krajobrazu Kulturowego Polskiego Towarzystwa Geograficznego. Cultural Landscape Commission of Polish Geographical Society.
Komisja Krajobrazu Kulturowego Polskiego Towarzystwa Geograficznego Cultural Landscape Commission of Polish Geographical Society PRACE KOMISJI KRAJOBRAZU KULTUROWEGO DISSERTATIONS OF CULTURAL LANDSCAPE
dr Anna Matuszyk PUBLIKACJE: CeDeWu przetrwania w ocenie ryzyka kredytowego klientów indywidualnych Profile of the Fraudulelent Customer
dr Anna Matuszyk PUBLIKACJE: Lp. Autor/ red. 2015 naukowy 1 A. Matuszyk, Zastosowanie analizy przetrwania w ocenie ryzyka kredytowego klientów indywidualnych Tytuł Okładka CeDeWu 2 A.Matuszyk, A. Ptak-Chmielewska,
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe