Studia Podyplomowe Metody statystyczne w biznesie. Warsztaty z oprogramowaniem SAS Analiza danych nieustrukturyzowanych: Text Mining



Podobne dokumenty
Studia Podyplomowe Metody statystyczne w biznesie. Warsztaty z oprogramowaniem SAS Analiza danych nieustrukturyzowanych: Text Mining

Szkolenia SAS Cennik i kalendarz 2017

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

ANALIZA DANYCH ZE ŹRÓDEŁ OTWARTYCH CENNE ŹRÓDŁO INFORMACJI DR INŻ. MARIUSZ DZIECIĄTKO

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO

Mariusz Dzieciątko. Krótko o sobie / Personal Overview/

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

Bartłomiej Graczyk MCT,MCITP,MCTS

RAPORT PŁACOWY Podsumowanie 2014

Office Synchronizer. Informacje o wersji. Wersja 1.66

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

Analityka predykcyjna w marketingu i sprzedaży

Office Synchronizer Informacje o wersji. Wersja 1.61

PERFORMANCE POINT SERVICE NIE TYLKO DLA ORŁÓW

ESI[tronic] Info 2008/3

{LINGO} Specyfikacja produktu. - Wymiary: 61x18x8mm. - waga: 8,6 g. - zasięg: 10m. - pojemność i typ baterii: 90mAh, polimerowa bateria litowa

W biurowcu Nowa Fabryczna działa już centrum finansowe firmy Whirlpool

dla Klientów Kontakt Skype:

ANALITYKA DANYCH TEKSTOWYCH WARTOŚĆ W DANYCH NIEUSTRUKTURYZOWANYCH. MOŻLIWOŚCI OBECNEJ TECHNOLOGII. DOŚWIADCZENIA Z RYNKU

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 4 Performance Point Services Bartłomiej Graczyk

Learn SAS. Training Certification Coaching. Grow With Us. Szkolenia Certyfikaty Mentoring Analiza potrzeb szkoleniowych

Portale raportowe, a narzędzia raportowe typu self- service

!!!!!!!!!! WNIOSEK O PORTFOLIO:

Analiza danych i data mining.

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

DOSTAWA KONCENTRATORÓW SIECIOWYCH ORAZ URZĄDZENIA IPAD NA POTRZEBY SĄDU OKRĘGOWEGO W SZCZECINIE

AquaLingua PORADNIK UŻYTKOWNIKA

Imagination Is More Important Than Knowledge

Ekran główny lista formularzy

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

Podręcznik instalacji

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

SKANERY WIZYTÓWEK. SKANERY wizytówek WORLDCARD - Idealne RozwiĄzanie dla Ciebie. WorldCard OFFICE

SAS Lineage. zależności między obiektami w środowisku SAS, perspektywa techniczna i biznesowa

Szybkość instynktu i rozsądek rozumu$

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Analityka i BigData w służbie cyberbezpieczeństa

Wyszukiwarka Google w witrynie Technologia Google, która pozwala przeszukiwać witrynę Twojej firmy

gvsig jako przykład desktopowego klienta usług sieciowych OGC

SAS ENTERPRISE MINER JAKO NARZĘDZIE ANALITYKA MARIUSZ DZIECIĄTKO

Nowoczesne narzędzia do ochrony informacji. Paweł Nogowicz

EKSPLORACJA DANYCH TEKSTOWYCH (TEXT MINING) W PRZEDSIĘBIORSTWIE (TEXT MINING METHODS AND APPLICATIONS IN THE ENTERPRISE)

StatSoft profesjonalny partner w zakresie analizy danych

Portal e-learningowy zaprojektowany dla Studentów i Nauczycieli

M400 M430 M600. Funkcje Smart Coaching. Fitness Test. Licznik kalorii. Obciążenie treningowe. Podusmowanie aktywności. Program treningu biegowego

Zastosowania narzędzi analitycznych w komunikacji społecznej

OGŁOSZENIE O DIALOGU TECHNICZNYM

SCS Data Manager. Informacje o wersji. Wersja 3.00

CZĘŚĆ I ZASTOSOWANIE PROGRAMU EXCEL DO ANALIZ BUSINESS INTELLIGENCE

PRAKTYCZNE WYKORZYSTANIE KATEGORYZACJI TREŚCI

Widzenie komputerowe (computer vision)

Konferencja. Business Intelligence Trends 24 czerwca 2014 r.

Usługi IBM czyli nie taki diabeł straszny

Semantyczna analiza języka naturalnego

Kurs Cisco CCNA Routing & Switching

Narzędzia IT we współczesnych strategiach utrzymaniowych

Studia Podyplomowe Metody statystyczne w biznesie. Warsztaty z oprogramowaniem SAS Analiza danych nieustrukturyzowanych: Text Mining

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Rozwiązania rekrutacyjne dla firm. Copyright 2015 EFFECTIVENESS Sp.zo.o. All rights reserved.

Instrukcja. 2. Zaloguj się na stronie: => Login => RESEARCHconnect International users => Login now

STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA

REAL TIME BUSINESS INTELLIGENCE REALNY ROZWÓJ BIZNESU. STUDIUM PRZYPADKU W OBSZARZE MARKETINGU RADOSŁAW GRABIEC SAS INSTITUTE

BEYOND: Dwie Dusze Aplikacja BEYOND Touch

Zarządzanie wiedzą w instytucji naukowej cz. I

Część I Rozpoczęcie pracy z usługami Reporting Services

ZROZUMIEĆ MIŁOŚNIKÓW NATURY

IBM Business Analytics

CENNIK USŁUG. BIURO TŁUMACZEŃ ALPHA

Business Intelligence narzędziem wsparcia sprzedaży

Wersja polska. Wstęp. Instalacja software. MP508FMV2 Sweex Black Onyx MP4 Player

Praca grupowa inaczej Lotus w modelu SaaS Maciej Magierek Lotus Software Sales Specialist

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

Proces certyfikowania aplikacji na platformie PureSystems. Rafał Klimczak Lab Services Consultant

Tematy prac dyplomowych inżynierskich

Kapitał ludzki w Polsce a Centra BPO. Przygotowana przez: Marek Wróbel Warszawa, 28 października 2008 r.

w ekonomii, finansach i towaroznawstwie

Podręcznik instalacji Command WorkStation 5.6 z aplikacjami Fiery Extended Applications 4.2

Kierunek: Informatyka Społeczna Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

VESA Inteligentny asystent diagnostyki układów elektronicznych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

CENNIK USŁUG PROMOCJA!!! TŁUMACZENIA PISEMNE ZWYKŁE

Baza Danych Ubezpieczeniowych UFG zastosowanie w przeciwdziałaniu przestępczości ubezpieczeniowej

seco TO DLA NAS PRACUJĄ NAJLEPSI TŁUMACZE CENNIK SZCZEGÓŁOWY. Mamy dla Ciebie miłą obsługę, wysoką jakość i niskie ceny.

seco TO DLA NAS PRACUJĄ NAJLEPSI TŁUMACZE CENNIK SZCZEGÓŁOWY. Mamy dla Ciebie miłą obsługę, wysoką jakość i niskie ceny.

Wskaźnik Trading Central BReTRADER

ZASOBY INFORMACYJNE - INACZEJ

ZNACZENIE WYMIANY DANYCH MIĘDZY BIK i UFG DLA BEZPIECZEŃSTWA TRANSAKCJI UBEZPIECZENIOWO-BANKOWYCH. dr Mariusz Cholewa Prezes Zarządu BIK S.A.

Edukacja akademicka z wykorzystaniem narzędzi SAS

Ewelina Dziura Krzysztof Maryański

Wprowadzenie do SAS. Wprowadzenie. Historia SAS. Struktura SAS 8. Interfejs: SAS Explorer. Interfejs. Część I: Łagodny wstęp do SAS Rafał Latkowski

SPOTKANIE 2: Wprowadzenie cz. I

Specjalnościowy Obowiązkowy Polski Semestr VI

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

MIKROFINANSE W EUROPIE. Podsumowanie wyników badania instytucji członkowskich EMNi MFC

TOPWEB Microsoft Excel 2013 i PowerBI Przygotowanie danych, analiza i efektowna prezentacja wyników raportów

Cennik badań. Od 400 zł/godzina

Zapytanie ofertowe nr 1/11/2013 na wykonanie dedykowanego oprogramowania

Transkrypt:

Analiza danych nieustrukturyzowanych: Text Mining Wydział Nauk Ekonomicznych Uniwersytet Warszawski

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Inne aplikacje (analiza sentymentu) 2) Aplikacje open source Część 3 Dostępne narzędzia Text Mining

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Inne aplikacje (analiza sentymentu) 2) Aplikacje open source Część 3 Dostępne narzędzia Text Mining

Zintegrowane aplikacje analityczne SAS Text Miner IBM SPSS Modeler Text Analytics STATISTICA Text Miner Provalis Research WordStat Megaputer TextAnalyst 173

Firma: SAS Produkt: SAS Text Miner

SAS Text Miner http://support.sas.com/documentation/onlinedoc/txtminer/ 175

Obsługiwane języki SAS Text Miner prowadzi analizę nieustrukturyzowanych dokumentów w językach europejskich: angielski, holenderski, francuski, niemiecki, włoski, portugalski, hiszpański, szwedzki, polski oraz: japoński, koreański, uproszczony chiński, tradycyjny chiński, arabski 176

Obsługiwane funkcje szukanie rdzenia wyrazów automatyczne rozpoznawanie terminów wielowyrazowych standaryzacja wyrażeń takich jak data, godzina, waluta, procenty wydobywanie niestandardowych wyrażeń (nazwy organizacji, produkty, tytuły itp.) etykietowanie części mowy rozpoznawanie synonimów 177

Zastosowania filtrowanie wiadomości e-mail grupowanie dokumentów według tematu w określone kategorie wyszukiwanie w tekście nowych informacji analiza klastrów w dokumentach naukowych analiza klastrów danych ankietowych analiza klastrów w skargach, komentarzach i zażaleniach klientów 178

SAS Text Analytics 179

SAS Content Categorization 180

SAS Social Media Analytics 181

SAS Social Media Analytics 182

SAS Social Media Analytics social forecast 183

SAS Social Media Analytics sentiment by time 184

SAS Social Media Analytics media workbench 185

SAS Social Media Analytics fraud framework 186

Success stories Maspex Wadowice Group Parks Division of Alberta Tourism, Parks and Recreation https://www.sas.com/en_us/customers/alberta-parks.html Hong Kong government's Efficiency Unit https://www.sas.com/en_us/customers/maspex-wadowicegroup.html https://www.sas.com/en_us/customers/hong-kong-efficiencyunit-visual-analytics.html 187

Success stories Sub-Zero and Wolf Appliance http://www.sas.com/en_us/news/pressreleases/2014/march/sub-zero-warranty-analytics-award.html Hewlett-Packard http://www.sas.com/en_us/customers/hp.html Whirlpool http://www.sas.com/success/pdf/whirlpool.pdf 188

Firma: IBM SPSS Produkt: IBM SPSS Modeler Text Analytics

IBM SPSS Modeler Text Analytics http://www-01.ibm.com/software/analytics/spss/ 190

Wspierane natywnie Obsługiwane języki angielski, francuski, hiszpański, holenderski, niemiecki, włoski, portugalski, japoński Wspierane przez moduł tłumaczeniowy Language Translation Interface arabski, chiński, hindi, perski, rumuński, rosyjski, somalijski, szwedzki 191

Zastosowania Analiza wzorców w tekstach i powiązań między tekstami Analiza pytań otwartych w ankietach Klasteryzacja, kategoryzacja Modelowanie predykcyjne 192

What do you like most about this portable music player? /categories 193

What do you like most about this portable music player? / concept map 194

What do you like most about this portable music player? / positive 195

What do you like least about this portable music player? / negative 196

Customer service / text link analysis 197

What factors influence your decision to choose a car rental company for business? 198

Sentiment Analysis 199

Success stories Socio Logiciels http://www- 03.ibm.com/software/businesscasestudies/us/en/corp?synkey=C6 76775B74434A23 BMW Group http://www- 03.ibm.com/software/businesscasestudies/us/en/corp?synkey=C8 32269U02087M63 200

Success stories Woonbedrijf SWS http://www- 03.ibm.com/software/businesscasestudies/us/en/corp?synkey=Y1 64052G07720B64 Hamilton County Department of Education http://www- 03.ibm.com/software/businesscasestudies/us/en/corp?synkey=T4 06213A14992E19 201

Firma: StatSoft Produkt: STATISTICA Text Miner

STATISTICA Text Miner http://www.statsoft.pl/programy/statistica-text-miner 203

Wspierane natywnie Obsługiwane języki duński, holenderski, angielski, francuski, niemiecki, włoski, portugalski, hiszpański, szwedzki 204

Obsługiwane funkcje szukanie rdzenia wyrazów pomijanie nieistotnych słów transformacja i redukcja wymiarów analiza dokumentów podsumowania mapy podobieństw analiza skupień (metody EM i k-średnich) predykcyjny text mining 205

Zastosowania Analiza dużych zbiorów dokumentów tekstowych grupowanie dokumentów w określone kategorie wyszukiwanie w tekście nowych informacji Analiza treści stron WWW, portali internetowych i grup dyskusyjnych Prognozowanie 206

Accident reports 207

Credit scoring 208

Success stories Biuro Ubezpieczycieli Czeskich http://www.statsoft.pl/portals/0/downloads/success_stories/ckp_ wykorzystuje_statistica_enterprise_text_miner.pdf Analiza opisów roszczeń ubezpieczeniowych przewidywanie ryzyka wystąpienia wysokich roszczeń z tytułu uszczerbku na zdrowiu dokładniejsze szacowanie łącznej wartości odszkodowania z tytułu OC na wczesnym etapie rozpatrywania danej sprawy 209

Firma: Provalis Research Produkt: WordStat

Provalis Research WordStat http://provalisresearch.com/products/content-analysis-software/ 211

Wspierane natywnie Obsługiwane języki angielski, francuski, hiszpański, niemiecki, włoski, portugalski 212

Obsługiwane funkcje analiza wyszukanego tekstu i wizualizacja wyszukiwanie słowa kluczowego i słowa kluczowego w kontekście identyfikacja powiązanych segmentów tekstu grupowanie i analiza korespondencyjna wyrażeń klasteryzacja automatyczna klasyfikacja tekstu krzyżowanie dwóch zmiennych 213

Zastosowania analiza zawartości zamkniętych/otwartych zapytań w formularzach, kwestionariuszach wydobywanie informacji ze sprawozdań i raportów wydarzeń analiza nowych informacji w literaturze naukowej i sprawozdaniach wykrywanie nieprawidłowości i oszustw identyfikacja autorstwa i analiza patentowa analiza stron WWW 214

Keyword retrieval 215

Keyword distribution 216

Bubble chart 217

Dendogram 218

2D concept map 219

3D concept map 220

Proximity plot 221

Success stories JetBlue Airways Cornell University School of Hotel Administration Center for Business Performance http://provalisresearch.com/solutions/case-studies/application-oftext-mining-to-aviation-safety-data/ http://provalisresearch.com/solutions/case-studies/contentanalysis-of-hotel-customer-satisfaction/ http://provalisresearch.com/solutions/case-studies/mesuringdisclosure-of-intangible-resources-in-corporate-annual-reports/ 222

Firma: Megaputer Produkt: TextAnalyst

Megaputer TextAnalyst http://megaputer.com/site/textanalyst.php 224

Wspierane natywnie angielski Obsługiwane języki 225

tworzenie list synonimów klasteryzacja Obsługiwane funkcje kategoryzacja dokumentów wydobywanie niestandardowych wyrażeń wizualizacja powiązań między dokumentami a słowami analiza powiązań stron WWW 226

Zastosowania identyfikacja słów kluczowych automatyczne generowanie streszczeń tematyczna eksploracja tekstu wykrywanie nieprawidłowości generowanie interaktywnych raportów prognozowanie 227

Keyword extraction - medical records 228

Topic detection - medical records 229

Link chart crime reports 230

Correlation diagram crime reports 231

Success stories e-complaints from e-auction Store http://cluteonline.com/journals/index.php/jber/article/view/2286 Crime reports analysis http://www.megaputer.com/site/success_stories.php Government agency http://www.megaputer.com/site/success_stories.php 232

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Inne aplikacje (analiza sentymentu) 2) Aplikacje open source Część 3 Dostępne narzędzia Text Mining

Inne aplikacje (analiza sentymentu) Attensity Analyze www.attensity.com Clarabridge Analyze www.clarabridge.com 234

Firma: Attensity Produkt: Attensity Analyze

Attensity Analyze http://www.attensity.com/attensity-analyze 236

Overall sentiment - social media 237

Top compliments - social media 238

Top complaints - social media 239

Conversation spikes - social media 240

Success stories Neiman Marcus http://textanalyticsnews.com/social-mediaanalytics/presentations/day2/neiman-marcus.pdf Fraud detection in Financial Services http://communications.attensity.com/acton/fs/blocks/showlandin gpage/a/10059/p/p-007e/t/page/fm/0 Text mining in telecommunications enterprise http://communications.attensity.com/acton/fs/blocks/showlandin gpage/a/10059/p/p-00e5/t/page/fm/0 241

Firma: Clarabridge Produkt: Clarabridge Analyze

Clarabridge Analyze http://www.clarabridge.com/wpcontent/uploads/2014/11/clarabridge_6-3_datasheet.pdf 243

Overall sentiment - hotels 244

Category volume report - hotels 245

Motion chart - hotels 246

Success stories Red Roof Inn http://www.clarabridge.com/case_study/red-roof-inn/ Sage Software http://www.clarabridge.com/case_study/sage-software/ B/E Aerospace http://www.clarabridge.com/case_study/be-aerospace/ 247

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Inne aplikacje (analiza sentymentu) 2) Aplikacje open source Część 3 Dostępne narzędzia Text Mining

Aplikacje open source GATE http://gate.ac.uk/ RapidMiner https://rapidminer.com/products/studio/ National Centre for Text Mining http://www.nactem.ac.uk/software.php 249