Studia Podyplomowe Metody statystyczne w biznesie. Warsztaty z oprogramowaniem SAS Analiza danych nieustrukturyzowanych: Text Mining

Podobne dokumenty
Studia Podyplomowe Metody statystyczne w biznesie. Warsztaty z oprogramowaniem SAS Analiza danych nieustrukturyzowanych: Text Mining

Szkolenia SAS Cennik i kalendarz 2017

ANALIZA DANYCH ZE ŹRÓDEŁ OTWARTYCH CENNE ŹRÓDŁO INFORMACJI DR INŻ. MARIUSZ DZIECIĄTKO

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO

Mariusz Dzieciątko. Krótko o sobie / Personal Overview/

Modelowanie Data Mining na wielką skalę z SAS Factory Miner. Paweł Plewka, SAS

RAPORT PŁACOWY Podsumowanie 2014

Office Synchronizer. Informacje o wersji. Wersja 1.66

Bartłomiej Graczyk MCT,MCITP,MCTS

Praktyczne aspekty pozyskiwania wiedzy z danych z perspektywy matematyka w bankowości (VI zajęcia) Jakub Jurdziak

Analityka predykcyjna w marketingu i sprzedaży

PERFORMANCE POINT SERVICE NIE TYLKO DLA ORŁÓW

{LINGO} Specyfikacja produktu. - Wymiary: 61x18x8mm. - waga: 8,6 g. - zasięg: 10m. - pojemność i typ baterii: 90mAh, polimerowa bateria litowa

ANALITYKA DANYCH TEKSTOWYCH WARTOŚĆ W DANYCH NIEUSTRUKTURYZOWANYCH. MOŻLIWOŚCI OBECNEJ TECHNOLOGII. DOŚWIADCZENIA Z RYNKU

dla Klientów Kontakt Skype:

Office Synchronizer Informacje o wersji. Wersja 1.61

ESI[tronic] Info 2008/3

Analiza danych i data mining.

!!!!!!!!!! WNIOSEK O PORTFOLIO:

DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:

Data Mining Wykład 1. Wprowadzenie do Eksploracji Danych. Prowadzący. Dr inż. Jacek Lewandowski

DOSTAWA KONCENTRATORÓW SIECIOWYCH ORAZ URZĄDZENIA IPAD NA POTRZEBY SĄDU OKRĘGOWEGO W SZCZECINIE

Ekran główny lista formularzy

W biurowcu Nowa Fabryczna działa już centrum finansowe firmy Whirlpool

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

Podręcznik instalacji

Szybkość instynktu i rozsądek rozumu$

SAS Access to Hadoop, SAS Data Loader for Hadoop Integracja środowisk SAS i Hadoop. Piotr Borowik

Semantyczna analiza języka naturalnego

Portale raportowe, a narzędzia raportowe typu self- service

Instrukcja. 2. Zaloguj się na stronie: => Login => RESEARCHconnect International users => Login now

Learn SAS. Training Certification Coaching. Grow With Us. Szkolenia Certyfikaty Mentoring Analiza potrzeb szkoleniowych

Analityka i BigData w służbie cyberbezpieczeństa

Nowoczesne narzędzia do ochrony informacji. Paweł Nogowicz

gvsig jako przykład desktopowego klienta usług sieciowych OGC

Portal e-learningowy zaprojektowany dla Studentów i Nauczycieli

EKSPLORACJA DANYCH TEKSTOWYCH (TEXT MINING) W PRZEDSIĘBIORSTWIE (TEXT MINING METHODS AND APPLICATIONS IN THE ENTERPRISE)

M400 M430 M600. Funkcje Smart Coaching. Fitness Test. Licznik kalorii. Obciążenie treningowe. Podusmowanie aktywności. Program treningu biegowego

Wersja polska. Wstęp. Instalacja software. MP508FMV2 Sweex Black Onyx MP4 Player

PRAKTYCZNE WYKORZYSTANIE KATEGORYZACJI TREŚCI

Widzenie komputerowe (computer vision)

Konferencja. Business Intelligence Trends 24 czerwca 2014 r.

Imagination Is More Important Than Knowledge

Kurs Cisco CCNA Routing & Switching

Narzędzia IT we współczesnych strategiach utrzymaniowych

SKANERY WIZYTÓWEK. SKANERY wizytówek WORLDCARD - Idealne RozwiĄzanie dla Ciebie. WorldCard OFFICE

AquaLingua PORADNIK UŻYTKOWNIKA

SAS Lineage. zależności między obiektami w środowisku SAS, perspektywa techniczna i biznesowa

Studia Podyplomowe Metody statystyczne w biznesie. Warsztaty z oprogramowaniem SAS Analiza danych nieustrukturyzowanych: Text Mining

Rozwiązania rekrutacyjne dla firm. Copyright 2015 EFFECTIVENESS Sp.zo.o. All rights reserved.

StatSoft profesjonalny partner w zakresie analizy danych

seco TO DLA NAS PRACUJĄ NAJLEPSI TŁUMACZE CENNIK SZCZEGÓŁOWY. Mamy dla Ciebie miłą obsługę, wysoką jakość i niskie ceny.

seco TO DLA NAS PRACUJĄ NAJLEPSI TŁUMACZE CENNIK SZCZEGÓŁOWY. Mamy dla Ciebie miłą obsługę, wysoką jakość i niskie ceny.

BEYOND: Dwie Dusze Aplikacja BEYOND Touch

OGŁOSZENIE O DIALOGU TECHNICZNYM

Praca grupowa inaczej Lotus w modelu SaaS Maciej Magierek Lotus Software Sales Specialist

Zarządzanie wiedzą w instytucji naukowej cz. I

STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA

SCS Data Manager. Informacje o wersji. Wersja 3.00

CENNIK USŁUG. BIURO TŁUMACZEŃ ALPHA

CZĘŚĆ I ZASTOSOWANIE PROGRAMU EXCEL DO ANALIZ BUSINESS INTELLIGENCE

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

WIZUALNA EKSPLORACJA DANYCH I RAPORTOWANIE W SAS VISUAL ANALYTICS ORAZ WSTĘP DO SAS VISUAL STATISTICS

Wyszukiwarka Google w witrynie Technologia Google, która pozwala przeszukiwać witrynę Twojej firmy

Zalew danych skąd się biorą dane? są generowane przez banki, ubezpieczalnie, sieci handlowe, dane eksperymentalne, Web, tekst, e_handel

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

Praktyczne wykorzystanie elementów raportowania Microsoft Project 2010 /Project Server 2010 Sesja 4 Performance Point Services Bartłomiej Graczyk

SAS ENTERPRISE MINER JAKO NARZĘDZIE ANALITYKA MARIUSZ DZIECIĄTKO

w ekonomii, finansach i towaroznawstwie

Podręcznik instalacji Command WorkStation 5.6 z aplikacjami Fiery Extended Applications 4.2

Kierunek: Informatyka Społeczna Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia

CENNIK USŁUG PROMOCJA!!! TŁUMACZENIA PISEMNE ZWYKŁE

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Elżbieta Andrukiewicz Ryszard Kossowski PLAN BEZPIECZEŃSTWA INFORMACJI

Business Intelligence narzędziem wsparcia sprzedaży

Wskaźnik Trading Central BReTRADER

REAL TIME BUSINESS INTELLIGENCE REALNY ROZWÓJ BIZNESU. STUDIUM PRZYPADKU W OBSZARZE MARKETINGU RADOSŁAW GRABIEC SAS INSTITUTE

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

ZROZUMIEĆ MIŁOŚNIKÓW NATURY

Ewelina Dziura Krzysztof Maryański

IBM Business Analytics

SPOTKANIE 2: Wprowadzenie cz. I

Część I Rozpoczęcie pracy z usługami Reporting Services

Edukacja akademicka z wykorzystaniem narzędzi SAS

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Liczba kandydatów na 1 miejsce na studia stacjonarne - rok akademicki 2016/2017

Usługi IBM czyli nie taki diabeł straszny

1. Wstęp do językoznawstwa Wstęp do etnologii i antropologii

TĘ CZĘŚĆ WYPEŁNIA DOKTORANT. Doktorant(-ka): mgr Rok studiów: tel. . Opiekun naukowy. I. Stypendium doktoranckie i tzw. zwiększenie stypendium

Tematy prac dyplomowych inżynierskich

Liczba kandydatów na 1 miejsce na studia stacjonarne - rok akademicki 2015/2016

Programista do działu testów PDT/1401/T/TBG

Oferta Filos Logos. kursy językowe tłumaczenia. C entru m J ę z yków Obcych Filo s Logos. Z mi ł o ś c i do j ę z yków

ZASOBY INFORMACYJNE - INACZEJ

Monitoring procesów z wykorzystaniem systemu ADONIS

Zastosowania narzędzi analitycznych w komunikacji społecznej

SEKCJA I: ZAMAWIAJĄCY SEKCJA II: PRZEDMIOT ZAMÓWIENIA. Zamieszczanie ogłoszenia: obowiązkowe. Ogłoszenie dotyczy: zamówienia publicznego.

Cel i zawartość prezentacji

Transkrypt:

Analiza danych nieustrukturyzowanych: Text Mining Wydział Nauk Ekonomicznych Uniwersytet Warszawski

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Analiza sentymentu 2) Aplikacje open source Część 3 Inne narzędzia Text Mining

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Analiza sentymentu 2) Aplikacje open source Część 3 Inne narzędzia Text Mining

Zintegrowane aplikacje analityczne SAS Text Miner IBM SPSS Modeler Text Analytics STATISTICA Text Miner Provalis Research WordStat Megaputer TextAnalyst 171

Firma: SAS Produkt: SAS Text Miner

SAS Text Miner http://support.sas.com/documentation/onlinedoc/txtminer/ 173

Obsługiwane języki SAS Text Miner prowadzi analizę nieustrukturyzowanych dokumentów w językach europejskich: angielski, holenderski, francuski, niemiecki, włoski, portugalski, hiszpański, szwedzki, polski oraz: japoński, koreański, uproszczony chiński, tradycyjny chiński, arabski 174

Obsługiwane funkcje szukanie rdzenia wyrazów automatyczne rozpoznawanie terminów wielowyrazowych standaryzacja wyrażeń takich jak data, godzina, waluta, procenty wydobywanie niestandardowych wyrażeń (nazwy organizacji, produkty, tytuły itp.) etykietowanie części mowy rozpoznawanie synonimów 175

Zastosowania filtrowanie wiadomości e-mail grupowanie dokumentów według tematu w określone kategorie wyszukiwanie w tekście nowych informacji analiza klastrów w dokumentach naukowych analiza klastrów danych ankietowych analiza klastrów w skargach, komentarzach i zażaleniach klientów 176

SAS Text Analytics 177

SAS Content Categorization 178

SAS Social Media Analytics 179

SAS Social Media Analytics 180

SAS Social Media Analytics social forecast 181

SAS Social Media Analytics sentiment by time 182

SAS Social Media Analytics media workbench 183

SAS Social Media Analytics fraud framework 184

Success stories Maspex Wadowice Group Parks Division of Alberta Tourism, Parks and Recreation https://www.sas.com/en_us/customers/alberta-parks.html Hong Kong government's Efficiency Unit https://www.sas.com/en_us/customers/maspex-wadowicegroup.html https://www.sas.com/en_us/customers/hong-kong-efficiencyunit-visual-analytics.html 185

Success stories Sub-Zero and Wolf Appliance http://www.sas.com/en_us/news/pressreleases/2014/march/sub-zero-warranty-analytics-award.html Hewlett-Packard http://www.sas.com/en_us/customers/hp.html 186

Firma: IBM SPSS Produkt: IBM SPSS Modeler Text Analytics

IBM SPSS Modeler Text Analytics https://www.ibm.com/support/knowledgecenter/ss3ra7_15.0.0/ com.ibm.spss.ta.help/tmfc_intro.htm 188

Obsługiwane języki Wspierane natywnie angielski, francuski, hiszpański, holenderski, niemiecki, włoski, portugalski, japoński Wspierane przez moduł tłumaczeniowy Language Translation Interface arabski, chiński, hindi, perski, rumuński, rosyjski, somalijski, szwedzki 189

Zastosowania Analiza wzorców w tekstach i powiązań między tekstami Analiza pytań otwartych w ankietach Klasteryzacja, kategoryzacja Modelowanie predykcyjne 190

What do you like most about this portable music player? /categories 191

What do you like most about this portable music player? /concept map 192

What do you like most about this portable music player? /positive 193

What do you like most about this portable music player? /negative 194

Customer service / text link analysis 195

What factors influence your decision to choose a car rental company for business? 196

Sentiment Analysis 197

Success stories PGM Holdings K.K. http://www-03.ibm.com/software/businesscasestudies Hamilton County Department of Education http://www-03.ibm.com/software/businesscasestudies BMW Group http://www-03.ibm.com/software/businesscasestudies 198

Firma: StatSoft Produkt: STATISTICA Text Miner

STATISTICA Text Miner http://www.statsoft.pl/programy/statistica-text-miner 200

Obsługiwane języki Wspierane natywnie duński, holenderski, angielski, francuski, niemiecki, włoski, portugalski, hiszpański, szwedzki 201

Obsługiwane funkcje szukanie rdzenia wyrazów pomijanie nieistotnych słów transformacja i redukcja wymiarów analiza dokumentów podsumowania mapy podobieństw analiza skupień (metody EM i k-średnich) predykcyjny text mining 202

Analiza dużych zbiorów dokumentów tekstowych grupowanie dokumentów w określone kategorie wyszukiwanie w tekście nowych informacji Analiza treści stron WWW, portali internetowych i grup dyskusyjnych Prognozowanie Zastosowania 203

Accident reports 204

Credit scoring 205

Success stories Biuro Ubezpieczycieli Czeskich http://media.statsoft.pl/_old_dnn/downloads/success_stories/ckp _wykorzystuje_statistica_enterprise_text_miner.pdf Analiza opisów roszczeń ubezpieczeniowych przewidywanie ryzyka wystąpienia wysokich roszczeń z tytułu uszczerbku na zdrowiu dokładniejsze szacowanie łącznej wartości odszkodowania z tytułu OC na wczesnym etapie rozpatrywania danej sprawy 206

Firma: Provalis Research Produkt: WordStat

Provalis Research WordStat http://provalisresearch.com/products/content-analysis-software/ 208

Obsługiwane języki Wspierane natywnie angielski, francuski, hiszpański, niemiecki, włoski, portugalski 209

analiza wyszukanego tekstu i wizualizacja wyszukiwanie słowa kluczowego i słowa kluczowego w kontekście identyfikacja powiązanych segmentów tekstu grupowanie i analiza korespondencyjna wyrażeń klasteryzacja Obsługiwane funkcje automatyczna klasyfikacja tekstu krzyżowanie dwóch zmiennych 210

analiza zawartości zamkniętych/otwartych zapytań w formularzach, kwestionariuszach wydobywanie informacji ze sprawozdań i raportów wydarzeń analiza nowych informacji w literaturze naukowej i sprawozdaniach wykrywanie nieprawidłowości i oszustw identyfikacja autorstwa i analiza patentowa analiza stron WWW Zastosowania 211

Keyword retrieval 212

Keyword distribution 213

Bubble chart 214

Dendogram 215

2D concept map 216

3D concept map 217

Proximity plot 218

JetBlue Airways Success stories Cornell University School of Hotel Administration Center for Business Performance http://provalisresearch.com/solutions/case-studies/application-oftext-mining-to-aviation-safety-data/ http://provalisresearch.com/solutions/case-studies/contentanalysis-of-hotel-customer-satisfaction/ http://provalisresearch.com/solutions/case-studies/mesuringdisclosure-of-intangible-resources-in-corporate-annual-reports/ 219

Firma: Megaputer Produkt: TextAnalyst

Megaputer TextAnalyst http://megaputer.com/site/textanalyst.php 221

Obsługiwane języki Wspierane natywnie angielski 222

tworzenie list synonimów klasteryzacja Obsługiwane funkcje kategoryzacja dokumentów wydobywanie niestandardowych wyrażeń wizualizacja powiązań między dokumentami a słowami analiza powiązań stron WWW 223

Zastosowania identyfikacja słów kluczowych automatyczne generowanie streszczeń tematyczna eksploracja tekstu wykrywanie nieprawidłowości generowanie interaktywnych raportów prognozowanie 224

Keyword extraction - medical records 225

Topic detection - medical records 226

Link chart crime reports 227

Correlation diagram crime reports 228

Success stories e-complaints from e-auction Store http://www.cluteinstitute.com/ojs/index.php/jber/article/view/2 286 Crime reports analysis http://www.megaputer.com/site/success_stories.php Government agency http://www.megaputer.com/site/success_stories.php 229

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Analiza sentymentu 2) Aplikacje open source Część 3 Inne narzędzia Text Mining

Firma: Clarabridge Produkt: Clarabridge Analyze

Clarabridge Analyze http://www.clarabridge.com/wpcontent/uploads/2014/11/clarabridge_6-3_datasheet.pdf 232

Overall sentiment - hotels 233

Category volume report - hotels 234

Motion chart - hotels 235

Red Roof Inn Success stories http://www.clarabridge.com/case_study/red-roof-inn/ B/E Aerospace http://www.clarabridge.com/case_study/be-aerospace/ 236

1) Komercyjne 1. Zintegrowane aplikacje analityczne 2. Analiza sentymentu 2) Aplikacje open source Część 3 Inne narzędzia Text Mining

Aplikacje open source GATE http://gate.ac.uk/ RapidMiner https://rapidminer.com/products/studio/ National Centre for Text Mining http://www.nactem.ac.uk/software.php 238