Learning to rank: RankLib. Krzysztof Pawlak, Jakub Sobieski
|
|
- Mirosław Sosnowski
- 9 lat temu
- Przeglądów:
Transkrypt
1 Learning to rank: RankLib Krzysztof Pawlak, Jakub Sobieski
2 Spis Treści 1) Wprowadzenie Machine learning, Learning to rank 2) Lemur Project 3) RankLib 4) Omówienie algorytmu AdaRank 5) Przykład działania a) Transformacja danych b) Uczenie c) Tworzenie rankingów d) Dane konkursowe e) Porównywanie algorytmów
3 Wprowadzenie Machine Learning Uczenie maszynowe - praktyczne zastosowanie dokonań w dziedzinie sztucznej inteligencji do stworzenia automatycznego systemu potrafiącego doskonalić się przy pomocy zgromadzonego doświadczenia (czyli danych) i nabywania na tej podstawie nowej wiedzy. (Wikipedia) Początkiem uczenia maszynowego może być projekt Arthura Samuela z firmy IBM, który w latach rozwijał program do szkolenia zawodników szachowych. Przykłady zastosowań: analiza i użytkowanie olbrzymich baz danych, dostosowywanie się systemu do środowiska, systemy eksperckie, wyszukiwarki internetowe, oprogramowanie do rozpoznawania mowy, automatyczna nawigacja i sterowanie.
4 Wprowadzenie Learning to rank Learning to rank czy machine-learned ranking (MLR) jest zastosowaniem uczenia maszynowego do konstrukcji modelów rankingowych i systemów wydobywania informacji. Wykorzystywanie wydobywania dokumentów/informacji w wyszukiwarkach internetowych, do automatycznego konstruowania modeli rankingowych, przy wykorzystaniu zbiorów treningowych i testowych.
5 Spis Treści 1) Wprowadzenie Machine learning, Learning to rank 2) Lemur Project 3) RankLib 4) Omówienie algorytmu AdaRank 5) Przykład działania a) Transformacja danych b) Uczenie c) Tworzenie rankingów d) Dane konkursowe e) Porównywanie algorytmów
6 Lemur Project Powstał poprzez współpracę University of Massachusetts i Carnegie Mellon University. Dostarcza zbiór open-source funkcjonalności do modelowania językowego i wydobywania informacji. Wspiera wiele technologii jak ad-hoc retrieval, site-search i text mining. Zawiera także moduł wyszukiwania Indri, który wspiera indeksowanie dużych baz tekstowych, tworzenie prostych modelów językowych dla dokumentów, zapytania, implementacje systemów wydobywania opartym na modelach językowych itp. Napisany w C i C++, zaprojektowany jako system wyszukiwania pod systemu UNIX, ale może być uruchomiony także pod Windows.
7 Spis Treści 1) Wprowadzenie Machine learning, Learning to rank 2) Lemur Project 3) RankLib 4) Omówienie algorytmu AdaRank 5) Przykład działania a) Transformacja danych b) Uczenie c) Tworzenie rankingów d) Dane konkursowe e) Porównywanie algorytmów
8 RankLib Biblioteka zawarta w Lemur Project, zawiera algorytmy learning to rank. Aktualnie zaimplementowanie algorytmy: MART (Multiple Additive Regression Trees, a.k.a. Gradient boosted regression tree) [6] RankNet [1] RankBoost [2] AdaRank [3] Coordinate Ascent [4] LambdaMART [5] ListNet [7] Random Forests [8]
9 Spis Treści 1) Wprowadzenie Machine learning, Learning to rank 2) Lemur Project 3) RankLib 4) Omówienie przykładowego algorytmu AdaRank 5) Przykład działania a) Transformacja danych b) Uczenie c) Tworzenie rankingów d) Dane konkursowe e) Porównywanie algorytmów
10 Omówienie przykładowego algorytmu AdaRank Jest to algorytm typu listwise, buduje model rankingowy przez wykorzystanie podejści teorii Boosting. Teoria boosting opiera się na koncepcie słabych i mocnych ranker'ów Słabi ranker'zy są słabo związani z prawdziwą klasyfikacją. Mocni ranker'rzy są za to mocno związani. Paradygmat teorii Boosting wiąże się z stworzeniem jednego silnego ranker'a poprzez kombinacje zestawu słabych ranker'ów. AdaRank trenuje jednego słabego rankera przy każdym obrocie pętli iteracji, i łączy tych słabych rankerów jako finalną funkcję rankingową. Po każdym obrocie pętli wagi dokumentów są przeliczane, obniża wagi poprawnie ocenionych dokumentów dla danej metryki, i podwyższa wagi dokumentów które zostały ocenione źle dla tej samej metryki.
11 Omówienie przykładowego algorytmu AdaRank
12 Omówienie przykładowego algorytmu AdaRank Przy starcie algorytmu, wagi są równo rozdzielone po zapytaniach. W każdym obrocie pętli AdaRank dystrybuuje wagi do zapytań w zestawie treningowym. Kiedy słaby ranker zostanie zbudowany, algorytm wiąże do niego wagę at > 0, która oznacza ważność danego rankera.
13 Spis Treści 1) Wprowadzenie Machine learning, Learning to rank 2) Lemur Project 3) RankLib 4) Omówienie przykładowego algorytmu AdaRank 5) Przykład działania a) Transformacja danych b) Uczenie c) Tworzenie rankingów d) Dane konkursowe e) Porównywanie algorytmów
14 PRZYKŁAD DZIAŁANIA
15 DANE KONKURSOWE
16 DANE ALLEGRO - PRODUKTY "IT_ID" "IT_NAME" "IT_BUY_NOW_PRICE" "PRIC E_WITH_DELIVERY" "BUY_COUNT" "BOLD" "FEA TURED" "THUMB" "SHOP_ITEM" "FREE_SHIPPIN G" "HIGHLIGHT" "SA" "Przyssawka mocowan na szybę do GoPro HERO4 Session" 24 27, "Toner Brother TN-2005, HL-2035, HL Super cena" 33,19 45, "AAB COOLING THERMOPAD taśma 3mm 6,0 W/mK + KLEJ 3M" 16,9 19,
17 DANE ALLEGRO id","p.searchtime","p.searchq","p.item_position","p.i t_id","p.pv","p.userhash" "1"," ","automat do chleba","0"," ","0","n000234f32eac619b ce598741d598221e" "2"," ","automat do chleba","1"," ","0","n000234f32eac619b ce598741d598221e" "3"," ","automat do chleba","2"," ","0","n000234f32eac619b ce598741d598221e"
18 PLIK WEJŚCIOWY <line>.=. <target> qid:<qid> <feature>:<value> <feature>:<value>... <feature>:<value> # <info> <target>.=. <positive integer> <qid>.=. <positive integer> <feature>.=. <positive integer> <value>.=. <float> <info>.=. <string>
19 PRZYKŁAD 0 qid:3649 1: : :0 4:0 5:0 6:1 7:1 8:0 9:0 10:1 # "ANDROID BOX MINIX X8H PLUS TRANSLATOR MESSENGER" 0 qid:3649 1: : :0 4:0 5:0 6:1 7:0 8:0 9:0 10:0 # "The Pragmatic Translator Massimiliano Morini" 0 qid:3649 1:1299 2:1299 3:0 4:1 5:1 6:1 7:1 8:1 9:0 10:1 # "Comet V71 Tablet Translator Tłumacz" 0 qid:3649 1:0 2:7.99 3:0 4:0 5:0 6:1 7:0 8:0 9:0 10:0 # "KURS NAUKA ANGIELSKIEGO TRANSLATOR NOWE ZESTAW" 0 qid:3649 1:0 2:12 3:0 4:0 5:0 6:1 7:0 8:0 9:0 10:0 # "SHARP IQ-3100 ładny translator, kalkulator"
20 TRANSFORMACJA DANYCH
21 MODEL DANYCH
22 KROK 1. IMPORT DANYCH SEARCH
23 KROK 2. IMPORT DANYCH ITEM
24 KROK 3. STWORZENIE TABELI ZAPYTAŃ
25 KROK 4. STWORZENIE TABELI WYNIKÓW
26 KROK 5. POZYSKANIE DANYCH
27 KROK 6. EKSPORT DANYCH
28 WYNIK
29 UCZENIE
30 KROK 1. WYBÓR ALGORYTMU (-RANKER) MART (gradient boosted regression tree) RankNet RankBoost AdaRank Coordinate Ascent LambdaMART ListNet Random Forests
31 KROK 2. WYBÓR METRYK (-METRIC2T) MAP
32 KROK 3. WSKAZYWANIE ZBIORÓW -train -> plik ze zbiorem uczącym -test -> plik ze zbiorem testowym w celu oszacowania danych uczących -validate -> plik ze zbiorem sprawdzającym (służy do dostrojenia modelu) -save -> plik do którego ma zostać zapisany model
33 KROK 4. DODATKOWE PARAMETRY -feature -> Plik wskazujący które własności mają być uwzględniane w rankowaniu -norm -> normalizacja wektorów własności -kcv -tts -tvs
34 KROK 4. URUCHOMIENIE UCZENIA java -jar bin/ranklib.jar -train data/train.txt -test data/test.txt -validate data/vali.txt -ranker 6 -metric2t NDCG@10 -metric2t ERR@10 -save mymodel.txt
35 TWORZENIE RANKINGU
36 KROK 1. PARAMETRY OBOWIĄZKOWE -load -> wczytanie modelu -test -> wskazanie zbioru testowego do oszacowania -rank -> wskazanie zbioru testowego do stworzenia rankingu
37 KROK 2. DODATKOWE PARAMETRY -metric2t -> Wskazanie testowanej metryki -score -> wskazanie w jakim pliku ma zostać zapisany ranking -idv -> zapisanie osiągów modelu -norm -> normalizacja wektorów właściwości
38 KROK 3. URUCHOMIENIE PROGRAMU java -jar RankLib.jar -load mymodel.txt -rank data/test.txt -score myscorefile.txt
39 PORÓWNYWANIE ALGORYTMÓW
40 KROK 1. STWORZENIE WSZYSTKICH MODELI java -jar bin/ranklib.jar -train data/train.txt -test data/test.txt -validate data/vali.txt -ranker 6 - metric2t NDCG@10 -metric2t ERR@10 -save mymodel.txt
41 KROK 2. UZYSKANIE PLIKÓW WYDAJNOŚCI java -jar RankLib.jar -load lm.model.txt -test MQ2008/Fold1/test.txt -metric2t -idv output/lm.ndcg.txt
42 KROK 3. PORÓWNANIE MODELI java -cp bin/ranklib.jar ciir.umass.edu.eval.analyzer -all output/ -base baseline.ndcg.txt > analysis.txt
43 OVERALL COMPARISON System Performance Improvement Win Loss baseline.txt method0.txt ( %) method1.txt (+55.31%) method2.txt (+68.21%) method3.txt (+97.36%) method4.txt ( %) method5.txt ( %) method6.txt ( %) method7.txt ( %)
44 DETAILED BREAK DOWN [ < -100%) [-100%, -75%) [-75%, -50%) [-50%, -25%) [- 25%, 0%) (0%, +25%] (+25%, +50%] (+50%, +75%] (+75%, +100%] ( > +100%] method0.txt method1.txt method2.txt method3.txt method4.txt method5.txt method6.txt method7.txt
45 PRZYKŁADOWE ZAPYTANIE zrodlo min max rank MART RankNet RankBoost AdaRank Coordinate Ascent LambdaMART ListNet Random Forests
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
2
1 2 3 4 5 Dużo pisze się i słyszy o projektach wdrożeń systemów zarządzania wiedzą, które nie przyniosły oczekiwanych rezultatów, bo mało kto korzystał z tych systemów. Technologia nie jest bowiem lekarstwem
PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"
PODSTAWY BAZ DANYCH 19. Perspektywy baz danych 1 Perspektywy baz danych Temporalna baza danych Temporalna baza danych - baza danych posiadająca informację o czasie wprowadzenia lub czasie ważności zawartych
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
Klasyfikacja i regresja Wstęp do środowiska Weka
Klasyfikacja i regresja Wstęp do środowiska Weka 19 listopada 2015 Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików pdf sformatowanych podobnie do tego dokumentu.
AUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Overlord - Plan testów
Overlord - Plan testów Jakub Gołębiowski Adam Kawa Piotr Krewski Tomasz Weksej 5 czerwca 2006 Spis treści 1 Wprowadzenie 2 1.1 Cel tego dokumentu................................. 2 1.2 Cele systemu testów................................
Uczenie się maszyn. Dariusz Banasiak. Katedra Informatyki Technicznej Wydział Elektroniki
Dariusz Banasiak Katedra Informatyki Technicznej Wydział Elektroniki Machine Learning (uczenie maszynowe, uczenie się maszyn, systemy uczące się) interdyscyplinarna nauka, której celem jest stworzenie
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne. Wykład Ćwiczenia
Wydział: Informatyki, Elektroniki i Telekomunikacji Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma i tryb studiów: Stacjonarne Rocznik: 217/218 Język wykładowy: Polski Semestr 1 IIN-1-13-s
System wspomagania harmonogramowania przedsięwzięć budowlanych
System wspomagania harmonogramowania przedsięwzięć budowlanych Wojciech Bożejko 1 Zdzisław Hejducki 2 Mariusz Uchroński 1 Mieczysław Wodecki 3 1 Instytut Informatyki, Automatyki i Robotyki Politechnika
Szkolenie: Testowanie wydajności (Performance Testing)
Szkolenie: Testowanie wydajności (Performance Testing) Testy niefunkcjonalne aplikacji to nieodłączna część pracy dobrego testera. Do tego typu testów zaliczamy między innymi taką właściwość systemu jak
Razem godzin w semestrze: Plan obowiązuje od roku akademickiego 2014/15 - zatwierdzono na Radzie Wydziału w dniu r.
Część wspólna dla kierunku 1 IMS1.01 Obiektowe projektowanie SI 2 2 E 3 60 3 2 IMS1.02 Teleinformatyka 2 2 E 4 60 4 3 IMS2.01 Modelowanie i analiza systemów dyskretnych 2 2 E 3 60 3 4 IMS2.02 Wielowymiarowa
SI w procesach przepływu i porządkowania informacji. Paweł Buchwald Wyższa Szkoła Biznesu
SI w procesach przepływu i porządkowania informacji Paweł Buchwald Wyższa Szkoła Biznesu Początki SI John MC Carthy prekursor SI Alan Thuring pomysłodawca testu na określenie inteligencji maszyn Powolny
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław
Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop Spis treści
Python : podstawy nauki o danych / Alberto Boschetti, Luca Massaron. Gliwice, cop. 2017 Spis treści O autorach 9 0 recenzencie 10 Wprowadzenie 11 Rozdział 1. Pierwsze kroki 15 Wprowadzenie do nauki o danych
Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne. audytoryjne. Wykład Ćwiczenia
Wydział: Informatyki, Elektroniki i Telekomunikacji Kierunek: Informatyka Poziom studiów: Studia I stopnia Forma studiów: Stacjonarne Rocznik: 2019/2020 Język wykładowy: Polski Semestr 1 z Kierunkowe 10
Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
OFERTA. Lp. Nazwa zadania Cena netto (zł) VAT (zł) Cena brutto (zł)
ZAŁĄCZNIK NR 1 FORMULARZ OFERTY... (miejscowość i data) (dane adresowe jednostki naukowej) OFERTA W odpowiedzi na zapytanie ofertowe dotyczące przeprowadzenia prac badawczorozwojowych w celu opracowania
WEKA klasyfikacja z użyciem sztucznych sieci neuronowych
WEKA klasyfikacja z użyciem sztucznych sieci neuronowych 1 WEKA elementy potrzebne do zadania WEKA (Data mining software in Java http://www.cs.waikato.ac.nz/ml/weka/) jest narzędziem zawierającym zbiór
Sztuczna Inteligencja w energetyce
Krzysztof Wysocki Oracle Innovation Lab Polska krzysztof.wysocki@oracle.com +48 661 966 158 Sztuczna Inteligencja w energetyce Copyright 2017, Oracle and/or its affiliates. All rights reserved. 2 Sztuczna
Zakładane efekty kształcenia dla kierunku Wydział Telekomunikacji, Informatyki i Elektrotechniki
Jednostka prowadząca kierunek studiów Nazwa kierunku studiów Specjalności Obszar kształcenia Profil kształcenia Poziom kształcenia Forma kształcenia Tytuł zawodowy uzyskiwany przez absolwenta Dziedziny
QualitySpy moduł reports
QualitySpy moduł reports Testy akceptacyjne dla przypadku użycia: Pobranie metryk produktu w wybranym formacie dla wybranch wersji przez interfejs REST Nazwa pliku: /QualitySpy/modules/qualityspyreports/src/test/java/pl/wroc/pwr/qualityspy/reports
Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:
WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji
Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Inżynierii Produkcji Dr Małgorzata Lucińska
KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 205/206 Z-ID-602 Wprowadzenie do uczenia maszynowego Introduction to Machine Learning
Metody eksploracji danych w odkrywaniu wiedzy (MED) projekt, dokumentacja końcowa
Metody eksploracji danych w odkrywaniu wiedzy (MED) projekt, dokumentacja końcowa Konrad Miziński 14 stycznia 2015 1 Temat projektu Grupowanie hierarchiczne na podstawie algorytmu k-średnich. 2 Dokumenty
Indeksowanie full text search w chmurze
Prezentacja przygotowana dla: 5. Konferencja MIC w Poznaniu, 16.06.20111 Lucene.NET Indeksowanie full text search w chmurze K2 i Windows Azure dlaczego dla nas to możliwe? 1. Mamy unikalne połącznie kompetencji
Algorytm grupowania danych typu kwantyzacji wektorów
Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, problemem często spotykanym w zagadnieniach eksploracji danych (ang. data mining) jest zagadnienie grupowania danych
INŻYNIERIA OPROGRAMOWANIA
INSTYTUT INFORMATYKI STOSOWANEJ 2013 INŻYNIERIA OPROGRAMOWANIA Inżynieria Oprogramowania Proces ukierunkowany na wytworzenie oprogramowania Jak? Kto? Kiedy? Co? W jaki sposób? Metodyka Zespół Narzędzia
QualitySpy moduł persystencji
Projektowanie oprogramowania Instytut Informatyki, Automatyki i Robotyki, Politechnika Wrocławska QualitySpy moduł persystencji Testy akceptacyjne Nazwa pliku: /QualitySpy/modules/qualityspypersistence/src/test/java/pl/wroc/pwr/qualityspy/persistence
Optymalizacja systemów
Optymalizacja systemów Laboratorium - problem detekcji twarzy autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, P. Klukowski Cel zadania Celem zadania jest zapoznanie się z gradientowymi algorytmami optymalizacji
Customer Attribution Models. czyli o wykorzystaniu machine learning w domu mediowym.
Customer Attribution Models czyli o wykorzystaniu machine learning w domu mediowym. Proces decyzyjny MAILING SEO SEM DISPLAY RETARGETING PRZEGRANI??? ZWYCIĘZCA!!! Modelowanie atrybucja > Słowo klucz: wpływ
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych
Kombinacja jądrowych estymatorów gęstości w klasyfikacji - zastosowanie na sztucznym zbiorze danych Mateusz Kobos, 07.04.2010 Seminarium Metody Inteligencji Obliczeniowej Spis treści Opis algorytmu i zbioru
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 Detekcja twarzy autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się algorytmem gradientu prostego
POLITECHNIKA LUBELSKA Wydział Elektrotechniki Kierunek: INFORMATYKA II stopień niestacjonarne i Informatyki. Część wspólna dla kierunku
Część wspólna dla kierunku 1 IMN1.01 Obiektowe projektowanie SI 15 15 E 3 3 2 IMN1.02 Teleinformatyka 15 15 E 4 4 3 IMN2.01 Modelowanie i analiza systemów dyskretnych 15 15 E 3 3 4 IMN2.02 Wielowymiarowa
Kierunek Informatyka stosowana Studia stacjonarne Studia pierwszego stopnia
Studia pierwszego stopnia I rok Matematyka dyskretna 30 30 Egzamin 5 Analiza matematyczna 30 30 Egzamin 5 Algebra liniowa 30 30 Egzamin 5 Statystyka i rachunek prawdopodobieństwa 30 30 Egzamin 5 Opracowywanie
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład I dr inż. 2015/2016
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład I dr inż. Bogumil.Konopka@pwr.edu.pl 2015/2016 1 Wykład I - plan Sprawy organizacyjne Uczenie maszynowe podstawowe pojęcia Proces modelowania
NEURAL NETWORK ) FANN jest biblioteką implementującą SSN, którą moŝna wykorzystać. w C, C++, PHP, Pythonie, Delphi a nawet w środowisku. Mathematica.
Wykorzystanie sztucznych sieci neuronowych do rozpoznawania języków: polskiego, angielskiego i francuskiego Tworzenie i nauczanie sieci przy pomocy języka C++ i biblioteki FANN (Fast Artificial Neural
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów
LEMRG algorytm generowania pokoleń reguł decyzji dla baz danych z dużą liczbą atrybutów Łukasz Piątek, Jerzy W. Grzymała-Busse Katedra Systemów Ekspertowych i Sztucznej Inteligencji, Wydział Informatyki
Wykaz zmian w programie WinAdmin Replikator
Wykaz zmian w programie WinAdmin Replikator Pierwsza wersja programu 1.0.0.1 powstała w czerwcu 2010. kod źródłowy programu zawiera ponad 6 900 wierszy. Modyfikacje/zmiany w wersji 1.0.4.0 (październik
Oprogramowanie Xesar V2.1.37.17 (opublikowano dnia 09.12.2015) 1 Sieć wirtualna Podłączenie maks. 14 czytników Xesar z modułem aktualizującym
Oprogramowanie Xesar V2.1.37.17 (opublikowano dnia 09.12.2015) 1 Sieć wirtualna Podłączenie maks. 14 czytników Xesar z modułem aktualizującym Możliwość podłączenia do systemu maks. 14 czytników naściennych
Sieci neuronowe i algorytmy uczenia Czyli co i jak andrzej.rusiecki.staff.iiar.pwr.wroc.pl s.
Sieci neuronowe i algorytmy uczenia Czyli co i jak 2016 andrzej.rusiecki@pwr.edu.pl andrzej.rusiecki.staff.iiar.pwr.wroc.pl s. 230/C-3 O co chodzi? Celem przedmiotu jest ogólne zapoznanie się z podstawowymi
Tematy projektów Edycja 2019
Tematy projektów Edycja 2019 Robert Wrembel Poznan University of Technology Institute of Computing Science Robert.Wrembel@cs.put.poznan.pl www.cs.put.poznan.pl/rwrembel Temat 1 Implementacja modelu predykcji
Proces ETL MS SQL Server Integration Services (SSIS)
Proces ETL MS SQL Server Integration Services (SSIS) 3 kwietnia 2014 Opis pliku z zadaniami Wszystkie zadania na zajęciach będą przekazywane w postaci plików PDF sformatowanych jak ten. Będą się na nie
Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na
Techniki indeksowania w eksploracji danych Maciej Zakrzewicz Instytut Informatyki Politechnika Poznańska Plan prezentacji Zastosowania indeksów w systemach baz danych Wprowadzenie do metod eksploracji
KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3
KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:
P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H
W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania
Wykaz zmian w programie WinAdmin Replikator
Wykaz zmian w programie WinAdmin Replikator Pierwsza wersja programu 1.0.0.1 powstała w czerwcu 2010. kod źródłowy programu zawiera ponad 6 900 wierszy. Modyfikacje/zmiany w wersji 1.0.4.0 (październik
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
KIERUNKOWE EFEKTY KSZTAŁCENIA
WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Kierunek studiów: INFORMATYKA Stopień studiów: STUDIA I STOPNIA Obszar Wiedzy/Kształcenia: OBSZAR NAUK TECHNICZNYCH Obszar nauki: DZIEDZINA NAUK TECHNICZNYCH Dyscyplina
Zastosowania sieci neuronowych
Zastosowania sieci neuronowych aproksymacja LABORKA Piotr Ciskowski zadanie 1. aproksymacja funkcji odległość punktów źródło: Żurada i in. Sztuczne sieci neuronowe, przykład 4.4, str. 137 Naucz sieć taką
Iteracyjno-rozwojowy proces tworzenia oprogramowania Wykład 3 część 1
Iteracyjno-rozwojowy proces tworzenia oprogramowania Wykład 3 część 1 Zofia Kruczkiewicz 1 Zunifikowany iteracyjno- przyrostowy proces tworzenia oprogramowania kiedy? Przepływ działań Modelowanie przedsiębiorstwa
Internetowa ogólnopolska baza informatycznych projektów badawczych otwartej innowacji Platforma współpracy SPINACZ 1/46
Internetowa ogólnopolska baza informatycznych projektów badawczych otwartej innowacji Platforma współpracy SPINACZ 1/46 Projekt jest współfinansowany w ramach programu Ministra Nauki i Szkolnictwa Wyższego
PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W NYSIE
PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W NYSIE Efekty uczenia się Kierunek Informatyka Studia pierwszego stopnia Profil praktyczny Umiejscowienie kierunku informatyka w obszarze kształcenia: Obszar wiedzy: nauki
KARTA MODUŁU KSZTAŁCENIA
KARTA MODUŁU KSZTAŁCENIA I. Informacje ogólne 1 Nazwa modułu kształcenia Sztuczna inteligencja 2 Nazwa jednostki prowadzącej moduł Instytut Informatyki, Zakład Informatyki Stosowanej 3 Kod modułu (wypełnia
Dokumentacja Końcowa
Metody Sztucznej Inteligencji 2 Projekt Prognozowanie kierunku ruchu indeksów giełdowych na podstawie danych historycznych. Dokumentacja Końcowa Autorzy: Robert Wojciechowski Michał Denkiewicz Wstęp Celem
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Systemy uczące się wykład 1
Systemy uczące się wykład 1 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 5 X 2018 e-mail: przemyslaw.juszczuk@ue.katowice.pl Konsultacje: na stronie katedry + na stronie domowej
8. Drzewa decyzyjne, bagging, boosting i lasy losowe
Algorytmy rozpoznawania obrazów 8. Drzewa decyzyjne, bagging, boosting i lasy losowe dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Drzewa decyzyjne Drzewa decyzyjne (ang. decision trees), zwane
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji
Jazda autonomiczna Delphi zgodna z zasadami sztucznej inteligencji data aktualizacji: 2017.10.11 Delphi Kraków Rozwój jazdy autonomicznej zmienia krajobraz technologii transportu w sposób tak dynamiczny,
INŻYNIERIA OPROGRAMOWANIA TESTOWANIE SYSTEMOWE
INŻYNIERIA OPROGRAMOWANIA TESTOWANIE SYSTEMOWE Ważne pojęcia (I) Warunek testowy (test condition) to element lub zdarzenie modułu lub systemu, który może być zweryfikowany przez jeden lub więcej przypadków
Wyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Część 2: Data Mining
Łukasz Przywarty 171018 Wrocław, 18.01.2013 r. Grupa: CZW/N 10:00-13:00 Raport z zajęć laboratoryjnych w ramach przedmiotu Hurtownie i eksploracja danych Część 2: Data Mining Prowadzący: dr inż. Henryk
Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki. Paweł Parys. Nr albumu: 209216. Aukcjomat
Uniwersytet Warszawski Wydział Matematyki, Informatyki i Mechaniki Paweł Parys Nr albumu: 209216 Aukcjomat Praca licencjacka na kierunku INFORMATYKA w zakresie INFORMATYKA Praca wykonana pod kierunkiem
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2011-10-11 1 Modelowanie funkcji logicznych
KOŁO NAUKOWE GEODETÓW Dahlta
WYDZ. GEODEZJI GÓRNICZEJ I INŻYNIERII ŚRODOWISKA KOŁO NAUKOWE GEODETÓW Dahlta www.kng.agh.edu.pl Karlova Studánka, 17-19 maja 2012 r. BUDOWA SYSTEMU INFORMACJI PRZESTRZENNEJ DLA UCZELNI WYŻSZEJ GEOPORTAL
Tematy dyplomów inżynierskich 2009 Katedra Inżynierii Oprogramowania
Tematy dyplomów inżynierskich 2009 Katedra Inżynierii Oprogramowania Literatura Projekt i implementacja biblioteki tłumaczącej zapytania w języku SQL oraz OQL na zapytania w języku regułowym. dr hab. inż.
OpenAI Gym. Adam Szczepaniak, Kamil Walkowiak
OpenAI Gym Adam Szczepaniak, Kamil Walkowiak Plan prezentacji Programowanie agentowe Uczenie przez wzmacnianie i problemy związane z rozwojem algorytmów Charakterystyka OpenAI Gym Biblioteka gym Podsumowanie
Testowanie modeli predykcyjnych
Testowanie modeli predykcyjnych Wstęp Podczas budowy modelu, którego celem jest przewidywanie pewnych wartości na podstawie zbioru danych uczących poważnym problemem jest ocena jakości uczenia i zdolności
Drzewa decyzyjne i lasy losowe
Drzewa decyzyjne i lasy losowe Im dalej w las tym więcej drzew! ML Gdańsk http://www.mlgdansk.pl/ Marcin Zadroga https://www.linkedin.com/in/mzadroga/ 20 Czerwca 2017 WPROWADZENIE DO MACHINE LEARNING CZYM
Wykrywanie twarzy na zdjęciach przy pomocy kaskad
Wykrywanie twarzy na zdjęciach przy pomocy kaskad Analiza i przetwarzanie obrazów Sebastian Lipnicki Informatyka Stosowana,WFIIS Spis treści 1. Wstęp... 3 2. Struktura i funkcjonalnośd... 4 3. Wyniki...
Wstęp do sieci neuronowych laboratorium 01 Organizacja zajęć. Perceptron prosty
Wstęp do sieci neuronowych laboratorium 01 Organizacja zajęć. Perceptron prosty Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2012-10-03 Projekt pn. Wzmocnienie potencjału
Inteligentne Multimedialne Systemy Uczące
Działanie realizowane w ramach projektu Absolwent informatyki lub matematyki specjalistą na rynku pracy Matematyka i informatyka może i trudne, ale nie nudne Inteligentne Multimedialne Systemy Uczące dr
Google Testing. Radosław Smilgin,17.10.2008, TestWarez
Agenda 2. Testowanie 4. Google Google Webmaster Google Analytics Google Optimizer 7. Eksperyment 9. Podsumowanie Testowanie Klasyczne P T K Testowanie w Internecie P T K Testowanie wg. Google P T K Google
Odniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol
KIERUNKOWE EFEKTY KSZTAŁCENIA Wydział Informatyki i Zarządzania Kierunek studiów INFORMATYKA (INF) Stopień studiów - pierwszy Profil studiów - ogólnoakademicki Projekt v1.0 z 18.02.2015 Odniesienie do
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych, moduł kierunkowy oólny Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU CEL PRZEDMIOTU PRZEWODNIK
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej. Adam Żychowski
Zastosowanie sieci neuronowych w problemie klasyfikacji wielokategorialnej Adam Żychowski Definicja problemu Każdy z obiektów może należeć do więcej niż jednej kategorii. Alternatywna definicja Zastosowania
OMNITRACKER Wersja testowa. Szybki przewodnik instalacji
OMNITRACKER Wersja testowa Szybki przewodnik instalacji 1 Krok 1:Rejestracja pobrania (jeżeli nie wykonana dotychczas) Proszę dokonać rejestracji na stronieomninet (www.omnitracker.com) pod Contact. Po
P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H
W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania
!!!!!!!!!!! PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych. Autorzy: Marek Zachara
PORTFOLIO: Analiza zachowań użytkowników serwisów internetowych Autorzy: Marek Zachara Opis merytoryczny Cel naukowy (jaki problem wnioskodawca podejmuje się rozwiązać, co jest jego istotą, co uzasadnia
KARTA PRZEDMIOTU. zaliczenie na ocenę WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI
Wydział Mechaniczny PWR KARTA PRZEDMIOTU Nazwa w języku polskim: Metody numeryczne w biomechanice Nazwa w języku angielskim: Numerical methods in biomechanics Kierunek studiów (jeśli dotyczy): Inżynieria
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Transformacja wiedzy w budowie i eksploatacji maszyn
Uniwersytet Technologiczno Przyrodniczy im. Jana i Jędrzeja Śniadeckich w Bydgoszczy Wydział Mechaniczny Transformacja wiedzy w budowie i eksploatacji maszyn Bogdan ŻÓŁTOWSKI W pracy przedstawiono proces
Testowanie oprogramowania. Piotr Ciskowski
Testowanie oprogramowania Piotr Ciskowski TESTOWANIE testowanie o proces eksperymentalnego badania programu lub jego komponentu o próbne wykonanie w znanych warunkach o rejestrowanie wyników o ocena właściwości
OMNITRACKER Wersja testowa. Szybki przewodnik instalacji
OMNITRACKER Wersja testowa Szybki przewodnik instalacji 1 Krok 1:Rejestracja pobrania (jeżeli nie wykonana dotychczas) Proszę dokonać rejestracji na stronieomninet (www.omnitracker.com) pod Contact. Po
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ SZTUCZNA INTELIGENCJA dwa podstawowe znaczenia Co nazywamy sztuczną inteligencją? zaawansowane systemy informatyczne (np. uczące się), pewną dyscyplinę badawczą (dział
Program naprawczy po analizie wyników sprawdzianu zewnętrznego Szkoły Podstawowej w Bilczewie Rok szkolny 2015/2016
Program naprawczy po analizie wyników sprawdzianu zewnętrznego Szkoły Podstawowej w Bilczewie Rok szkolny 2015/2016 KRÓTKI OPIS DZIAŁANIA Szkoła poddaje analizie wyniki sprawdzianu klas VI. Rozpoznaje
OPIS PRZEDMIOTU ZAMÓWIENIA
Załącznik nr 1 OPIS PRZEDMIOTU ZAMÓWIENIA Licencja Microsoft Windows SQL Server Standard 2012 (nie OEM) lub w pełni równoważny oraz licencja umożliwiająca dostęp do Microsoft Windows SQL Server Standard
Poznań, dzień 10.02.2014. Zapytanie ofertowe
Poznań, dzień 0.0.0 Zapytanie ofertowe Beneficjent: Tech-Net Spółka z ograniczoną odpowiedzialnością Program: Program Operacyjny Innowacyjna Gospodarka Działanie: 8. Wspieranie wdrażania elektronicznego
Wprowadzenie do teorii systemów ekspertowych
Myślące komputery przyszłość czy utopia? Wprowadzenie do teorii systemów ekspertowych Roman Simiński siminski@us.edu.pl Wizja inteligentnych maszyn jest od wielu lat obecna w literaturze oraz filmach z
Razem godzin w semestrze: Plan obowiązuje od roku akademickiego 2016/17 - zatwierdzono na Radzie Wydziału w dniu r.
Część wspólna dla kierunku 1 IMS1.01 Obiektowe projektowanie SI 2 2 E 3 60 3 2 IMS1.02 Teleinformatyka 2 2 E 4 60 4 3 IMS2.01 Modelowanie i analiza systemów dyskretnych 2 2 E 3 60 3 4 IMS2.02 Wielowymiarowa
Sieć przesyłająca żetony CP (counter propagation)
Sieci neuropodobne IX, specyficzne architektury 1 Sieć przesyłająca żetony CP (counter propagation) warstwa Kohonena: wektory wejściowe są unormowane jednostki mają unormowane wektory wag jednostki są
Analiza współczynników zdrowego powietrza wewnątrz budynków pod kątem indywidualnego i komfortowego samopoczucia
Analiza współczynników zdrowego powietrza wewnątrz budynków pod kątem indywidualnego i komfortowego samopoczucia Grit Behrens, Klaus Schlender, Florian Fehring FH Bielefeld University of Applied Sciences
Załącznik nr 2. Zasady pracy aplikacji InteGrRej.
Załącznik nr 2. Zasady pracy aplikacji InteGrRej. O programie Aplikacja została stworzona w środowisku Microsoft Visual C#.Net oraz Borland Delphi. Testowana w środowisku programowym GeoMedia Proffessional
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.
Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2012-10-10 Projekt pn. Wzmocnienie
WEKA klasyfikacja z użyciem sztucznych sieci neuronowych
WEKA klasyfikacja z użyciem sztucznych sieci neuronowych 1 WEKA elementy potrzebne do zadania WEKA (Data mining software in Java http://www.cs.waikato.ac.nz/ml/weka/) jest narzędziem zawierającym zbiór
System Cyfrowego Obiegu Dokumentów to rozwiązanie ułatwiające procesy przechowywania, zarządzania i wyszukiwania dokumentów.
System Cyfrowego Obiegu Dokumentów to rozwiązanie ułatwiające procesy przechowywania, zarządzania i wyszukiwania dokumentów. Większości procesów biznesowych występujących w organizacji towarzyszą dokumenty.
Microsoft Access materiały pomocnicze do ćwiczeń cz. 1
Microsoft Access materiały pomocnicze do ćwiczeń cz. 1 I. Tworzenie bazy danych za pomocą kreatora Celem ćwiczenia jest utworzenie przykładowej bazy danych firmy TEST, zawierającej informacje o pracownikach
UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji
UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji Filip Wójcik Wydział Zarządzania, Informatyki i Finansów Instytut Informatyki Ekonomicznej