Eksploracja Zasobów Internetu

Podobne dokumenty
Eksploracja Zasobów Internetu

Eksploracja Zasobów Internetu

Sieci komputerowe. Wstęp

Internet (skrótowiec od ang. inter-network, dosłownie "między-sieć") ogólnoświatowa sieć komputerowa, określana również jako sieć sieci.

MODEL WARSTWOWY PROTOKOŁY TCP/IP

1 Technologie Informacyjne WYKŁAD I. Internet - podstawy

Cel wykładu. Literatura. WyŜsza Szkoła MenedŜerska w Legnicy. Wykład 1. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem. 3

Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search

Wyszukiwanie i Przetwarzanie Informacji Information Retrieval & Search

Adres IP

Plan wykładu. 1. Sieć komputerowa 2. Rodzaje sieci 3. Topologie sieci 4. Karta sieciowa 5. Protokoły używane w sieciach LAN 6.

1999 dialnych w czasie rzeczywistym Liczba użytkowników Internetu przekroczyła 1 miliard.

Dr Michał Tanaś(

Technologie informacyjne (6) Zdzisław Szyjewski

Korzyści INTERNET. Uzależnienie Obrażanie

Wprowadzenie do programowania www

World Wide Web? rkijanka

dwie lub więcej sieci komputerowych połączonych ruterami (router) i przełącznikami (switch)

Podstawy sieci komputerowych. Technologia Informacyjna Lekcja 19

ASSO - ADMINISTROWANIE SIECIOWYMI SYSTEMAMI OPERACYJNYMI - E.13 CHARAKTERYZOWANIE SIECI INTERNET

Internet. Podstawowe usługi internetowe. Wojciech Sobieski

System komputerowy. Sprzęt. System komputerowy. Oprogramowanie

systemów intra- i internetowych Platformy softwarowe dla rozwoju Architektura Internetu (2) Plan prezentacji: Architektura Internetu (1)


Usługi w sieciach informatycznych. Mariusz Stenchlik mariuszs@onet.eu

Sieci równorzędne, oraz klient - serwer

Instytut Informatyki Politechniki Śląskiej. Sieci konwergentne. Andrzej Grzywak

Krzysztof Dobosz. Przeszukiwanie. zasobów Internetu

ABC systemu Windows 2016 PL / Danuta Mendrala, Marcin Szeliga. Gliwice, cop Spis treści

KARTA KURSU. Techniki informatyczne

Wprowadzenie do informatyki i wykorzystanie internetu studia podyplomowe

Plan prezentacji. Wprowadzenie Przesyłanie Informacji w Internecie Funkcjonowanie stron internetowych Działanie narzędzi internetowych.

Wykład 3 / Wykład 4. Na podstawie CCNA Exploration Moduł 3 streszczenie Dr inż. Robert Banasiak

Sieci komputerowe. Wykład dr inż. Łukasz Graczykowski

O Internecie. R. Robert Gajewski omklnx.il.pw.edu.pl/~rgajewski

Protokoły sieciowe - TCP/IP

Informatyka Studia II stopnia

Sieci komputerowe Wykład

SPIS TREŚCI... 3 WSTĘP GENEZA INTERNETU NA DRODZE DO INTERNETU ARPANET NA STYKU RÓŻNYCH SIECI...

SIECI KOMPUTEROWE mgr inż. Adam Mencwal Katedra Informatyki Stosowanej

To systemy połączonych komputerów zdolnych do wzajemnego przesyłania informacji, do dzielenia się zasobami, udostępniania tzw.

Zdalne logowanie do serwerów

Przetwarzanie danych w chmurze

Programowanie Sieciowe 1

Information Architecture

Temat: Sieci komputerowe.

Studium przypadku Case Study CCNA2-ROUTING. Warianty projektów

SI w procesach przepływu i porządkowania informacji. Paweł Buchwald Wyższa Szkoła Biznesu

Model sieci OSI, protokoły sieciowe, adresy IP

Razem godzin w semestrze: Plan obowiązuje od roku akademickiego 2014/15 - zatwierdzono na Radzie Wydziału w dniu r.

Usługi dostępne w Internecie

POLITECHNIKA LUBELSKA Wydział Elektrotechniki Kierunek: INFORMATYKA II stopień niestacjonarne i Informatyki. Część wspólna dla kierunku

Wybrane działy Informatyki Stosowanej

Protokoły internetowe

2. NAZWA JEDNOSTKI (jednostek) realizującej przedmiot: Katedra i Zakład Informatyki i Statystyki

Internet to ogólnoświatowy zbiór wzajemnie połączonych ze sobą sieci komputerowych (lokalnych LAN i rozległych WAN). Za datę powstania Internetu

Protokoły zdalnego logowania Telnet i SSH

ZiMSK. Konsola, TELNET, SSH 1

Dr Michał Tanaś(

Przyjrzyjmy się z bliska możliwością konfiguracji ruchu sieciowego. 1. Na początek pole Bandwidth Management z trzema zakładkami:

System operacyjny UNIX Internet. mgr Michał Popławski, WFAiIS

GOSPODARKA ELEKTRONICZNA CZĘŚĆ 1 WPROWADZENIE TEORETYCZNE MGR INŻ. PAWEŁ FAJFER

Wprowadzenie do teorii systemów ekspertowych

Laboratorium - Poznawanie FTP

Tworzenie witryn internetowych PHP/Java. (mgr inż. Marek Downar)

Rok akademicki: 2012/2013 Kod: ITE s Punkty ECTS: 4. Poziom studiów: Studia I stopnia Forma i tryb studiów: -

Architektura systemu teleinformatycznego państwa - w. 2

Indeksowanie full text search w chmurze

Sieci komputerowe i bazy danych

Ewolucja operatorów od dostawców bitów do dostawców usług

Model warstwowy Warstwa fizyczna Warstwa łacza danych Warstwa sieciowa Warstwa transportowa Warstwa aplikacj. Protokoły sieciowe

Transmisja danych multimedialnych. mgr inż. Piotr Bratoszewski

Laboratorium - Używanie programu Wireshark do obserwacji mechanizmu uzgodnienia trójetapowego TCP

Protokoły w komunikatorach

JĘZYK PYTHON - NARZĘDZIE DLA KAŻDEGO NAUKOWCA. Marcin Lewandowski [ mlew@ippt.gov.pl ]

Eksploracja Zasobów Internetu

sieć lokalna łączy kilka do kilkuset komputerów na niewielkim

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:

Multicasty w zaawansowanych usługach Internetu nowej generacji

Stos protokołów TCP/IP (ang. Transmission Control Protocol/Internet Protocol)

Serwery LDAP w środowisku produktów w Oracle

dr inż. Olga Siedlecka-Lamch 14 listopada 2011 roku Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Eksploracja danych

Bazy Danych i Usługi Sieciowe

Krajowe Ramy Interoperacyjności - sprawna (?) komunikacja prawnotechnologiczna. informacyjnym

Odkryj na nowo przyjemność korzystania z komputera - z Windows 8 PL!

Razem godzin w semestrze: Plan obowiązuje od roku akademickiego 2016/17 - zatwierdzono na Radzie Wydziału w dniu r.

Lab5 - Badanie protokołów pocztowych

Sieci komputerowe. Narzędzia Informatyki

Wykład 4: Protokoły TCP/UDP i usługi sieciowe. A. Kisiel,Protokoły TCP/UDP i usługi sieciowe

POLITECHNIKA LUBELSKA Wydział Elektrotechniki Kierunek: INFORMATYKA II stopień niestacjonarne i Informatyki. Część wspólna dla kierunku

Podstawy sieci komputerowych

CZĘŚĆ III. OBLICZENIA I WYKRESY BEZ PROGRAMOWANIA...9

Zarządzanie sieciami komputerowymi - wprowadzenie


Rozwój popytu. - najważniejsze trendy. dr Dominik Batorski. Uniwersytet Warszawski

PROGRAMY DO KONTROLI RODZICIELSKIEJ BENIAMIN WERSJA KOMPUTEROWA

Podstawy użytkowania systemu Linux

Technologie cyfrowe. Artur Kalinowski. Zakład Cząstek i Oddziaływań Fundamentalnych Pasteura 5, pokój 4.15 Artur.Kalinowski@fuw.edu.

Transkrypt:

Wykład: dr inż. Irmina Masłowska Laboratoria: dr hab. inż. Miłosz Kadziński {irmina.maslowska,milosz.kadzinski}@cs.put.poznan.pl

CO TO JEST INTERNET? >> Internet stał się z dnia na dzień ogólnoświatową rozgłośnią, mechanizmem rozpowszechniania informacji, a także medium dla współpracy i interakcji pomiędzy ludźmi oraz ich komputerami bez względu na położenie geograficzne << Barry M. Leiner, Vinton G. Cerf, David D. Clark, Robert E. Kahn, Leonard Kleinrock, Daniel C. Lynch, Jon Postel, Larry G. Roberts, Stephen Wolff A Brief History of the Internet www.isoc.org Internet (dosł. międzysieć) to ogólnoświatowa sieć komputerowa. W znaczeniu informatycznym - przestrzeń adresów IP przydzielonych hostom i serwerom połączonym za pomocą urządzeń sieciowych, komunikujących się za pomocą protokołu internetowego z wykorzystaniem infrastruktury telekomunikacyjnej.

Standardy Internetu regulowane są przez agencje Internet Engineering Task Force (IETF) i publikowane w dokumentach RFC. Zgodnie z definicją słowa Internet oznacza ono globalny system informacyjny spełniający następujące warunki: jest logicznie połączony w jednorodną sieć adresową opartą na protokole IP (Internet Protocol), jest w stanie zapewnić komunikację przy użyciu protokołów z rodziny TCP/IP (Transmission Control Protocol/Internet Protocol), dostarcza, lub wykorzystuje usługi wyższego poziomu oparte na komunikacji i związanej z nią infrastrukturze.

Usługi (i protokoły) internetowe WWW (World Wide Web) Poczta elektroniczna Transfer plików (FTP File Transfer Protocol i SFTP Secure File Transfer Protocol) Serwisy społecznościowe Blogi, fora i listy dyskusyjne Komunikatory instant messengers, Telekonferencje VoIP czyli telefonia internetowa Radio i telewizja, video na żądanie - IPTV Telnet, SSH (Secure Shell) Sklepy i aukcje internetowe Bankowość elektroniczna Blockchain Gry online Sieci wymiany bezpośredniej P2P Czaty, jak IRC (Internet Relay Chat) Gopher

Natura Internetu olbrzymie rozmiary różnorodność dynamiczność zmian https://thenextweb.com/insider/2017/03/06/the-incredible-growth-of-theinternet-over-the-past-five-years-explained-in-detail stąd konieczność wzięcia pod uwagę takich aspektów, jak: skalowalność dane multimedialne i wielojęzyczne ulotność ( temporalność ) danych

Oct 2013 767,234,152 Sept 2015 892,743,625 Sept 2016 1,285,759,146 Sept 2017 1,805,060,730 www.netcraft.com www.zakon.org

www.isc.org www.zakon.org Jul 2013 996,230,757 Jul 2014 1,028,544,414 Jul 2015 1,033,836,245 Jan 2016 1,048,766,623 Jul 2017 1,074,971,748

Web Mining >> wykorzystanie technik data mining w automatycznym odkrywaniu i pozyskiwaniu informacji z dokumentów i usług dostępnych w sieci Web << O. Etzioni, The World-Wide Web: Quagmire or gold mine? Communications of ACM, 39(11):65-68, 1996

Web Mining jako dyscyplina naukowa leży na przecięciu badań baz danych wyszukiwania informacji (Information Retrieval IR) sztucznej inteligencji (w AI w szczególności czerpie z uczenia maszynowego ML i przetwarzania języka naturalnego NLP, intelligent agents IA)

Główne problemy/zadania Web Mining dotarcie do adekwatnej informacji; niska precyzja (precision)/ kompletność (recall) głównie IR pozyskiwanie wiedzy z dostępnej informacji głównie DM personalizacja informacji (indywidualizacja zarówno co do treści jak i formy) pozyskiwanie informacji o klientach i użytkownikach

3 kategorie w ramach Web Mining: eksploracja zawartości (treści) Content mining eksploracja struktury Structure mining eksploracja wykorzystania Usage mining Web Mining Web Content Mining Web Structure Mining Web Usage Mining Web Page Content Mining Search Result Mining General Access Pattern Tracking Customized Usage Tracking Za: Jiawei Han, 1998

Information Rertrieval >> IR is the automatic retrieval of ALL relevant documents while retrieving as FEW of the irrelevant as possible << van Rijsbergen C.J. (1979) Information Retrieval. Butterworths, London >> IR deals with the representation, storage, organization of, and access to information items << Baeza-Yates R., Ribeiro-Neto B. (1999) Modern Information Retrieval. Addison-Wesley, ACM Press, New York

Badania IR dotyczą: szukania informacji w kolekcjach tekstów indeksowania dokumentów modelowania klasyfikacji dokumentów analizy skupień architektury systemów interfejsów użytkownika wizualizacji filtrowania...

Information Retrieval vs. Data Retrieval

Information Retrieval vs. Data Retrieval słaba strukturalizacja lub brak dobrze zdefiniowana struktura i semantyka

efektywność dostępu do adekwatnej informacji

efektywność dostępu do adekwatnej informacji działanie użytkownika

efektywność dostępu do adekwatnej informacji działanie użytkownika reprezentacja dokumentów

Działanie użytkownika searching translates his information need into a query browsing Baeza-Yates & Ribeiro-Neto, 1999

Logiczna reprezentacja dokumentów document accents, spacing, etc. stopwords noun groups stemming automatic or manual indexing structure recognition structure full text index terms Baeza-Yates & Ribeiro-Neto, 1999