Definicja Głębokiego Internetu



Podobne dokumenty
Odkrywanie niewidzialnych zasobów sieci

Ukryty internet (Web)

Zjawisko Ukrytego Internetu rola bibliotek w upowszechnianiu jego zasobów

Sposoby wyszukiwania multimedialnych zasobów w Internecie

Pozyskiwanie informacji biznesowej w Internecie: - Metainformacja biznesowa. - Punkty startowe.

Jak przetrwać w "wieku informacji"? [sieciowej]

Znajdujesz to, czego szukasz, umyka ci to, co zaniedbujesz.

PAIR Portal to Asian Internet Resources

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

TECHNIKA ONLINE informator o zasobach internetowych dla nauk technicznych: ELEKTROTECHNIKA: projekt

Dr Barbara Grala-Kociak Łódź - UM

ZNACZNIKI META. Znacznik META

Biblioteka Wirtualnej Nauki

Wyszukiwanie w czasie rzeczywistym sposób na zwiększenie widoczności zasobów bibliotek cyfrowych w wyszukiwarkach internetowych Karolina Żernicka

Platformy czasopism naukowych a bibliograficzne bazy danych: obszary przenikania, narzędzia, usługi

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Politechnika Łódzka Biblioteka. Dokumentowanie i rozpowszechniania informacji o publikacjach naukowych pracowników Politechniki Łódzkiej

Cyfrowe portfolio korzystanie z informacji

Natalia Pamuła-Cieślak. Ukryty Internet. jako przedmiot edukacji informacyjnej

Baza danych AGRO 16 lat działalności na rzecz nauki i edukacji

Aneta Drabek. Informacja w świecie cyfrowym, Dąbrowa Górnicza, 7-8 marca 2013 r.

Konferencja Biblioteka Akademicka: Infrastruktura Uczelnia Otoczenie Gliwice, października 2013 r.

Platformy ebooków w polskich bibliotekach akademickich ocena funkcjonalności i dostępności

TYPOLOGIA ZASOBÓW UKRYTEGO INTERNETU

Sieciowe usługi informacyjne dla nauk technicznych BazTech, BazTOL

Informatyka kl. 1. Semestr I

Dziedzinowa Baza Wiedzy w zakresie Nauk Technicznych

The Online Books Page

Podstawowe narzędzia służące do przeszukiwania zasobów Internetu to:

Wyszukiwanie informacji w Internecie

Cyfrowe dokumenty muzyczne w Internecie

Praktyczne aspekty użytkowania zasobów Zintegrowanej Platformy Polskich Czasopism Naukowych MERKURIUSZ

Multiwyszukiwarka EBSCO Discovery Service przewodnik

ZBIERANIE MATERIAŁÓW DO PRACY. Bazy danych

Ukryty Internet jakie korzyści mogą mieć z niego nauki ekonomiczne?

Wyszukiwanie informacji

IBUK LIBRA rewolucja w pracy z e-książką

Oferta zajęd z edukacji czytelniczej i regionalnej Książnicy Karkonoskiej na rok 2011/2012 1

Wyszukiwanie informacji

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

CZEGO OCZEKUJĄ OD BIBLIOTEKI

Oferta SEO. Analiza i optymalizacja

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Program opracowały: Barbara Derewiecka, Halina Szpak Pedagogiczna Biblioteka Wojewódzka w Bielsku-Białej

Kurs komputerowy, Program szkolenia poziom C Klik@j bez barier-profesjonalne kursy komputerowe w Wielkopolsce, nr RPWP

Baza danych BazTech historia, twórcy, zasoby

Dlaczego musimy nauczać o katalogach bibliotecznych, w świecie idei Web 2.0?

ZAPYTANIE OFERTOWE NR 2


Co to jest pozycjonowanie stron internetowych? Dlaczego warto pozycjonować strony internetowe?

CALIFORNIA DIGITAL LIBRARY CYFROWA BIBLIOTEKA KALIFORNIJSKA

ALEPH w Bibliotece Politechniki Wrocławskiej - nowatorskie rozwiązania w zakresie analizy dorobku naukowego

Upowszechnianie dorobku naukowego w repozytoriach i bazach danych działania komplementarne czy konkurencyjne?

WYMAGANIA EDUKACYJNE Z ZAJĘĆ KOMPUTEROWYCH W KLASIE 4 SZKOŁY PODSTAWOWEJ

Integracja wyszukiwania w bibliotekach cyfrowych

Wojewódzki Urząd Pracy w Białymstoku

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Otwarta Platforma Edukacyjna EBIB Kurs Głęboki Internet (bazy danych) i możliwości jego przeszukiwania

Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2014/2015

Biblioteka Wirtualnej Nauki

Współczesne technologie i narzędzia informatyczne a wypożyczanie międzybiblioteczne. Anna Gogiel-Kuźmicka Biblioteka Politechniki Białostockiej

EBSCO Discovery Service - przewodnik

Internet Archive (IA) ogólne informacje. ebooks and Texts prezentacja polskojęzycznych dokumentów

SZKOLENIE BIBLIOTECZNE. Biblioteka Wyższej Szkoły Bankowej w Bydgoszczy

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Bibliografia Lubelszczyzny

Efektywne wyszukiwanie informacji w Internecie

Platforma Content Marketingowa. Buduj oglądalność i pozyskuj wartościowe prospekty biznesowe. Dla szybszego rozwoju Twojego biznesu

i wyszukiwanie informacji w zasobach drukowanych i elektronicznych Politechniki Poznańskiej

UMIEJĘTNE WYSZUKIWANIE INFORMACJI

POZYCJONOWANIE I OPTYMALIZACJA STRON WWW PDF >>>WIĘCEJ<<<

Jak zwiększyć widoczność publikacji naukowych w Internecie z pomocą Google Scholar. Tomasz Lewandowski Platforma Otwartej Nauki, ICM, UW

ZBIORY ELEKTRONICZNE. Dostęp do zbiorów elektronicznych. Opis wybranych źródeł elektronicznych. Biblioteka Cyfrowa CYBRA

24 LATA WSPÓŁPRACY POLSKICH BIBLIOTEK MEDYCZNYCH OSIĄGNIĘCIA I WYZWANIA

Oferta zajęć z edukacji czytelniczej i regionalnej Książnicy Karkonoskiej na rok 2013/2014 1

WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1

Arkadiusz Pulikowski Instytut Bibliotekoznawstwa i Informacji Naukowej Uniwersytet Śląski Katowice Widoczność publikacji naukowych w Internecie

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB

Wojewódzki Urząd Pracy w Białymstoku

Katarzyna Szustka-Ostapowicz Biblioteka Publiczna m. st. Warszawy Biblioteka Główna Województwa Mazowieckiego

OFERTA KATALOGU WYPOCZYNEK W POLSCE edycja wiosna/lato 2012

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Spis treści 3. Spis treści

TECHNOLOGIA INFORMACYJNA

Podręcznik użytkownika

Przedmiotowy system oceniania z zajęć komputerowych - klasa 4

Wyszukiwarka zasobów bibliotecznych PRIMO w Bibliotece Głównej Politechniki Śląskiej w Gliwicach

Jak tworzyć strony internetowe, aby były gotowe na pozycjonowanie?

Twój serwis szkoleń.

KARTA KURSU. Internet jako narzędzie pracy infobrokera. The use of internet in information brokerage. Kod Punktacja ECTS* 2

Phocus.pl to polsko-japońska firma składająca się z grupy kreatywnych profesjonalistów, którzy współpracując razem tworzą porządne rzeczy.

Nazwa biblioteki (w języku oryginalnym) National Library of Scotland Biblioteka Narodowa Szkocji

Marcin Heliński, Cezary Mazurek, Tomasz Parkoła, Marcin Werla

WYKORZYSTANIE FUNDUSZY UNIJNYCH PRZEZ BIBLIOTEKĘ GŁÓWNĄ AKADEMII MORSKIEJ W SZCZECINIE

Mapa witryny - Poradnik od A do Z

Informacja w świecie cyfrowym. Cyfrowy zasób dla nauki Dąbrowa Górnicza, 23 kwietnia 2012 r.

Kryteria ocen zajęcia komputerowe klasa 4

Baza PEDAGOG narzędziem edukacji informacyjnej w bibliotece

KLUCZOWE ZAGADNIENIA. Nakład egz. Guide to specjalny projekt wydawniczy redakcji NetWorld dla zaawansowanych

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Transkrypt:

Anna Zych

Plan prezentacji Wstęp Definicja Głębokiego Internetu Dlaczego niewidzialne dla wyszukiwarek? Co zawiera Głęboki Internet Strategie wyszukiwawcze Narzędzia wyszukiwawcze Przyszłość Niewidzialnego Internetu

Wprowadzenie Wyszukiwarki indeksują niewielką część zasobów Internetu Często zdarza się, że odnajdujemy to, czego potrzebujemy, ale równie często otrzymujemy ogromną ilość informacji zupełnie zbędnych Powodem tego jest, iż: ogromna część zasobów Internetu jest niewidzialna dla wyszukiwarek Niewidzialny Internet

Definicja Głębokiego Internetu Termin użyty po raz pierwszy w 1994 (Dr. Jill Ellsworth) na określenie stron WWW nie indeksowanych przez wyszukiwarki. Inne określenie to Ukryty Internet, a w języku angielskim Invisible Net, Invisible Web lub Deep Web.

Dlaczego wyszukiwarki nie wyszukują tych stron WWW? Pająki wyszukiwarek internetowych podążają po hiperłączach z jednego dokumentu HTML do drugiego indeksując w ten sposób zasoby. Techniczne i nietechniczne kwestie uniemożliwiające wyszukiwarkom indeksowanie Ukrytego Internetu: Pająki/roboty nie indeksują informacji zgromadzonych w bazach danych Koszty powstrzymują wyszukiwarki przed przeszukiwaniem częściej lub głębiej Niektóre zasoby są nietekstowe problem dla wyszukiwarek

Cztery formy niewidzialności Nieprzezroczysty Internet Pliki które mogą być, ale nie są uwzględniane przez indeksy wyszukiwarek z powodu: Głębokości indeksowania Częstotliwości indeksowania Niepodłączone URL

Cztery formy niewidzialności Prywatny Internet Strony WWW, które technicznie mogłyby być zaindeksowane, ale zostały wykluczone przez Webmasterów Chronione hasłem, zawierające Robots.txt, lub noindex znacznik meta

Cztery formy niewidzialności Internet o ograniczonym dostępie Strony dostępne dla zarejestrowanych użytkowników Strony dostępne za opłatą

Cztery formy niewidzialności Prawdziwie niewidoczny Internet Nie mogą być indeksowane z przyczyn technicznych: Pająki nie mogą zaindeksować formatów plików Dynamicznie generowane strony Dane zgromadzone w relacyjnych bazach danych

Zasoby Głębokiego Internetu 99% informacji znajdujących się w Internecie nie indeksowane przez wyszukiwarki ogromna część Ukrytego Internetu to dokumenty recenzowane lub takie, które zostały przygotowane pod kontrolą merytoryczną, literacką, językową i bibliograficzną Głównymi dostarczycielami tych zasobów: twórcy i sprzedawcy baz danych i innych serwisów, biblioteki, wydawcy komercyjni, uczelnie, instytucje i stowarzyszenia naukowe

Porównanie Ukrytego i Powierzchniowego Internetu Powierzchniowy Internet Ukryty Internet Miliony stron WWW Ponad 200,000 baz danych 1 billion dokumentów 550 bilionów dokumentów 19 terabajtów 7,750 terabajtów Rezultaty zawierają reklamy Rezultaty nie zawierają reklam Zawartośd nierecenzowana Zawartośd recenzowana przez ekspertów

Struktura tematyczna Deep Web Nauki humanistyczne 13,5% Wiadomości, media 12,2% Informatyka 6,9% Sztuki piękne 6,6% Biznes 5,9% Zdrowie 5,5% Ludzie 4,9% Edukacja 4,3% Praca 4,1% Nauki ścisłe 4% Styl życia 4% Prawo, polityka 3,9% Informacje ze sfery rządowej 3,9% Rekreacja i sport 3,5% Podróże 3,4% Zakupy 3,2% Technika 3,1% Rolnictwo 2,7%.

Badania BrightPlanet Typy informacji w Głębokim Internecie według BrightPlanet: Tematyczne bazy danych = 54% Strony wewnętrzne = 13% Publikacje = 11% Zakupy / Aukcje= 5% Ogłoszenia tematyczne = 5% Portale = 3% Katalogi bibliotek = 2% Yellow & White Pages = 2% Kalkulatory = 2% Praca = 1% Czaty= 1% Ogółem wyszukiwanie= 1%

Strategie wyszukiwawcze ON THE WEB -powszechnie wykorzystywana, korzystanie z jednej popularnej wyszukiwarki internetowej i prostych zapytań. Dobre do wyszukiwania popularnych serwisów WWW, przeszukiwania słowników i encyklopedii, dokumentów HTML - dają miliony odpowiedzi. VIA THE WEB - korzystanie z różnych narzędzi wyszukiwawczych, dostosowanych do potrzeb i oczekiwań użytkowników. Poszukiwania wielowarstwowe, wieloetapowe.

Narzędzia wyszukiwawcze Wyszukiwarki dedykowane, Narzędzia tematyczne, Serwisy typu Subject Gateways, Serwisy poświęcone zasobom Ukrytego Internetu, Wyszukiwarki i katalogi naukowe, Specjalistyczne wyszukiwarki baz danych Wyszukiwarki głębokiego Internetu

Wyszukiwarki dedykowane Służą do poszukiwań sprecyzowanych typów zasobów (np. plików graficznych, video). Wyszukiwarki grafiki: www.ditto.com www.picsearch.com

Wyszukiwarki dedykowane (Wyszukiwarki wiadomości) infoo.pl news.search.yahoo.com news.google.com

Wyszukiwarki dedykowane (Wyszukiwarki video) www.altavista.com/vide o/default video.google.com video.aol.com/ video.search.yahoo.com

Narzędzia tematyczne Wykorzystywane do poszukiwań sprecyzowanych typów informacji Wyszukiwarki specjalne - np. norm, aktów prawnych www.isip.sejm.gov.pl www.pkn.pl

Narzędzia tematyczne (Katalogi prasowe) www.witryna.czasopism.pl katalog.czasopism.pl

Narzędzia tematyczne (Bazy informacji branżowej) www.pf.pl www.katalogfirm.pl www.katalogbiznesu.pl

Serwisy typu Subject Gateways Serwisy online i strony WWW będące dziedzinowymi katalogami źródeł internetowych. Zasoby są selekcjonowane, oceniane, opisywane i katalogowane przez bibliotekarzy lub ekspertów z danej dziedziny. Najczęściej źródła obejmują dziedziny związane z obszarami zainteresowań akademickich.

Subject Gateways www.dmoz.org www.vascoda.de lii.org www.intute.ac.uk Obszerniejszy wykaz dostępny jest na stronie: ebib.oss.wroc.pl/2004/ 57/wykaz.php

Serwisy poświęcone zasobom Ukrytego Internetu DIRECT SEARCH www.freepint.com/gary/direct.htm Serwis autorstwa Gary ego Price a - bibliotekarza amerykańskiego zajmującego się porządkowaniem informacji w Internecie, wyszukiwaniem jej oraz zjawiskiem Ukrytego Internetu. stale rosnący zbiór odsyłaczy do serwisów i narzędzi wyszukiwawczych Na stronie interfejs wyszukiwawczy oraz ogromny zbiór zasobów elektronicznych.

Serwisy poświęcone zasobom Ukrytego Internetu (Direct Search)

Serwisy poświęcone zasobom Ukrytego Internetu CompletePlanet - www.completeplanet.com Serwis indeksuje ponad 70,000 baz danych oraz specjalistycznych wyszukiwarek internetowych

Serwisy poświęcone zasobom Ukrytego Internetu deepwebresearch.blogspot.com/ zbiór odnośników do artykułów, narzędzi i źródeł informacji o głębokim Internecie.

Wyszukiwarki i katalogi naukowe www.scirus.com scholar.google.com www.academicinfo.net

Wyszukiwarki i katalogi naukowe www.scicentral.com www.scinet.cc/dir bubl.ac.uk

Wyszukiwarki i katalogi naukowe www.sciseek.com citeseer.ist.psu.edu

Copernic Agent Zaawansowane narzędzie wyszukiwawcze dostęp do ponad 1000 źródeł informacji w Internecie. oferuje różne możliwości zarządzania wynikami. Automatyczne śledzenie zmian w sieci.

Specjalistyczne wyszukiwarki baz danych www.geniusfind.com katalog tematyczny wyszukiwarek specjalistycznych i baz danych.

Specjalistyczne wyszukiwarki baz danych www.techxtra.ac.uk Bezpłatny serwis przeszukujący jednocześnie 30 baz danych i innych serwisów z zakresu inżynierii, matematyki i informatyki.

Wyszukiwarki głębokiego Internetu www.incywincy.com Multiwyszukiwarka zasobów głębokich i płytkich. Wyszukuje w Open Directory Project, kilku ogólnych wyszukiwarkach i ponad milionie portali tematycznych.

Wyszukiwarki głębokiego Internetu turbo10.com Multiwyszukiwarka przeszukująca standardowo indeksy: about.com, ask.com, dmoz.org, mirago.co.uk, search.msn.com, webfinder.com, wisenut.com, yahoo.com, yell.com. Możliwość dodania dowolnej wyszukiwarki (w tym deep web) z listy ok. 800, w tym Scirus i innych opcja Edit My Collections.

Przyszłośd Głębokiego Internetu Czy tradycyjne wyszukiwarki będą indeksowały zasoby Głębokiego Internetu? Tak i Nie Tak, widzimy już pewne osiągnięcia w technologiach wyszukiwarek i wyszukiwaniu: Indeksowanie nowych formatów plików (PDF, Word, Excel i pliki multimedialne) Możliwość przeszukiwania baz danych i interakcje z formularzami wyszukiwawczymi Indeksowanie w czasie rzeczywistym Nie, Głęboki Internet będzie istniał zawsze, bo informacje rozrastają się zbyt szybko i wyszukiwarki nie nadążają za tym rozwojem.

Bibliografia: Hofmokl J., Tarkowski A.: Wyszukiwarki i ich rola w kształtowaniu Internetu Pamuła-Cieślak N.: Zjawisko Ukrytego Internetu rola bibliotek w upowszechnianiu jego zasobów Derfert-Wolf L.: Odkrywanie niewidzialnych zasobów sieci BERGMAN M. E.: The Deep Web: Surfacing Hidden Value Gruchawka S. R.: Using the Deep Web: A How-To Guide for IT Professionals