Sieci społeczne w blogosferze Jan M. Zając (Wydział Psychologii UW) Kamil Rakocy (Instytut Studiów Społecznych UW) Rewolucja w komunikacji, Warszawa, 12.09.2007
Zasada Pareto 80% - 20% 80% dóbr jest własnością 20% mieszkańców Spędzamy 80% czasu z 20% naszych znajomych Przez 80% czasu nosimy 20% ulubionych ubrań 80% przychodów pochodzi od 20% Klientów W blogosferze jest podobnie, ale bardziej
Zasada Pareto w blogosferze Tylko 10% wszystkich blogów ma przynajmniej 1 link przychodzący z innych blogów z bloxa i tylko 1% wszystkich blogów ma przynajmniej 10 linków przychodzących z innych blogów z bloxa Ale blogi z minimum 10 linkami przychodzącymi generują aŝ 56% ruchu Wpływ na wyniki badań sondaŝowych
Blogi okiem nauk społecznych Badamy blogi i blogosferę z perspektywy psychologii spolecznej i socjologii Przedstawimy wyniki badań prowadzonych we współpracy z blox.pl Główną metodą jest analiza sieciowa, wykorzystujemy takŝe dane z badania ankietowego Blogi jako specyficzne narzędzi komunikacji, słuŝą między innymi nawiązywaniu relacji interpersonalnych Medium rozproszone, wielu nadawców Efekty współoddziaływania wielu blogów: epidemie informacji i plotek, kontrola wiarygodności, weryfikacja faktów
Zdecydowana większość blogów w ogóle nie ma blogrolla Te jednak, które są powiązane linkami z innymi blogami tworzą wielkie, rozległe sieci Pozycja blogów w sieci linków jest bardzo zróŝnicowana Liczba linków przychodzących jest dobrą miarą prestiŝu A takŝe przekłada się na liczbę czytelników bezpośrednio i pośrednio przez pozycję w wyszukiwarce Odzwajemnianie linków jest bardzo częste
Analiza sieciowa
Analiza sieciowa Węzły: ludzie, blogi Relacje: przyjaźń, linkowanie Sieć skierowana
Blogroll Linki do innych blogów na stronie głównej Blogi jako sieć połączona linkami z blogrolla: Polecanie Przyjaźń, znajomość Odwzajemnianie linków rodzaj wymiany społecznej TakŜe określanie toŝsamości blogera
90% 80% Blogerzy Aktywni > 100 70% 60% 50% 40% 30% 20% 10% 0% blogi bliskich osób blogi znajomych poznanych w internecie blogi znajomych blogi osób poznanych poza znanych, z internetem którymi nigdy nie kontaktowałem się osobiście blogi, które czytam regularnie blogi związane z tematem mojego bloga blogi osób, które uwaŝam za autorytety
Centrum sieci linków w między blogami
Centrum sieci linków w między blogami
Blogroll Nie wszystkie blogi mają blogroll: Badanie niemieckie: 50% autorów (Schmidt, 2006); Badanie amerykańskie: 41% (PEW Internet Institute, 2006) Potwierdzają to takŝe wyniki sondaŝu: 60% autorów ma blogroll Sporo przypadków stary blog bez blogrolla Tylko wśród blogów załoŝonych w 2007 r. jest ponad 50% bez blogrolla Pełny obraz daje dopiero analiza wszystkich blogów - analiza sieci blogrolla na koniec maja 2007
Sieci blogrolla Maj 2007 Łączna liczba blogów Blogi z blogrollem Odsetek blogów z blogrollem Liczba relacji w sieci Gęstość sieci 125 000 15 039 12% 64 027 0,03% Zdecydowana większość blogów jest poza siecią linków w blogrollu Wiele z nich to blogi nieaktywne W dalszych analizach: jedynie blogi z przynajmniej 1 linkiem przychodzącym lub wychodzącym Czyli takie do których linkował przynajmniej 1 blog z blox.pl lub same miały w swoim blogrollu przynajmniej 1 blog z blox.pl Sieć luźna, rozległa, o małej gęstości
Wielkie komponenty Wszystkie węzły w obrębie komponentu są połączone (takŝe niebezpośrednio) Słaby komponent kierunek relacji nie jest istotny, nie zwracamy uwagi na strzałki 2007: 1 wielki komponent: 12 tys. blogów, 78,5% sieci Kilkanaście małych komponentów (10-25 blogów) 1050 małych komponentów (2-6 blogów)
Wielkie komponenty (2) Wszystkie węzły w obrębie komponentu są połączone (takŝe niebezpośrednio) Silny komponent kierunek relacji jest istotny, zwracamy uwagę na strzałki 2007: 1 wielki komponent: 4335 blogów, 29% sieci 1 komponent 26 blogów, 1 komponent 31 blogów 9370 małych komponentów (2-15 blogów)
Liczba linków w poszczególnych blogów 300 250 Linki wychodzące ce 200 150 100 50 0 0 100 200 300 400 500 600 700 800 Linki przychodzące ce R-Pearsona = 0,53
Linki przychodzące ce i wychodzące ce
Liczba linków w przychodzących cych 125 tys blogów 11 412 ma przynajmniej 1 link przychodzący z blox.pl Spośród tych 11 412: 46% ma dokładnie 1 link 21% ma 5 lub więcej linków 11,5% ma 10 lub więcej linków 5% ma 21 lub więcej linków 1% ma 73 lub więcej linków 1 2 3 4 5 6 7 8 9 10 675 598 301 279 279 240 198 192 190 182
Nieliczne gwiazdy są w sieci blogów bardzo widoczne Zdecydowana większość blogów jest słabo widoczna
Sieć linków w przychodzących cych i wychodzących cych Średnia SD Centralizacja IN 4,25 13,9 4,6% OUT 4,25 9,4 1,6% Sieć linków przychodzących jest bardziej scentralizowana i bardziej zróŝnicowana oddaje prestiŝ 2 rodzaje węzłów z wieloma relacjami przychodzącymi: wiele IN & wiele OUT zaangaŝowane w wymianę linków wiele IN, mało OUT gwiazdy? Węzły z wieloma relacjami wychodzącymi zazwyczaj wiele IN i OUT
Z sieci wiemy, Ŝe aŝ 42% relacji jest odwzajemnione
Popularność blogów nierównomierny rozkad 7461 blogów mających przynajmniej 1 unique usera w ciągu tygodnia (maj 2006) Unique users N = 7461 Częstość Wizyty N = 7461 Częstość USERS VISITS Średnia Odchylenie standardowe 94 946 137 1335
Pozycja w sieci a popularność korelacje All In Out In - Proxim Betweenn degre degr degr Out ity ess e ee ee prestig centrality e Wizyty 0,116 0,163 0,018 0,177 0,061 0,064 Unique 0,09 0,127 0,013 0,139 0,05 0,05 Users
Skąd d wejścia na blogi w blox.pl?
Krzysztof Kononowicz wzrost liczby wystąpie pień stron 800000 700000 600000 500000 400000 300000 200000 100000 0 188 168 148 128 108 88 68 48 28 8 06-11-01 06-11-02 06-11-03 06-11-04 06-11-05 06-11-06 06-11-07 06-11-08 06-11-09 06-11-10 06-11-11 06-11-12 06-11-13 06-11-14 06-11-15 06-11-16 06-11-17 06-11-18 06-11-19 06-11-20 Internet blox.pl
0 linków 90% stron, 13% ruchu Co najmniej 10 linków 1% stron, 56% ruchu Tylko niewielka część blogów ma kilka linków przychodzących, ale to one skupiają większość ruchu
Zdecydowana większość blogów w ogóle nie ma blogrolla Te jednak które są powiązane linkami z innymi blogami tworzą wielkie, rozległe sieci Pozycja blogów w sieci linków jest bardzo zróŝnicowana Liczba linków przychodzących jest dobrą miarą prestiŝu A takŝe przekłada się na liczbę czytelników bezpośrednio i pośrednio przez pozycję w wyszukiwarce Odzwajemnianie linków jest bardzo częste
Dziękujemy za uwagę! jan.zajac (at) psych.uw.edu.pl kamil.rakocy (at) uw.edu.pl Serdecznie dziękujemy Agorze SA i Arkadiuszowi Kustrze za pomoc w przeprowadzeniu badań