Personalizacja rankingów informacji tekstowych Adam Dudczak Jakub Jankowski
Plan prezentacji Automatyczna ekstrakcja słów kluczowych Wyniki ankiety Model preferencji Prezentacja programu
Słowa kluczowe Dla każdego termu obliczamy wagę TFIDF od czego to zależy?... a może mały test?
Słowa kluczowe badanie jakości Założenia: Dwa teksty, zadaniem ankietowanych jest wybranie 5 słów które najlepiej charakteryzowałyby treść tekstu. Cel: Sprawdzenie jakości automatycznie wydobywanych słów. Zbadanie jak jakość zależy od wielkości zbioru dokumentów. Przygotowanie: Stworzenie zbiorów referencyjnych na bazie możliwie różnorodnych tekstów w języku angielskim źródło dokumentów: angielska wikipedia Utworzony zbiór zawierający 1000, 10000 i 50000 dokumentów
Słowa kluczowe tekst 1 JavaPolis is European Java conference taking place from December 12th to December 16th in Antwerp, Belgium.This new installment will be the occasion fo attend interesting sessions by very interesting guys, like Ben Galbraith, Karsten Lentzsh, Heliott Rusty Harol, Graham Hamilton, Joshua Bloch, Neal Gafter and many others. It's not as big as JavaOne but whether you like Java SE, Java EE, OpenSource projects or desktop applications, you'll find what you want there. All the content from the previous years is available on the web site, so go check it out. Richard Bair, leader of the SwingLabs project, and I will give a talk on Monday entitled Desktop Java in Action. We'll talk about SwingX, data binding, UI special effects and more. I will also present Extreme Swing on Thursday, just before Karsten's JGoodies session, to explain how to create 2.5D/3D effects with Swing and Java2D. As a bonus, I will finally go home for a few days after 7 months in the US. I have to catch up on the food and the beer. Anyway, if you happen to be at JavaPolis next week and if you want to talk about Swing, Java2D and UI design, comme see us anytime!
Słowa kluczowe tekst 2 Most traditional photographs are produced with a two-step chemical process. In the two-step process the film holds a negative image (colours and lights/darks are inverted), which is then transferred onto photographic paper as a positive image. Another widely used film is the positive film used for producing transparencies, usually mounted in cardboard or plastic frames called slides. Slides are widely used by professionals mostly due to their sharpness and accuracy of colour rendition. Most photographs published in magazines are still originally taken on colour transparency film. Originally all photographs were black-and-white if not hand-painted in color. Although methods for developing color photos were available as early as the late 19th century, they did not become widely available until the 1940s or 50s, and even so, until the 1960s most photographs were taken in black and white. Since then, color photography has dominated popular photography, although the black and white format remains popular for amateur photographers and artists. Black and white film is considerably easier to develop than colour.
Słowa kluczowe Wyniki ankiety W badaniu wzięło udział 13 osób :) conference 11 Swing 10 JavaPolis 9 Java 8 session 4 UI 2 JavaOne 2 effects 2 Antwerp 2 Java2D 2 opensource 2 project 1 presentation 1 talk 1 Belgium 1 December 1 but 1 you 1 guys 1 design 1 beer 1 photographs 12 color 8 film 8 black-and-white 6 slide(s) 4 process 4 photos 3 image(s) 3 transparency 2 two-step 2 developing 2 negative 1 traditional 1 most 1 format 1 remain 1 taken 1 to 1 hand-painted 1 photography 1
Słowa kluczowe Co zwrócił program? Dla indeksu zawierającego 1000 dokumentów java 0.117 swing 0.100 desktop 0.078 talk 0.062 session 0.056 photograph 0.125 colour 0.112 transpar 0.079 slide 0.075 white 0.074 Dla indeksu zawierającego 10000 dokumentów java 0.119 karsten 0.110 swing 0.091 desktop 0.068 talk 0.057 photograph 0.132 colour 0.108 slide 0.074 white 0.072 film 0.071
Słowa kluczowe Co zwrócił program? Dla indeksu zawierającego 50000 dokumentów java 0.119 karsten 0.117 swing 0.095 harol 0.076 javaon 0.071 photograph 0.138 colour 0.116 the1940 0.090 slide 0.077 black 0.074 To co znajduje się w zbiorze referencyjnym ma znaczenie! Jak to wygląda w praktyce? Zaraz zobaczymy..
Moduł preferencji co jest zapamiętywane Instancje blogi Identyfikowane przez URL Atrybuty słowa kluczowe 1 występuje, 0 nie występuje Atrybut decyzyjny -1, 0, 1
Moduł preferencji format Plik w formacie ARFF Weka Potencjalnie szerokie możliwości analizy Problemy z zastosowaniem Weki w programie Sequential Minimal Optimization http://research.microsoft.com/~jplatt/smo.html
Moduł preferencji rozszerzanie modelu Uaktualnianie modelu po ocenieniu bloga przez użytkownika Nowy blog nowy wiersz Wcześniej zapamiętane nowa ocena Nowe słowa kluczowe Słowa wg których szukano Wyekstrahowane z treści Nowy atrybuty dla wcześniej ocenianych blogów sprawdzenie indeksu
Prezentacja programu Java GUI w SWT zintegrowana przeglądarka Zakładki Find me something to read Umiarkowana prędkość działania
Dziękujemy za uwagę Pytania?