, semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013
Spis treści 1 językowa 2, kryteria 3
Streszczenie artykułu Treść artykułu : Affective Lexicon Creation with Application to Interaction and Multimedia Data można streścić następująco: świat potrzebuje narzędzi do afektywnej analizy tekstów;
Streszczenie artykułu Treść artykułu : Affective Lexicon Creation with Application to Interaction and Multimedia Data można streścić następująco: świat potrzebuje narzędzi do afektywnej analizy tekstów; istnieją tezaurusy, lekstykony, korpusy itp. używane w tego typu analizach;
Streszczenie artykułu Treść artykułu : Affective Lexicon Creation with Application to Interaction and Multimedia Data można streścić następująco: świat potrzebuje narzędzi do afektywnej analizy tekstów; istnieją tezaurusy, lekstykony, korpusy itp. używane w tego typu analizach; są one skończone;
Streszczenie artykułu Treść artykułu : Affective Lexicon Creation with Application to Interaction and Multimedia Data można streścić następująco: świat potrzebuje narzędzi do afektywnej analizy tekstów; istnieją tezaurusy, lekstykony, korpusy itp. używane w tego typu analizach; są one skończone; potrzeba możliwości rozszerzenia istniejących sieci słów o nowe pojęcia, synsety.
Teza artykułu Semantic similarity can be translated to affective similarity.
Teza artykułu Semantic similarity can be translated to affective similarity. Można rozszerzyć istniejące zbiory słów o nowe pojęcia poprzez określanie ich podobieństwa do już emocjonalnie określonych fraz.
Teza artykułu Semantic similarity can be translated to affective similarity. Można rozszerzyć istniejące zbiory słów o nowe pojęcia poprzez określanie ich podobieństwa do już emocjonalnie określonych fraz. Nie jest to zwykłe wyszukiwanie synonimów. Pomysł autorów artykułu idzie o krok dalej.
językowa W dostępnej literaturze podmiotu wyróżnia się trzy podstawowe pojęcia. semantic likeness
językowa W dostępnej literaturze podmiotu wyróżnia się trzy podstawowe pojęcia. semantic likeness semantic relatedness
językowa W dostępnej literaturze podmiotu wyróżnia się trzy podstawowe pojęcia. semantic likeness semantic relatedness semantic distance
językowa W dostępnej literaturze podmiotu wyróżnia się trzy podstawowe pojęcia. semantic likeness semantic relatedness semantic distance Omawiany artykuł rozważa kwestię obliczania powiązania znaczeniowego w oparciu o odległość znaczeniową.
Opis metody Spośród zbioru znanych słów o znanym zabarwieniu emocjonalnym np. ANEW, obiera się grupę słów wzorcowych tzw. seed words.
Opis metody Spośród zbioru znanych słów o znanym zabarwieniu emocjonalnym np. ANEW, obiera się grupę słów wzorcowych tzw. seed words. Natrafiając na nieznane sformułowanie, tzw. unseen word, podczas analizy tekstu, sprawdza się jego powiązanie semantyczne ze zbiorem seed words i dokonuje wyliczenia jego parametrów afektywnych np. PAD.
Opis metody Wzór na wartościowość ˆv słowa w j jest dany: N ˆv(w j ) = a 0 + a i v(w i )d(w i, w j ), (1) n=1 gdzie: v(w i ) wartościowość słowa w i, d(w i, w j ) semantyczna odległość pomiędzy seed word w i a unseen word w j, a i waga i-tego unseen word, a 0 stała:)
Opis metody Wzór na wartościowość ˆv słowa w j jest dany: N ˆv(w j ) = a 0 + a i v(w i )d(w i, w j ). n=1 Nieznaną wartością w powyższym równaniu jest d(w i, w j ).
Opis metody Wzór na wartościowość ˆv słowa w j jest dany: N ˆv(w j ) = a 0 + a i v(w i )d(w i, w j ). n=1 Nieznaną wartością w powyższym równaniu jest d(w i, w j ). Dalsze rozważania będą dotyczyć obliczania dystansu semantycznego. Niemniej, wyniki eksperymentu są ciekawe, nietrywialne i mogą być przydatne w przyszłości.
, kryteria W dostępnej literaturze opisane są zarówno teoretyczne, jak i praktyczne przykłady wyliczania odległości semantycznej. Można je sklasyfikować w następujący sposób: offline,
, kryteria W dostępnej literaturze opisane są zarówno teoretyczne, jak i praktyczne przykłady wyliczania odległości semantycznej. Można je sklasyfikować w następujący sposób: offline, online:
, kryteria W dostępnej literaturze opisane są zarówno teoretyczne, jak i praktyczne przykłady wyliczania odległości semantycznej. Można je sklasyfikować w następujący sposób: offline, online: bazujące na tekstach,
, kryteria W dostępnej literaturze opisane są zarówno teoretyczne, jak i praktyczne przykłady wyliczania odległości semantycznej. Można je sklasyfikować w następujący sposób: offline, online: bazujące na tekstach, bazujące na liczności stron w sieci.
emocjonalna W dostępnej literaturze opisane są zarówno teoretyczne, jak i praktyczne przykłady wyliczania odległości semantycznej. Można je sklasyfikować w następujący sposób: nadzorowane (supervised),
emocjonalna W dostępnej literaturze opisane są zarówno teoretyczne, jak i praktyczne przykłady wyliczania odległości semantycznej. Można je sklasyfikować w następujący sposób: nadzorowane (supervised), nienadzorowane (unsupervised).
emocjonalna W dostępnej literaturze opisane są zarówno teoretyczne, jak i praktyczne przykłady wyliczania odległości semantycznej. Można je sklasyfikować w następujący sposób: nadzorowane (supervised), nienadzorowane (unsupervised). Eksperyment porównuje miary odległości semantycznej korzystając z metod bazujących na liczności stron w sieci. Uczenie systemu nowych pojęć odbywa się w sposób nienadzorowany.
, kryteria Badania wykorzystują cztery miary odległości znaczeniowej: współczynnik podobieństwa Dice a,
, kryteria Badania wykorzystują cztery miary odległości znaczeniowej: współczynnik podobieństwa Dice a, współczynnik podobieństwa Jaccarda,
, kryteria Badania wykorzystują cztery miary odległości znaczeniowej: współczynnik podobieństwa Dice a, współczynnik podobieństwa Jaccarda, pointwise mutual information PMI,
, kryteria Badania wykorzystują cztery miary odległości znaczeniowej: współczynnik podobieństwa Dice a, współczynnik podobieństwa Jaccarda, pointwise mutual information PMI, Google-based Semantic Relatedness.
, kryteria Badania wykorzystują cztery miary odległości znaczeniowej: współczynnik podobieństwa Dice a, współczynnik podobieństwa Jaccarda, pointwise mutual information PMI, Google-based Semantic Relatedness. Do badań została użyta wyszukiwarka (search engine) Yahoo!
Wielkości użyte w definicji miar dystansu {D} zbiór wszystkich stron zaindeksowanych przez wyszukiwarkę, D liczba stron w zbiorze {D}, w słowo lub pojęcie, {D w} podzbiór {D}, strony zaindeksowane przez w, {D w 1, w 2 } podzbiór {D}, strony zaindeksowane przez w 1 i w 2, D w frakcja dokumentów ze zbioru {D} zaindeksowana przez w, D w 1, w 2 frakcja dokumentów ze zbioru {D} zaindeksowana przezw 1 i w 2.
Jaccard coefficient, Dice coefficient Współczynnik podobieństwa Jaccarda dany jest wzorem: Jaccard(w 1, w 2 ) = Współczynnik podobieństwa Dice a: D w 1, w 2 D w 1 + D w 2 D w 1, w 2 Dice(w 1, w 2 ) = 2 D w 1, w 2 D w 1 + D w 2 (2) (3)
Pointwise Mutual Information Współczynnik PMI dany jest wzorem: PMI (w 1, w 2 ) = D w 1,w 2 D D w 1 D w 2 D D (4)
Google-based Semantic Relatedness Współczynnik bazujący na Google oparty jest o Znormalizowaną Google (Normalized Google Distance) daną wzorem: NGO(w 1, w 2 ) = max{a} log D w 1, w 2, (5) log D min{a} gdzie A = {log D w 1, log D w 2 }. Miara wg Google dana jest zatem wzorem: Google(w 1, w 2 ) = e 2NGO(w 1,w 2 ). (6) Wyniki innych prac pokazują, że miara NGO jest bardziej wiarygodna dla wyszukiwarki Yahoo! Sorry, Google.
Google-based Semantic Relatedness Współczynnik bazujący na Google oparty jest o Znormalizowaną Google (Normalized Google Distance) daną wzorem: NGO(w 1, w 2 ) = max{a} log D w 1, w 2, (7) log D min{a} gdzie A = {log D w 1, log D w 2 }. Miara wg Google dana jest zatem wzorem: Google(w 1, w 2 ) = e 2NGO(w 1,w 2 ). (8) Wyniki innych prac pokazują, że miara NGO jest bardziej wiarygodna dla wyszukiwarki Yahoo! Sorry, Google.
oparte na tekście Innym podejściem do zagadnienia obliczania odległości semantycznej charakteryzują się metody bazujące na analizie tekstów. W tym wypadku, dla analizowanych fraz, ściągane zostają artykuły będące wynikiem wyszukiwania danego sformułowania w wyszukiwarce. Następnie poddaje się analizie tak otrzymany materiał.
oparte na leksykonach Metoda ta analizuje drzewo powiązań w sieciach semantycznych np. w WordNecie. Zaletą takiego rozwiązania jest uniezależnienie się od dostępu do Internetu.
Wątpliwości, spostrzeżenia, nadzieje 1 Skoro analizowane teksty pochodzą z Sieci, zakłada się dostęp do Intenetu, a zatem można stosować metody bazujące na odpytywaniu wyszukiwarek.
Wątpliwości, spostrzeżenia, nadzieje 1 Skoro analizowane teksty pochodzą z Sieci, zakłada się dostęp do Intenetu, a zatem można stosować metody bazujące na odpytywaniu wyszukiwarek. 2 Analiza liczności zaindekswanych stron wydaje się być lepszym pomysłem, niż ściąganie i analiza artykułów lokalnie.
Wątpliwości, spostrzeżenia, nadzieje 1 Skoro analizowane teksty pochodzą z Sieci, zakłada się dostęp do Intenetu, a zatem można stosować metody bazujące na odpytywaniu wyszukiwarek. 2 Analiza liczności zaindekswanych stron wydaje się być lepszym pomysłem, niż ściąganie i analiza artykułów lokalnie. 3 Skoro można wyliczać w ten sposób parametr valence, to czemu nie robić tego dla arousal i, być może, dominance?
Wątpliwości, spostrzeżenia, nadzieje 1 Skoro analizowane teksty pochodzą z Sieci, zakłada się dostęp do Intenetu, a zatem można stosować metody bazujące na odpytywaniu wyszukiwarek. 2 Analiza liczności zaindekswanych stron wydaje się być lepszym pomysłem, niż ściąganie i analiza artykułów lokalnie. 3 Skoro można wyliczać w ten sposób parametr valence, to czemu nie robić tego dla arousal i, być może, dominance? 4 Problem aktualizacji zbioru seed words. Kwestia korygowania parametrów z palca.
Wątpliwości, spostrzeżenia, nadzieje 1 Skoro analizowane teksty pochodzą z Sieci, zakłada się dostęp do Intenetu, a zatem można stosować metody bazujące na odpytywaniu wyszukiwarek. 2 Analiza liczności zaindekswanych stron wydaje się być lepszym pomysłem, niż ściąganie i analiza artykułów lokalnie. 3 Skoro można wyliczać w ten sposób parametr valence, to czemu nie robić tego dla arousal i, być może, dominance? 4 Problem aktualizacji zbioru seed words. Kwestia korygowania parametrów z palca. 5...
Zalety i wady Zalety analiz (uczenia) online: Wady analiz online:
Zalety i wady Zalety analiz (uczenia) online: znacząco większa baza wiedzy, Wady analiz online:
Zalety i wady Zalety analiz (uczenia) online: znacząco większa baza wiedzy, dobrze opisana teoria, Wady analiz online:
Zalety i wady Zalety analiz (uczenia) online: znacząco większa baza wiedzy, dobrze opisana teoria, dostępność stron poprzez UBrowser. Wady analiz online:
Zalety i wady Zalety analiz (uczenia) online: znacząco większa baza wiedzy, dobrze opisana teoria, dostępność stron poprzez UBrowser. Wady analiz online: wymagane połączenie z Internetem (trochę naciągana wada),
Zalety i wady Zalety analiz (uczenia) online: znacząco większa baza wiedzy, dobrze opisana teoria, dostępność stron poprzez UBrowser. Wady analiz online: wymagane połączenie z Internetem (trochę naciągana wada), opisane przypadki dotyczą tylko wartościowości (przyjemności) w przestrzeni PAD,
Zalety i wady Zalety analiz (uczenia) online: znacząco większa baza wiedzy, dobrze opisana teoria, dostępność stron poprzez UBrowser. Wady analiz online: wymagane połączenie z Internetem (trochę naciągana wada), opisane przypadki dotyczą tylko wartościowości (przyjemności) w przestrzeni PAD,...
To już koniec:(