16.2.11

Oops, I did it again: 1.8.1

Przeprowadziłem kilka testów wewnętrznej spójności danych i okazało się, że udało się automatycznie poprawić oznaczenie około 12 tysięcy rzeczowników rodzaju męskiego osobowego (m1). Panie i Panowie, oto Morfologik 1.8.1.

13.2.11

Morfologik 1.8

Dzisiaj w ramach porządków wydałem kolejną wersję Morfologika (1.8). Zmiany: usunąłem zbędny znacznik ign, a w zamian wprowadziłem interj (oznaczający wykrzyknienia), brev (skróty - z kropkami lub bez, co odpowiada atrybutom pun i npun, za tagsetem NKJP), xxx - wyrazy obcojęzyczne. Usunąłem też dublujące się wpisy przymiotników, które były oznaczone raz po prostu jako przymiotniki w stopniu równym, a raz jako takie same przymiotniki, ale niezanegowane. Poprawiłem, dzięki Łukaszowi Szałkiewiczowi, oznaczenie wołacza przymiotników rodzaju męskiego w liczbie pojedynczej (przez omyłkę nie było rodzaju m3). Obecnie są już wszystkie (opisane skrótowo jako po prostu m, zamiast m1.m2.m3). Prócz tego usunąłem dwa wyrazy (ka i in), które de facto są końcówkami odmienianych skrótowców i nie występują samodzielnie. Poprawiłem też oznaczenie biernika rzeczowników rodzaju m1.

11.2.11

Smyrna - prosty konkordancer

Daniel Janus stworzył prosty konkordancer - Smyrnę - do obsługi niewielkich korpusów. Smyrna korzysta z Morfologika (i biblioteki morfologik-stemming).

morfologik-stemming w Mavenie

Wiele razy byliśmy o to proszeni – i stało się. Od wersji 1.5.0 biblioteka morfologik-stemming będzie obsługiwana bezpośrednio w Mavenie i jest w jego repozytorium.

7.2.11

API biblioteki morfologik-stemming

Z powodu ataku włamywaczy na sourceforge.net nie mogłem wcześniej uzupełnić informacji o nowym API biblioteki morfologik-stemming. Dostępne są obecnie informacje dla wersji 1.5.0, 1.4.1 i 1.4.0. Sprawa jest o tyle istotna, że między wersjami 1.5.0 a 1.4.1 są pewne różnice.