Przejdź do głównej zawartości

Posty

Wyświetlam posty z etykietą słownik morfologiczny

Morfologik 1.8

Dzisiaj w ramach porządków wydałem kolejną wersję Morfologika (1.8) . Zmiany: usunąłem zbędny znacznik ign , a w zamian wprowadziłem interj (oznaczający wykrzyknienia), brev (skróty - z kropkami lub bez, co odpowiada atrybutom pun i npun , za tagsetem NKJP), xxx - wyrazy obcojęzyczne. Usunąłem też dublujące się wpisy przymiotników, które były oznaczone raz po prostu jako przymiotniki w stopniu równym, a raz jako takie same przymiotniki, ale niezanegowane. Poprawiłem, dzięki Łukaszowi Szałkiewiczowi, oznaczenie wołacza przymiotników rodzaju męskiego w liczbie pojedynczej (przez omyłkę nie było rodzaju m3 ). Obecnie są już wszystkie (opisane skrótowo jako po prostu m, zamiast m1.m2.m3 ). Prócz tego usunąłem dwa wyrazy ( ka i in ), które de facto są końcówkami odmienianych skrótowców i nie występują samodzielnie. Poprawiłem też oznaczenie biernika rzeczowników rodzaju m1 .

Morfologik 1.5 na Nowy Rok

Ponieważ przygotowuję nową wersję LanguageTool (0.9.6) – z wieloma nowymi ciekawymi możliwościami – postanowiłem poprawić trochę słownik, bo jest mi potrzebny do poprawnego działania funkcji unifikacji (uzgadniania) atrybutów. Poprawiłem głównie rzeczowniki – przede wszystkim rodzaju męskiego. Większość z nich, poza rzadkimi nazwami własnymi, jest już prawidłowo przyporządkowana do kategorii rodzaju m1 , m2 lub m3 (męskoosobowe, męskożywotne i męskonieżywotne – ujmując ten podział tradycyjnymi kategoriami). Poprawiłem też trochę systematycznych błędów, dodałem trochę form nieregularnych (np. odmianę imienia Pablo). A o wersji 0.9.6 i unifikacji jeszcze napiszę :)

Morfologik 1.3

Dziś opublikowałem najnowszą wersję słownika morfosyntaktycznego. Zmiany: więcej wyrazów (3560881); wprowadzenie, dzięki zmianom w słowniku alternatywnym, oznaczenia formy imiesłowu przymiotnikowego czynnego ( pact ); wprowadzenie konsekwentnego oznaczenia aspektu dokonanego ( perf ) i niedokonanego ( imperf ); poprawki drobnych błędów; rozpoznawanie wielu form nieregularnych dzięki rozbudowaniu heurystyki; pliki konieczne do obsługi w bibliotece morfologik-stemming ; aktualizacja zgodnie z najnowszym słownikiem alternatywnym. Pozostało kilka drobnych usterek związanych z obsługą aspektu - m.in. kilkanaście nieregularnych czasowników, z małą ilością flag w słowniku alternatywnych, jest klasyfikowanych błędnie. Można będzie to poprawiać automatycznie, wystarczy skonstruować jeden prosty skrypt (i zrobić wyjątek m.in. dla czasownika cisnąć – ten bowiem ma zarówno formę dokonaną, jak i niedokonaną). Zmiany obecne są jednak na tyle duże, że już mi wystarczy poprawiania - skrypty zostały p...

Morfologik 1.1

Opublikowałem kolejną wersję słownika morfologicznego. Nowości: ujednolicenie oznaczenia form finitywnych (znacznik „fin” zagubił się wcześniej przy wielu czasownikach); ujednolicenie oznaczenia potencjalnej negacji (zmiana z „pneg” na stosowany w tagsecie IPI znacznik „aff”), dodanie znacznika „pos” na oznaczenie stopnia równego przymiotników, poprawki dotyczące dopełniacza l. mn. wielu rzeczowników rodzaju męskiego (męskoosobowych i niemęskoosobowych), dodanie nietypowego znacznika „refl” dla czasowników zwrotnych, aktualizacja zgodnie z nową wersją słownika na stronie kurnik.pl/slownik. To jednak nie koniec nowości. Wśród słowników binarnych jest słownik syntezy gramatycznej, który potrafi generować wyrazy odmienione dla zadanej formy podstawowej i znacznika formy. W wypadku użycia w programie fsa_morph należy podać następujący ciąg na wejściu: wyraz|znacznik (np. „niemiecki|adjp”). Na wyjściu pojawi się forma przymiotnika niemiecki będąca przymiotnikiem poprzyimkowym, tj. „niemieck...

Morfologik 0.9

Dziś udostępniłem kolejną wersję pakietu Morfologik. Nowości: poprawiona anotacja narzędnika (dzięki ZeeWolfowi); wprowadzono znacznik adjp dla przymiotników poprzyimkowych takich jak „prostu” czy „niemiecku”; wprowadzono trochę znaczników form deprecjatywnych ( depr ); więcej wyrazów (3523271 form). 3,5 miliona form – czyli jest to największy słownik morfologiczny polszczyzny. Zapraszam do pobierania.