11.9.07

Morfologik 1.3

Dziś opublikowałem najnowszą wersję słownika morfosyntaktycznego. Zmiany:
  • więcej wyrazów (3560881);
  • wprowadzenie, dzięki zmianom w słowniku alternatywnym, oznaczenia formy imiesłowu przymiotnikowego czynnego (pact);
  • wprowadzenie konsekwentnego oznaczenia aspektu dokonanego (perf) i niedokonanego (imperf);
  • poprawki drobnych błędów;
  • rozpoznawanie wielu form nieregularnych dzięki rozbudowaniu heurystyki;
  • pliki konieczne do obsługi w bibliotece morfologik-stemming;
  • aktualizacja zgodnie z najnowszym słownikiem alternatywnym.
Pozostało kilka drobnych usterek związanych z obsługą aspektu - m.in. kilkanaście nieregularnych czasowników, z małą ilością flag w słowniku alternatywnych, jest klasyfikowanych błędnie. Można będzie to poprawiać automatycznie, wystarczy skonstruować jeden prosty skrypt (i zrobić wyjątek m.in. dla czasownika cisnąć – ten bowiem ma zarówno formę dokonaną, jak i niedokonaną). Zmiany obecne są jednak na tyle duże, że już mi wystarczy poprawiania - skrypty zostały przebudowane, wprowadziłem nieco automatyki do testowania oznaczeń itd.
W słowniku form nieregularnych zamieściłem poprawki sugerowane przez Artura Trzewika, Makefile poprawiłem wg sugestii Mariusza Bułkowskiego. Dziękuję!

Brak komentarzy: