6.10.06

Morfologik 0.8

Praca wre... Właśnie udostępniłem nowe pliki projektu (dostępne tutaj). Zmiany w stosunku do poprzedniej wersji:

  • poprawienie błędów w oznaczeniach stopnia wyższego (m.in. błędnie klasyfikowano wyrazy dzikszy i większy);
  • usunięcie kilku błędnych form wyrazów pisanych wielką literą;
  • aktualizacja zgodnie z dzisiejszym stanem słownika alternatywnego (czyli dodanie większej liczby nazw własnych);
  • poprawki skryptów (dostępnych w repozytorium), które powodują przyspieszenie pracy.
Obecnie słownik zawiera około 250 tysięcy wyrazów w formach podstawowych, które dają w efekcie około 3,4 miliona form (dokładnie: 3371979).

Brak komentarzy: