1.10.12

morfologik-stemming 1.5.4

Wydaliśmy dziś nową wersję biblioteki morfologik-stemming 1.5.4. Zmiany są niewielkie i dotyczą jedynie korektora pisowni opartego na automatach skończonych. Korektor w tej wersji obsługuje automaty z kodowaniem UTF-8, dzięki czemu mógł zastąpić bardzo powolnego hunspella (hunspell przetwarza na moim komputerze około 56 zdań na sekundę, a LanguageTool z korektorem morfologik-speller około 1400). Biblioteka morfologik-speller nie jest jeszcze zupełnie gotowa, bo nie przywraca znaków diakrytycznych i nie ma możliwości budowania automatów z morfologią dwustopniową (którą zawiera hunspell), ale te funkcje są w planach.

1 komentarz:

Michal Draminski pisze...

Bardzo proszę o publikację tej wersji na: http://mvnrepository.com/artifact/org.carrot2/morfologik-stemming